有关机器学习算法的实施问题。关于机器学习的一般问题应该发布到他们的特定社区。
为什么我在huggingface MT5模型中执行批量编码时得到不同的嵌入?
我正在尝试使用 HuggingFace 的 mt5 基础模型对一些文本进行编码。我正在使用如下所示的模型 从变压器导入 MT5EncoderModel、AutoTokenizer 模型 = MT5EncoderModel.from_pretrai...
我是 Julia 的新手,正在尝试拟合一个简单的分类树 包导入和环境激活: 使用包 Pkg.activate(".") 使用 CSV 使用数据框 使用随机 使用下载 ...
调试 RandomForestRegressor() 在时间序列数据上产生主要恒定的预测结果
假设我的数据集包含一个时间戳(没有日期时间格式的非标准时间戳列)作为单个特征,并计为标签/目标以在以下 pandas 数据帧中进行预测...
predict_proba() 给出 0 和 1 的概率,但中间值很少
我正在研究乳腺癌检测分类问题。我已经从 Kaggle 下载了数据集:(https://www.kaggle.com/datasets/yasserh/breast-cancer-dataset) 我想预测: a) 什...
Sagemaker Studio 在前 6 个月里为我完美工作。然后我就开始观察这个问题。错误消息的屏幕截图 屏幕永远保持在这个阶段。这就是我所拥有的...
我因 n_estimators 的最低值而获得最高分。据我了解,更多的树应该总是会提高性能。谁能解释一下这里发生了什么? 输入: # 是...
尝试从 Mistral7B 微调的 LLM 生成摘要时出现意外的关键字参数“use_dora”
我使用 Hugginggace 的 samsum 训练集在 16 位配置中使用 LoRA 微调了 Mistral7B LLM。这个想法是为微调的法学硕士提供一个对话,它应该生成一个摘要。
我正在尝试创建一个 PyCaret 模型 # 加载数据集 从 pycaret.datasets 导入 get_data 保险 = get_data('保险') # 初始化环境 从 pycaret.regression 导入 * r1 = 设置(保险...
我有以下 get_angles 函数,可以从 input_features 创建角度。该函数返回的特征用于训练变分量子电路。 def get_angles(x): ...
根据苹果文章链接,我们需要包装模型以允许跟踪,遵循相同的方法。 类 WrappedDeeplabv3Resnet1011(nn.Module): def __init__(自身): 超级(
如何重现带有modified_huber损失的SGDClassifier?
我有一个定义如下的模型: 随机数 = 42 模型=管道([ ('缩放器', RobustScaler()), ('特征', SelectKBest(k=42)), ('模型', SGDClassifier(loss='modified_huber', shuffle=True,
我想构建一个基于 python Flask api 的应用程序,我想发送 2 个人物图像(脸部图像)的路径(url 或本地图像),并且如果两张脸都匹配(两个图片都匹配),我希望得到“是”的响应。 ..
我一直在从事一个有关机器学习的项目:根据木瓜的成熟度进行分类。但因为我是这个环境的新手,所以我在 YouTube 上查找了一些有关 Machine Lea 的视频...
我想构建一个基于 python Flask api 的应用程序,我想发送 2 个人物图像(脸部图像)的路径(url 或本地图像),并且如果两张脸都匹配(两个图片都匹配),我希望得到“是”的响应。 ..
为了熟悉梯度下降算法,我尝试创建自己的线性回归模型。对于少数数据点来说它效果很好。但是当尝试使用更多数据来拟合它时,w0 和 w1 总是
我想在mlx中实现masked_fill,但它与float('-inf')配合得不好 https://pytorch.org/docs/stable/ generated/torch.Tensor.masked_fill.html 我正在尝试为此使用 mlx.core.where
正如标题所述,我试图获取 OLS 模型中特征的排列重要性,但得到的是: 类型错误:估计器应该是实现“fit”方法的估计器,<
我是机器学习的初学者,我正在尝试开发一个可以从面部数据集预测年龄的模型。然而,我的模型没有学习,我正在努力找出原因。我是进口...
ValueError:无法将字符串转换为浮点数:'Curtis RIngraham Directge'
我正在进行数据分割和交叉验证。 对于数据分割,我需要仅提取测试数据集,并保留其余数据以进行交叉验证。我越来越...
我的表格中有大约 5000 个术语,我想将它们分组为有意义的类别。 例如一些术语是: 日产 福特 被捕 吉普车 法庭 结果应该是日产、福特、Jee...