training-data 相关问题

训练集是用于发现潜在预测关系的一组数据,用于人工智能,机器学习和统计等领域。

我什么时候应该进行特征选择?

我正在运行一些机器学习算法来训练模型。 到目前为止,我一直在做相关矩阵,以便选择与我的目标相关性最高的特征

回答 1 投票 0

使用没有标签的机器学习进行异常检测[关闭]

我正在跟踪一段时间内的多个信号并将它们与时间戳相关联,如下所示: t0 1 10 2 0 1 0 ... t1 1 10 2 0 1 0 ... t2 3 0 9 7 1 1 ... // 按下按钮以 c...

回答 1 投票 0

我可以用我自己的语言训练 Whisper AI 吗?

首先感谢那些愿意回答的人。我希望将 Whisper AI 训练为我自己的语言(布列塔尼语)。 我想使用布列塔尼训练的模型来开发布列塔尼学习应用程序,以...

回答 1 投票 0

与训练阶段相比,测试阶段的决定系数值更高

我使用元启发式算法和人工神经网络开发了七种不同的混合机器学习模型。有趣的是,大多数这些模型的决定系数值在测试阶段都较高

回答 1 投票 0

使用 Tkinter 和 OpenCV 训练人脸识别模型的问题

说明: 我目前正在开发一个人脸识别项目,使用 Tkinter 作为 GUI,使用 OpenCV 在 Visual Studio 上进行图像处理。我的目标是使用图像数据集和

回答 2 投票 0

我应该从训练集中标记多少张图像?

我们有 10,000 张图像,我们想要实现一个深度学习模型来提取植被。如果我们想要 80% 的训练集,我们应该标记的最少图像数量是多少? 我们想用se...

回答 1 投票 0

我应该使用训练集还是验证集来进行参数优化?

我正在使用决策树和参数优化来训练模型。 我读到验证集的目标是评估训练期间的模型性能并帮助调整参数。 与...

回答 1 投票 0

从 xml 生成 spacy 的 TRAIN_DATA

我有xml数据,如下所示: 斯图加特 我有 xml 数据,如下所示: <item n="main"><anchor type="b" ana="regO.lemID_12" xml:id="TidB13" />Stuttgart<anchor type="e" ana="reg0.lemID_12" xml:id="TidE13" /> d. 20. Sept [19]97<lb/>Lieber Herr Schmidt!<lb/>Ich bin sehr glücklich über die Aufnahme <anchor type="b" ana="regW.lemID_17" xml:id="TidB22" />meines <anchor type="b" ana="regP.lemID_4" xml:id="TidB4" />Shakespeare<anchor type="e" ana="regP.lemID_4" xml:id="TidE4" /><anchor type="e" ana="regW.lemID_17" xml:id="TidE22" /> bei euch, vielen Dank.</item> 我想使用这样的文本作为spacy中的训练数据,因此我需要它以spacy requieres的形式: doc = nlp("Laura flew to Silicon Valley.") gold_dict = {"entities": [(0, 5, "PERSON"), (14, 28, "LOC")]} example = Example.from_dict(doc, gold_dict) 尤其是偏移量的创建,即实体何时开始和何时结束,我仍然无法正确理解。有没有特别合适的程序? 提前非常感谢您 我尝试用元素Tree来做到这一点,但是开始和结束位置的创建总是错误的。我也尝试用木瓜来做这件事,描述如下这里。但总是找不到“伊藤” 要 grep 文本,您需要元素 .tail: import xml.etree.ElementTree as ET xml_str =""" <item n="main"><anchor type="b" ana="regO.lemID_12" xml:id="TidB13" />Stuttgart<anchor type="e" ana="reg0.lemID_12" xml:id="TidE13" /> d. 20. Sept [19]97<lb/>Lieber Herr Schmidt!<lb/>Ich bin sehr glücklich über die Aufnahme <anchor type="b" ana="regW.lemID_17" xml:id="TidB22" />meines <anchor type="b" ana="regP.lemID_4" xml:id="TidB4" />Shakespeare<anchor type="e" ana="regP.lemID_4" xml:id="TidE4" /><anchor type="e" ana="regW.lemID_17" xml:id="TidE22" /> bei euch, vielen Dank.</item> """ root = ET.fromstring(xml_str) text = [] for elem in root.iter(): if elem.tail is not None: # with linebreak \n text.append(elem.tail+'\n') t = ''.join(text) print(t) print(repr(t)) 输出: Stuttgart d. 20. Sept [19]97 Lieber Herr Schmidt! Ich bin sehr glücklich über die Aufnahme meines Shakespeare bei euch, vielen Dank. 'Stuttgart\n d. 20. Sept [19]97\nLieber Herr Schmidt!\nIch bin sehr glücklich über die Aufnahme \nmeines \nShakespeare\n bei euch, vielen Dank.\n'

回答 1 投票 0

YOLOv8 自定义模型无法进行预测

我使用自定义训练的 Yolov8 模型来预测物理门是关闭还是打开。我已经在自定义数据集上训练了 Yolov8,但即使传递相同的数据,它也不会进行任何检测

回答 1 投票 0

RandomForest n_estimators 计算 [已关闭]

我正在分析数据和训练模型,稍后将用于日期预测应用程序。目前,我的服务器上有大约 700 万行数据(表大小 = 6,400,000 行 x 8 列)。 我是

回答 1 投票 0

M2 Mac YOLOv8 训练:运行时错误:“upsample_nearest2d_channels_last”未针对“Half”实现

我想用我的 Mac 在自定义数据集上训练 Yolov8 模型,这是我第一次从事深度学习。不幸的是,我遇到了一个错误, 运行时错误:“

回答 1 投票 0


ValueError:预期输入数据非空

这是我的代码: x_测试 = [] y_test = 数据集[training_data_len:, :] 对于范围 (60,len(test_data)) 内的 i: x_test.append(test_data[i - 60 :i, 0]) x_test = np.array(x_test) x_test = np.reshape(x...

回答 1 投票 0

方法“train_test_split”中的参数“stratify”(scikit Learn)

我正在尝试使用 scikit Learn 包中的 train_test_split,但我在参数分层方面遇到问题。以下是代码: 从sklearn导入交叉验证,数据集 X = 虹膜.数据...

回答 6 投票 0

为视觉对象跟踪器创建数据集时出现问题

我想训练 ET-Track(一个不错的视频对象跟踪器)。它基于 Ocean(另一个视频对象跟踪器)。 问题是他们之前没有分享任何用于训练它的代码。现在我们有了代码(

回答 1 投票 0

当训练数据集相同但验证数据集不同时,为什么训练精度输出存在差异? [已关闭]

我正在查看多类图像分割深度学习模型的输出。我使用U-Net来实现这个。 我很困惑为什么不同的训练精度不同

回答 1 投票 0

如何计算 Vision Transformer 的精度?

我是 PyTorch 的新手,想要找到每个纪元的准确性。我知道准确性是正确预测的数量/总样本,但我不知道如何将其集成到我的代码中: 对于 epoc...

回答 2 投票 0

我得到了这个类型错误:'<' not supported between instances of 'str' and 'NoneType' while fitting the training data for logistic regression. Why?

惩罚 = ['l1', 'l2'] C = np.logspace(0, 4, 10) grid_model = GridSearchCV(log_model, param_grid={'C':C, '惩罚':惩罚}) grid_model.fit(scaled_X_train, y_train) 我收到错误...

回答 1 投票 0

如何在不拆分数据帧的情况下传递不同的数据集进行训练和测试。 (蟒蛇)?

我已经解决了多个问题,这些问题有助于将数据帧分为训练和测试,使用 scikit 或不使用 scikit 等。 但我的问题是我有 2 个不同的 csv(来自不同的 2 个不同的数据帧...

回答 3 投票 0

开始使用 Huggingface 训练 Llama-2 后 GPU 立即内存不足

使用 Huggingface Trainer 在 Llama-2 7B 模型上运行多标签分类任务的训练脚本时,出现以下错误。我的训练数据包含一个二进制列表...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.