training-data 相关问题

我有xml数据，如下所示：斯图加特我有 xml 数据，如下所示： <item n="main"><anchor type="b" ana="regO.lemID_12" xml:id="TidB13" />Stuttgart<anchor type="e" ana="reg0.lemID_12" xml:id="TidE13" /> d. 20. Sept [19]97<lb/>Lieber Herr Schmidt!<lb/>Ich bin sehr glücklich über die Aufnahme <anchor type="b" ana="regW.lemID_17" xml:id="TidB22" />meines <anchor type="b" ana="regP.lemID_4" xml:id="TidB4" />Shakespeare<anchor type="e" ana="regP.lemID_4" xml:id="TidE4" /><anchor type="e" ana="regW.lemID_17" xml:id="TidE22" /> bei euch, vielen Dank.</item> 我想使用这样的文本作为spacy中的训练数据，因此我需要它以spacy requieres的形式： doc = nlp("Laura flew to Silicon Valley.") gold_dict = {"entities": [(0, 5, "PERSON"), (14, 28, "LOC")]} example = Example.from_dict(doc, gold_dict) 尤其是偏移量的创建，即实体何时开始和何时结束，我仍然无法正确理解。有没有特别合适的程序？提前非常感谢您我尝试用元素Tree来做到这一点，但是开始和结束位置的创建总是错误的。我也尝试用木瓜来做这件事，描述如下这里。但总是找不到“伊藤” 要 grep 文本，您需要元素 .tail: import xml.etree.ElementTree as ET xml_str =""" <item n="main"><anchor type="b" ana="regO.lemID_12" xml:id="TidB13" />Stuttgart<anchor type="e" ana="reg0.lemID_12" xml:id="TidE13" /> d. 20. Sept [19]97<lb/>Lieber Herr Schmidt!<lb/>Ich bin sehr glücklich über die Aufnahme <anchor type="b" ana="regW.lemID_17" xml:id="TidB22" />meines <anchor type="b" ana="regP.lemID_4" xml:id="TidB4" />Shakespeare<anchor type="e" ana="regP.lemID_4" xml:id="TidE4" /><anchor type="e" ana="regW.lemID_17" xml:id="TidE22" /> bei euch, vielen Dank.</item> """ root = ET.fromstring(xml_str) text = [] for elem in root.iter(): if elem.tail is not None: # with linebreak \n text.append(elem.tail+'\n') t = ''.join(text) print(t) print(repr(t)) 输出： Stuttgart d. 20. Sept [19]97 Lieber Herr Schmidt! Ich bin sehr glücklich über die Aufnahme meines Shakespeare bei euch, vielen Dank. 'Stuttgart\n d. 20. Sept [19]97\nLieber Herr Schmidt!\nIch bin sehr glücklich über die Aufnahme \nmeines \nShakespeare\n bei euch, vielen Dank.\n'

python xml spacy elementtree training-data

回答 1 投票 0

YOLOv8 自定义模型无法进行预测

我使用自定义训练的 Yolov8 模型来预测物理门是关闭还是打开。我已经在自定义数据集上训练了 Yolov8，但即使传递相同的数据，它也不会进行任何检测

machine-learning training-data yolov8

回答 1 投票 0

RandomForest n_estimators 计算 [已关闭]

我正在分析数据和训练模型，稍后将用于日期预测应用程序。目前，我的服务器上有大约 700 万行数据（表大小 = 6,400,000 行 x 8 列）。我是

python random-forest training-data

回答 1 投票 0

M2 Mac YOLOv8 训练：运行时错误：“upsample_nearest2d_channels_last”未针对“Half”实现

我想用我的 Mac 在自定义数据集上训练 Yolov8 模型，这是我第一次从事深度学习。不幸的是，我遇到了一个错误，运行时错误：“

runtime-error yolo training-data yolov8 half-precision-float

回答 1 投票 0

Google colab 总是显示正在连接，如何解决？

这就是图中问题的状态

neural-network connection google-colaboratory training-data

回答 2 投票 0

ValueError：预期输入数据非空

这是我的代码： x_测试 = [] y_test = 数据集[training_data_len:, :] 对于范围 (60,len(test_data)) 内的 i： x_test.append(test_data[i - 60 :i, 0]) x_test = np.array(x_test) x_test = np.reshape(x...

python deep-learning lstm training-data

回答 1 投票 0

方法“train_test_split”中的参数“stratify”（scikit Learn）

我正在尝试使用 scikit Learn 包中的 train_test_split，但我在参数分层方面遇到问题。以下是代码：从sklearn导入交叉验证，数据集 X = 虹膜.数据...

split scikit-learn training-data test-data

回答 6 投票 0

为视觉对象跟踪器创建数据集时出现问题

我想训练 ET-Track（一个不错的视频对象跟踪器）。它基于 Ocean（另一个视频对象跟踪器）。问题是他们之前没有分享任何用于训练它的代码。现在我们有了代码（

python pytorch dataset tracking training-data

回答 1 投票 0

当训练数据集相同但验证数据集不同时，为什么训练精度输出存在差异？ [已关闭]

我正在查看多类图像分割深度学习模型的输出。我使用U-Net来实现这个。我很困惑为什么不同的训练精度不同

validation deep-learning neural-network image-segmentation training-data

回答 1 投票 0

如何计算 Vision Transformer 的精度？

我是 PyTorch 的新手，想要找到每个纪元的准确性。我知道准确性是正确预测的数量/总样本，但我不知道如何将其集成到我的代码中：对于 epoc...

deep-learning pytorch computer-vision training-data vision-transformer

回答 2 投票 0

我得到了这个类型错误：'<' not supported between instances of 'str' and 'NoneType' while fitting the training data for logistic regression. Why?

惩罚 = ['l1', 'l2'] C = np.logspace(0, 4, 10) grid_model = GridSearchCV(log_model, param_grid={'C':C, '惩罚':惩罚}) grid_model.fit(scaled_X_train, y_train) 我收到错误...

python typeerror logistic-regression training-data data-fitting

回答 1 投票 0

如何在不拆分数据帧的情况下传递不同的数据集进行训练和测试。（蟒蛇）？

我已经解决了多个问题，这些问题有助于将数据帧分为训练和测试，使用 scikit 或不使用 scikit 等。但我的问题是我有 2 个不同的 csv（来自不同的 2 个不同的数据帧...

python scikit-learn linear-regression data-science training-data

回答 3 投票 0

开始使用 Huggingface 训练 Llama-2 后 GPU 立即内存不足

使用 Huggingface Trainer 在 Llama-2 7B 模型上运行多标签分类任务的训练脚本时，出现以下错误。我的训练数据包含一个二进制列表...

pytorch huggingface-transformers training-data llama

回答 1 投票 0

training-data 相关问题

最新问题