spacy 相关问题

使用Python和Cython的工业强度自然语言处理(NLP)

使用 SpaCy 匹配器获取上一句话

我正在文本文件上逐行运行 SpaCy Matcher。我的文件中的每个文本条目都位于单独的行上。我正在尝试提取 1) 匹配的实例,2) 完整的句子,以及 3) 前一个

回答 1 投票 0

Vercel 生产中的问题。 LookupError 找不到资源

`` **我在生产中遇到这个错误,我在本地没有遇到它。 ** [错误] 2023-08-07T16:26:11.466Z fb1bc7be-4061-455a-97b5-bb15babb27e5 /analyze_language 上的异常 [...

回答 1 投票 0

如何使用SpaCy NER?

我正在开发一个小型项目,将相似的句子聚集在一起。在实现这一目标之前,我必须对极其脏的数据进行预处理(这些数据都是用户输入的,免费...

回答 1 投票 0

OSError: [E053] 无法从 C:\Users\

我正在尝试运行 nlp = en_core_web_sm.load()。但不断低于错误 OSError: [E053] 无法从 C:\Users\xxxxx\Anaconda3\lib\site-packages n_core_web_sm\

回答 0 投票 0

将 spacy token 向量转换为文本

我正在使用 spacy 创建句子的向量。如果句子是“我正在工作”,它会给出一个形状为 (3, 300) 的向量。有什么方法可以使用这些向量取回句子中的文本...

回答 3 投票 0

我应该如何在我的在谷歌云实例上运行的jupyter笔记本上安装spacy的英文版本?

我正在尝试在jyputer笔记本(python 3)中使用spaCy的英文模型,它在谷歌云实例上运行。我已经安装了 spaCy,但我的问题是我无法安装/导入它的英文

回答 2 投票 0

子进程中的 Python spacy 2.3.5 安装错误

我安装spacy 2.3.5版本时遇到的错误 我运行命令 pip install spacy==2.3.5 我收到多行错误,这是错误消息的结尾 Cython.编译器.错误。

回答 1 投票 0

spacy ImportError:无法在 Jupyter Notebook 中导入名称 Deque

我想在 Juptyer Notebook 上的 Python 项目中使用 spacy,但是当我尝试导入模块时,出现错误“ImportError:无法导入 name Deque”。我在我的

回答 1 投票 0

Spacy 匹配器未找到任何县的匹配项

我正在尝试在 spacy 中创建一个匹配器来提取国家/地区名称,包括缩写。例如,Kenya、KE 和 KEN 都应匹配为 Kenya。我构建了一个简单的匹配器,但它没有返回...

回答 1 投票 0

我可以监控spacy解析的进度吗?

我有一个简单的程序来处理带有spacy的英文文本并输出一些有关标记的信息。对于大文本,spacy 需要很长时间来处理它。有没有办法看到距离有多远

回答 1 投票 0

python 项目 - 所需的软件包不会安装在 pych 中

目前正在构建基于python、streamlit、xampp和nlp的简历分析器应用程序 我在终端中收到错误 - OSError:[E050]找不到模型“en_core_web_sm”。它...

回答 1 投票 0

如何从Spacy NER模型获得每个实体的预测概率?

我使用这个官方示例代码使用我自己的训练样本从头开始训练 NER 模型。 当我在新文本上使用此模型进行预测时,我想获得每个

回答 3 投票 0

从 xml 生成 spacy 的 TRAIN_DATA

我有xml数据,如下所示: 斯图加特 我有 xml 数据,如下所示: <item n="main"><anchor type="b" ana="regO.lemID_12" xml:id="TidB13" />Stuttgart<anchor type="e" ana="reg0.lemID_12" xml:id="TidE13" /> d. 20. Sept [19]97<lb/>Lieber Herr Schmidt!<lb/>Ich bin sehr glücklich über die Aufnahme <anchor type="b" ana="regW.lemID_17" xml:id="TidB22" />meines <anchor type="b" ana="regP.lemID_4" xml:id="TidB4" />Shakespeare<anchor type="e" ana="regP.lemID_4" xml:id="TidE4" /><anchor type="e" ana="regW.lemID_17" xml:id="TidE22" /> bei euch, vielen Dank.</item> 我想使用这样的文本作为spacy中的训练数据,因此我需要它以spacy requieres的形式: doc = nlp("Laura flew to Silicon Valley.") gold_dict = {"entities": [(0, 5, "PERSON"), (14, 28, "LOC")]} example = Example.from_dict(doc, gold_dict) 尤其是偏移量的创建,即实体何时开始和何时结束,我仍然无法正确理解。有没有特别合适的程序? 提前非常感谢您 我尝试用元素Tree来做到这一点,但是开始和结束位置的创建总是错误的。我也尝试用木瓜来做这件事,描述如下这里。但总是找不到“伊藤” 要 grep 文本,您需要元素 .tail: import xml.etree.ElementTree as ET xml_str =""" <item n="main"><anchor type="b" ana="regO.lemID_12" xml:id="TidB13" />Stuttgart<anchor type="e" ana="reg0.lemID_12" xml:id="TidE13" /> d. 20. Sept [19]97<lb/>Lieber Herr Schmidt!<lb/>Ich bin sehr glücklich über die Aufnahme <anchor type="b" ana="regW.lemID_17" xml:id="TidB22" />meines <anchor type="b" ana="regP.lemID_4" xml:id="TidB4" />Shakespeare<anchor type="e" ana="regP.lemID_4" xml:id="TidE4" /><anchor type="e" ana="regW.lemID_17" xml:id="TidE22" /> bei euch, vielen Dank.</item> """ root = ET.fromstring(xml_str) text = [] for elem in root.iter(): if elem.tail is not None: # with linebreak \n text.append(elem.tail+'\n') t = ''.join(text) print(t) print(repr(t)) 输出: Stuttgart d. 20. Sept [19]97 Lieber Herr Schmidt! Ich bin sehr glücklich über die Aufnahme meines Shakespeare bei euch, vielen Dank. 'Stuttgart\n d. 20. Sept [19]97\nLieber Herr Schmidt!\nIch bin sehr glücklich über die Aufnahme \nmeines \nShakespeare\n bei euch, vielen Dank.\n'

回答 1 投票 0

OSError:[E050]找不到模型“xx_ent_wiki_sm”。它似乎不是一个 Python 包或数据目录的有效路径

嗨,我已经在 Windows 上学习 ML,并尝试迁移到 ubuntu 并学习 NLP。我已经通过终端和终端在 /usr/local/lib/python3.8/dist-packages$ python 文件夹中安装了 spacy 和 model。 ..

回答 2 投票 0

SpaCy v3 自定义 NER 模型训练

我正在尝试使用 spacy 和 python 创建一个从文本中提取实体的 NLP 项目。 我需要一些自定义实体,因此我创建了一个带有注释文章的 JSON 文件,我用它来训练我的...

回答 1 投票 0

SpaCy:正则表达式模式在基于规则的匹配器中不起作用

我正在尝试定义一个正则表达式,用作我的 spaCy 模型中实体标尺组件中的文本模式。 目的是每当发现单词结构时添加带有“COMP”标签的标记...

回答 1 投票 0

句子相似度模型未捕获相反的句子

我尝试了不同的句子相似度方法,即: spaCy 模型:en_core_web_md 和 en_core_web_lg。 变压器:使用句子相似度和句子变压器包,...

回答 3 投票 0

Spacy 手动下载 en_core_web_lg

我正在尝试找到一种方法来下载 Spacy == 2.3.2 的模型 en_core_web_lg ==2.3.1。 目前使用 python -m spacy 下载 en_core_web_lg 导入spacy nlp = spacy.load("en_core_web_lg&

回答 2 投票 0

从文本字符串返回职位名称

将 pandas 导入为 pd 导入spacy file_path =“保险数据.csv” Original_df = pd.read_csv(文件路径) def extract_job_title(用户输入): 用户输入 = 用户输入.lower()

回答 1 投票 0

如何使用 spacy 查找数据框 2 列中句子的相似性

我从 https://spacy.io/universe/project/spacy-sentence-bert 中提取了此代码 导入 spacy_sentence_bert # 加载 https://github.com/MartinoMensio/spacy-sentence-bert/ 中列出的模型之一 自然语言处理 =

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.