使用Python和Cython的工业强度自然语言处理(NLP)
Python中使用gpu,nvcc的PATH中包含空格无法正常调用
这是我在 Stack Overflow 上的第一个问题。 我正在使用 spacy 学习文本分析,但使用 GPU 时遇到问题。 -------------------------------------------------- ------------------------------------------...
我正在尝试在 spacy 的管道上创建自定义组件。我想把我的文字变低。 我的代码: nlp = spacy.load('en_core_web_sm') def lower_component(文档): doc.text = doc.text.low...
R Tidymodels textrecipes - 使用 spacyR 进行标记 - 如何从生成的标记列表中删除标点符号
我想通过使用带有spacyR引擎的step_tokenize来标记我的文本,然后再使用step_lemma进行词形还原。接下来,我想删除例如标点符号
我想将段落分成没有标点符号的句子,包括句号、逗号等。 例如:“我叫 Brayan,今年 12 岁” 需要拆分为 我的名字是Br...
Spacy:找不到模型“en_core_web_sm”。它似乎不是一个 Python 包或数据目录的有效路径
我正在尝试加载en_core_web_sm spaCy模型,但我没有成功。 发生的错误如下: OSError:[E050]找不到模型“en_core_web_sm”。没看出...
我正在分析以确定给定文本中的功能需求。为了实现这一目标,我从文本中提取了名词和动词,并应用 KMeans 聚类对相似的语义词进行分组
我有一个像这样的字符串: “日期为2019年6月30日至2022年1月1日(含)” 我想使用 spaCy 从此字符串中提取日期。 到目前为止,这是我的功能: 定义
我正在尝试在 xml 中标记 12GB 的文本。该文件仅包含“内容词”,没有停用词。我正在尝试实现一个函数,以便通过文本块进行标记并清除...
我的英语很成功 python -m spacy 下载 en_core_web_lg python -m spacy 下载 en_core_web_sm python -m spacy 下载 en 我读了 https://spacy.io/models/xx 。如何与越南语 u...
Python Spacy Pattern - 如何根据另一个单词标记一个单词?
我正在尝试编写一种模式,根据一个子字符串将整个单词标记为单元。 这是例子: 条款 = [{'ent': "单位", '模式':[ [{'引理':'升'}]]...
我想做一个嘈杂的解决方案,以便给定一个人称代词,该代词被前一个(最近的)人代替。 例如: Alex 正在考虑以 10 亿美元收购一家英国初创公司。哈...
我正在文本文件上逐行运行 SpaCy Matcher。我的文件中的每个文本条目都位于单独的行上。我正在尝试提取 1) 匹配的实例,2) 完整的句子,以及 3) 前一个
Vercel 生产中的问题。 LookupError 找不到资源
`` **我在生产中遇到这个错误,我在本地没有遇到它。 ** [错误] 2023-08-07T16:26:11.466Z fb1bc7be-4061-455a-97b5-bb15babb27e5 /analyze_language 上的异常 [...
我正在开发一个小型项目,将相似的句子聚集在一起。在实现这一目标之前,我必须对极其脏的数据进行预处理(这些数据都是用户输入的,免费...
我正在尝试运行 nlp = en_core_web_sm.load()。但不断低于错误 OSError: [E053] 无法从 C:\Users\xxxxx\Anaconda3\lib\site-packages n_core_web_sm\
我正在使用 spacy 创建句子的向量。如果句子是“我正在工作”,它会给出一个形状为 (3, 300) 的向量。有什么方法可以使用这些向量取回句子中的文本...
我应该如何在我的在谷歌云实例上运行的jupyter笔记本上安装spacy的英文版本?
我正在尝试在jyputer笔记本(python 3)中使用spaCy的英文模型,它在谷歌云实例上运行。我已经安装了 spaCy,但我的问题是我无法安装/导入它的英文
我安装spacy 2.3.5版本时遇到的错误 我运行命令 pip install spacy==2.3.5 我收到多行错误,这是错误消息的结尾 Cython.编译器.错误。
spacy ImportError:无法在 Jupyter Notebook 中导入名称 Deque
我想在 Juptyer Notebook 上的 Python 项目中使用 spacy,但是当我尝试导入模块时,出现错误“ImportError:无法导入 name Deque”。我在我的
我正在尝试在 spacy 中创建一个匹配器来提取国家/地区名称,包括缩写。例如,Kenya、KE 和 KEN 都应匹配为 Kenya。我构建了一个简单的匹配器,但它没有返回...