spacy 相关问题

使用Python和Cython的工业强度自然语言处理(NLP)

设置 Chatterbot?

所以我尝试安装Chatterbot来编写一个简单的聊天机器人。 但是我遇到了很多问题。我设置了一个运行 Python 3.7 的虚拟环境。我让 Chatterbot 安装正确...

回答 1 投票 0

AttributeError:模块“click.utils”没有属性“_expand_args”

我正在关注 nlp 教程,这是我正在观看的视频:https://www.youtube.com/watch?v=h2kBNEShsiE&list=PLeo1K3hjS3uuvuAXhYjV2lMEShq2UYSwX&index=7 在视频中,教练要求我们...

回答 2 投票 0

尝试运行 python -m spacy download en 不起作用

我正在关注 nlp 教程,这是我正在观看的视频:https://www.youtube.com/watch?v=h2kBNEShsiE&list=PLeo1K3hjS3uuvuAXhYjV2lMEShq2UYSwX&index=7 在视频中,教练要求我们...

回答 0 投票 0

如何调整 spaCy 分词器,以便在德国模型中分割行尾的数字和点

我在 spacy 有一个用例,我想在德语句子中查找电话号码。不幸的是,分词器没有按预期进行分词。当数字位于句子末尾时...

回答 1 投票 0

Spacy nlp = spacy.load(“en_core_web_lg”)

我已经下载了 spaCy,但是每次我尝试 nlp = spacy.load("en_core_web_lg"), 命令时,我都会收到此错误: OSError:[E050]找不到模型“en_core_web_lg”。好像不是

回答 7 投票 0

自定义名称实体识别

我有以下一句话: text="英格兰的天气极其恶劣" 我想要执行自定义名称实体识别 (NER) 过程 首先,正常的 NER 程序将输出

回答 2 投票 0

ChatterBot 错误 - OSError: [E941] 找不到模型“en”

我尝试运行我的第一个 Chatterbot 程序(来自 Chatterbot 的 PyPi 页面),当我运行它时,出现错误。该错误与 Spacy 有关,但我无法找到解决方案。 这是...

回答 5 投票 0

Spacy textcat 多标签配置验证错误

我正在尝试训练一个 spacy textcat_multilabel 模型。我以为我已经正确设置了所有内容,但我仍然收到验证错误。 这是我的配置的标签部分: [组件。

回答 1 投票 0

如何在Spacy中标记不包含特定符号的单词?

我正在尝试使用正则表达式在 Spacy 中标记一个单词,但我想添加一个条件:它不能在内部任何位置包含符号“/”。我的代码如下所示: [{'lower': {"regex": "^.*(...

回答 1 投票 0

Python中使用gpu,nvcc的PATH中包含空格无法正常调用

这是我在 Stack Overflow 上的第一个问题。 我正在使用 spacy 学习文本分析,但使用 GPU 时遇到问题。 -------------------------------------------------- ------------------------------------------...

回答 1 投票 0

Spacy 添加自定义组件并重写 doc.text

我正在尝试在 spacy 的管道上创建自定义组件。我想把我的文字变低。 我的代码: nlp = spacy.load('en_core_web_sm') def lower_component(文档): doc.text = doc.text.low...

回答 3 投票 0

R Tidymodels textrecipes - 使用 spacyR 进行标记 - 如何从生成的标记列表中删除标点符号

我想通过使用带有spacyR引擎的step_tokenize来标记我的文本,然后再使用step_lemma进行词形还原。接下来,我想删除例如标点符号

回答 1 投票 0

如何将段落拆分成没有标点符号(包括句号、逗号等)的句子

我想将段落分成没有标点符号的句子,包括句号、逗号等。 例如:“我叫 Brayan,今年 12 岁” 需要拆分为 我的名字是Br...

回答 1 投票 0

Spacy:找不到模型“en_core_web_sm”。它似乎不是一个 Python 包或数据目录的有效路径

我正在尝试加载en_core_web_sm spaCy模型,但我没有成功。 发生的错误如下: OSError:[E050]找不到模型“en_core_web_sm”。没看出...

回答 3 投票 0

如何在Python中稳定Kmeans集群

我正在分析以确定给定文本中的功能需求。为了实现这一目标,我从文本中提取了名词和动词,并应用 KMeans 聚类对相似的语义词进行分组

回答 1 投票 0

从 spaCy 中的句子中提取日期

我有一个像这样的字符串: “日期为2019年6月30日至2022年1月1日(含)” 我想使用 spaCy 从此字符串中提取日期。 到目前为止,这是我的功能: 定义

回答 1 投票 0

使用 SpaCy 标记 12GB xml 时内存不足

我正在尝试在 xml 中标记 12GB 的文本。该文件仅包含“内容词”,没有停用词。我正在尝试实现一个函数,以便通过文本块进行标记并清除...

回答 1 投票 0

如何启动并运行越南语 spaCy?

我的英语很成功 python -m spacy 下载 en_core_web_lg python -m spacy 下载 en_core_web_sm python -m spacy 下载 en 我读了 https://spacy.io/models/xx 。如何与越南语 u...

回答 2 投票 0

Python Spacy Pattern - 如何根据另一个单词标记一个单词?

我正在尝试编写一种模式,根据一个子字符串将整个单词标记为单元。 这是例子: 条款 = [{'ent': "单位", '模式':[ [{'引理':'升'}]]...

回答 1 投票 0

将人称代词替换为之前提到的人称(吵闹的coref)

我想做一个嘈杂的解决方案,以便给定一个人称代词,该代词被前一个(最近的)人代替。 例如: Alex 正在考虑以 10 亿美元收购一家英国初创公司。哈...

回答 3 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.