spacy 相关问题

使用Python和Cython的工业强度自然语言处理(NLP)

自定义 spaCy 标记器来标记字典中的所有单词

我正在尝试使用 spaCy 从文本中提取特定信息。 因此,我需要配置一个自定义标记器来识别它们,并配置一个自定义标记器来标记外部词典中的所有单词...

回答 1 投票 0

SpaCy 依赖项匹配器使用 Pandas Dataframe 进行解析

我在通过 SpaCy 依赖项匹配器传递数据帧列时遇到困难。我尝试修改在之前的问题“Spacy Dependency Parsing with Pandas data...

回答 1 投票 0

如何使命名实体识别提供更好的数据分类

以下是新闻文章中数据的默认分类。 克里斯蒂安·阿曼普尔 268 287 人 哈马斯 155 160 组织 拉尼娅 6 11 人 华纳 0 6 组织 但我想改变行为

回答 1 投票 0

加快 PyTextRank 总结文档的速度

我需要用spacy-pytextrank总结文档,在不增加机器资源的情况下使其更快的最佳方法是什么? 我正在考虑并行计算...

回答 1 投票 0

使用 pdfminer 将 pdf 文件翻译为文本时出现奇怪的字符

我使用 pdfminer 翻译了一个 pdf 文件,我意识到在某些情况下我发现了一个奇怪的非 ascii 'fi' 替换了 'fi'。 解决这个问题的一个简单方法似乎是 content=re.sub('fi','...

回答 2 投票 0

如何使用spaCy和Python提取“b-per”、“b-misc”等类型的命名实体识别标签?

我能找到的文档建议在 spaCy 文档中使用 span 的“labels_”属性。然而对我来说,这返回 POS 标签而不是 NER 标签。我需要有类型来指示是否...

回答 1 投票 0

导入Spacy错误“无法导入名称dataclass_transform”

我正在开发一个应该使用 spacy 的 jupyter 笔记本项目。我已经使用 pip install 在 anaconda 提示符下安装 spacy。 然而,当我尝试导入 spacy 时,它给了我以下信息......

回答 4 投票 0

如何下载和导入(最好使用spacy和hugginface)最新训练有素的biobert官方版本来对医学文本执行ner

张等人。 2020年的研究比较了biobert和scispacy ner模型的准确性,总体来说biobert获胜。如何下载和导入(最好使用 spacy 和从 Huggin Face)最新的 **训练过的 **

回答 1 投票 0

将 BERT 代币索引映射到 Spacy 代币索引

我正在尝试将 Bert 的(bert-base-uncased)标记化标记索引(不是 ids,标记索引)映射到 Spacy 的标记化标记索引。在下面的例子中,我的方法不起作用,因为......

回答 1 投票 0

AttributeError:模块“transformers”没有属性“BertTokenizerFast”

我已将 spacy 安装到 Jupyter Lab 中的 Jupyter Notebook 上,我可以通过 Anaconda Navigator 访问该笔记本,所有操作都在远程桌面上进行。 我能够使用安装 spacy !pip 安装 spacy 但当我...

回答 1 投票 0

spaCy Pipeline 的哪些组件可以禁用,以便句子标记化仍然可以工作并且管道更快?

我只想使用 spaCy 管道进行句子标记化,因为它最适合我的语言,但我希望它尽可能少。 到目前为止,我认为我可以摆脱标记器和ner compo...

回答 1 投票 0

如何在spaCy中提取带有关键短语的句子

我曾与 Spacy 合作过,到目前为止,我发现 Spacy 在 NLP 方面非常直观和强大。 我正在尝试使用文本句子搜索,这既可以是单词基础搜索,也可以是内容类型基础搜索,但是......

回答 2 投票 0

spaCy 中的 LLM 模型需要 OpenAI 密钥

#有代码: 导入spacy nlp = spacy.blank("en") #下一行抛出下面的错误 llm_ner = nlp.add_pipe("llm_ner") C:\Program Files\Python311\Lib\site-packages\spacy_...

回答 1 投票 0

如何使用Spacy按句子分解文档

如何将文档(例如段落、书籍等)分解为句子。 例如,“狗跑了。猫跳了”变成了[“狗跑了”,“猫跳了”],有spacy?

回答 6 投票 0

错误:无法为 spacy 构建轮子,这是安装基于 pyproject.toml 的项目所必需的

大家好,我正在尝试安装 spacy model == 2.3.5 但我收到此错误,请帮助我!

回答 3 投票 0

Spacy - pdf_reader 仅从特定页面提取文本

你能告诉我下面的函数有什么问题吗?我只想解析 pdf 的前两页。当我使用参数 page_numbers=[0,1] 调用该函数时,它会从所有

回答 1 投票 0

错误:无法为neuralcoref构建轮子,这是安装基于pyproject.toml的项目所必需的

我正在 google colab 上运行 spacy 3.6.1。安装完所有要求后,当我尝试安装 tokenizer 时出现错误 我正在尝试使用 NeuralCoref4.0 对

回答 1 投票 0

ValueError:无法获取模型“sparse_线性”的维度“nO”:值未设置错误

当我运行代码时,我收到错误“ValueError:无法获取模型“sparse_线性”的维度“nO”:值未设置”。 如果有人能帮助我,那就太好了。 谢谢 我已经做了相当多的事情了...

回答 1 投票 0

仅使用 PIP 安装 spacy 模型 en_core_web_sm

有没有一种方法可以通过使用pip来安装en_core_web_sm(假设我已经安装了spacy) 从 spacy 文档中,我知道这是使用 python -m spacy download en_core_web...

回答 1 投票 0

使用 Python 计算给定句子中 T 单元的数量

我一直在从事第二语言开发项目。我需要使用 Python 计算给定句子的 t 单位。例如,对于以下句子: 这个男人不喜欢水。 1吨-

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.