nltk 相关问题

Natural Language Toolkit是一个用于计算语言学的Python库。

如何清除长文本中的重复(重复)段落?

所以我在数据框中有 100000 行,全部包含一个文本列。我想在进一步分析之前清理它。我找到了这个答案,它给了我很多信息。然而我仍然有重复...

回答 1 投票 0

nltk 下载问题 - 我尝试下载 nltk 工具包的停用词,但此错误不断出现

我输入此内容是为了下载停用词 然后我得到这个错误 请帮帮我 代码 - 导入nltk nltk.download('停用词') 输出 - [nltk_data] 加载停用词时出错: 我输入此内容是为了下载停用词 然后我得到了这个错误 请帮帮我 代码- import nltk nltk.download('stopwords') 输出- [nltk_data] Error loading stopwords: <urlopen error [Errno 54] [nltk_data] Connection reset by peer> False 请向我解释一下 urlopen 错误到底是什么 发生什么事了? 我正在尝试下载停用词 解决此问题的一种方法是手动安装 NLTK 软件包。 打开终端 键入 python3 或 python,具体取决于您的配置 类型import nltk 类型nltk.download() 找到并安装你想要的软件包

回答 1 投票 0

使用哪些 NLP 工具来匹配具有相似含义或语义的短语

我正在开发一个项目,该项目要求我将短语或关键字与一组相似的关键字相匹配。我需要对其进行语义分析。 一个例子: 相关QT 廉价健康

回答 3 投票 0

从方法返回一个值并将其重新用于类内的下一个方法

我正在尝试理解类和方法。 假设我们有一个名为 Nlkt_custom 的自定义类,它有 3 个方法,允许我: 读取文本文件 将文本标记化 返回单词出现次数 难道是……

回答 1 投票 0

在 NLTK 中下载“punkt”时出现 WinError 10060 连接超时错误

我在 Python 中遇到了 NLTK 库的问题,特别是在尝试下载“punkt”标记生成器模型时。这是我收到的错误消息: 语境: 我正在尝试下载...

回答 1 投票 0

Python nltk 下载和 download_shell 在尝试 punkt 时都会冻结(挂起)

使用NLTK 2.0.4。为 EPD 的 Python-2.7.3(不是 Canopy)安装。在 Ubuntu 12.10 上。在终端中我输入: 在[96]中:nltk.download_shell() NLTK下载器 --------------------------------------------------------...

回答 4 投票 0

在Python中根据上下文查找句子中的名词

如何根据上下文找到句子中的名词?我正在使用 nltk 库,如下所示: text = '我买了一辆老爷车。' 文本 = nltk.word_tokenize(文本) 结果 = nltk.pos_tag(文本) 结果...

回答 1 投票 0

为什么Python无法从utils导入函数? (nltk)[重复]

我正在 Google Collab 和 Jupyter Notebooks 中尝试。 在 Jupyter Notebooks 中,出现以下错误: -------------------------------------------------- ------------------------ 导入错误...

回答 1 投票 0

如何检查标记化句子列表中的特定单词,然后将它们标记为 1 或 0?

我正在尝试将列表中的特定单词映射到另一个标记化句子列表,如果在句子中找到该单词,那么我将 1 附加到其类别列表,将 0 附加到其余类别...

回答 2 投票 0

安装变压器的问题

我正在 vscode 上做一个 NLP 项目“亚马逊评论情感分析器”一切都很顺利,直到我到达导入变压器的部分 当我从 pi 安装变压器时...

回答 1 投票 0

在 Python 中使用字计数器低估了结果

作为一个完整的前言,我是一个初学者,正在学习。但是,这是我的产品评论表的示例架构。 记录ID 产品ID 评论评论 1234 89847457 我喜欢这个产品,它是发货的......

回答 1 投票 0

使用PMI等bigram_measures时何时删除停用词?

我需要验证处理从二元测量(例如 PMI)返回的二元停用词的总体方法。为什么要处理这些停用词?好吧,它们是噪音,不添加任何添加剂......

回答 1 投票 0

如果句子被剪切,则从字符串中删除最后一句

我正在使用 Python OpenAI API 生成来自 GPT-4 的响应。问题是有时回复中的最后一句话会被删掉。我想删除最后一句,如果这句话是......

回答 1 投票 0

在另一个 Text() 中单击单词时替换 Tkinter ScrolledText() 中的单词

这里我有一段代码执行以下操作: 它允许用户输入文本。 它通过标记它们来突出显示红色拼写错误的单词(礼貌-@OysterShucker) 当突出显示的单词为

回答 1 投票 0

使用nltk.download()下载错误

我正在使用Python试验NLTK包。我尝试使用 nltk.download() 下载 NLTK。我收到这样的错误消息。如何解决这个问题呢?谢谢。 我使用的系统是Ubuntu ins...

回答 7 投票 0

从头开始在Python中获得Bleu分数

在观看 Andrew Ng 关于 Bleu 分数的视频后,我想用 python 从头开始实现一个。我用 python 和 numpy 编写了完整的代码。这是完整的代码 将 numpy 导入为 np ...

回答 4 投票 0

Python NLTK 文本分散图的 y 纵轴是向后/相反的顺序

自上个月以来,NLTK离散图似乎在我的机器上有相反的y(垂直)轴。这可能与我的软件版本有关(我使用的是学校虚拟机)。 版本...

回答 1 投票 0

使用 Python 计算给定句子中 T 单元的数量

我一直在从事第二语言开发项目。我需要使用 Python 计算给定句子的 t 单位。例如,对于以下句子: 这个男人不喜欢水。 1吨-

回答 1 投票 0

用于简短描述的名称、实体、产品、地点识别的预训练模型(Spacy、NLTK 等)

我的描述非常简短,不超过40个字符。我使用 Spacy 的 NER 模型来识别名称、实体、产品和食品。 我的文字描述的问题是非常短......

回答 1 投票 0

为什么我的 tf-idf 值看起来不一致?

我有一系列已转换为代币的推文。其中包括以下内容: 杰拉尔德库特尼发生了意识到发生了方便的重命名捕获但紧急事后政府来了 迈克尔...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.