nlp 相关问题

自然语言处理(NLP)是人工智能的子领域,涉及从自然语言数据转换或提取有用信息。方法包括机器学习和基于规则的方法。

elasticsearch如何统计tf-idf?看起来很奇怪

我有一个索引,其中包含存储系统信息的文档和复制到 searchable_keys 字段中的可搜索字段。在这种情况下,只有一个这样的字段 - name。 这是定义...

回答 1 投票 0

如何在 .npy 文件中加载预先训练的词嵌入

我正在尝试使用斯坦福 NLP 团队在 HistWords 项目中预先训练的单词嵌入。但是当我从GitHub网站运行文档example.py时,出现错误:ModuleNotFoundEr...

回答 1 投票 0

为什么我在抓取网站时得到一个空列表?

url = 'https://inshorts.com/en/read/technology' 新闻数据 = [] news_category = url.split('/')[-1] headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, ...

回答 1 投票 0

为什么我在尝试通过网络搜索创建新数据框时得到一个空列表,soup.find_all 给出空列表

url = 'https://inshorts.com/en/read/technology' 新闻数据 = [] news_category = url.split('/')[-1] headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, ...

回答 1 投票 0

如何使用 openai 和 langchain 将已创建的 chromadb 集合与法学硕士一起使用?

我已经有了一个用其文档和元数据创建的 chromadb 集合。 问题是当我想使用 langchain 创建 llm 并传递此 chromadb 集合以用作知识库时。

回答 1 投票 0

逻辑回归在小批量训练时逐渐倾向于预测全0

我正在使用小批量来训练我的模型,如下所示 简单模型( (嵌入):嵌入(vocab_size、embedding_size、max_norm=2) (模型):顺序( (0): 展平(start_dim=1, end_dim=...

回答 1 投票 0

大查询 - 案例陈述和撇号

下午,想知道是否有人可以提供帮助。 在编写 case 语句来标记 netezza 中的特定短语时,如果我们逐字地遇到包含撇号的情况,我会得到这个...

回答 1 投票 0

LSTM 用于从单个单词生成一行诗?输入操作和模型创建帮助

X = [] Y = [] 对于文档中的行: 单词 = line.split() line_length = len(字数) if line_length > 1: # 排除 1 个单词或更少的行 input_sequence = [word_to_index.get(w...

回答 1 投票 0

通过分类根据格式从 PDF 中提取标题

我有大约 20000 个 pdf 文件,大概有 100 种不同的布局。不幸的是,并非所有 PDF 都包含干净的元数据。人们常常很懒,并不总是提供标题,或者有时非常

回答 1 投票 0

为什么导入收缩在 Colab 中不起作用

我正在尝试在 google colab 中为我的 NLP 项目“导入缩写”,但它不起作用。 我的问题的原因是什么以及解决方案

回答 2 投票 0

如何解决这个“IndentationError:需要缩进块”? [重复]

def remove_stopwords(文本,nlp,custom_stop_words =无,remove_small_tokens = True,min_len = 2): 如果自定义停止词: nlp.Defaults.stop_words |= custom_stop_words 过滤语句=[] ...

回答 2 投票 0

Gensim 3.8.0 至 Gensim 4.0.0

我使用 Gensim 3.8.0 训练了 Word2Vec 模型。后来我尝试在GCP上使用Gensim 4.0.o来使用预训练模型。我使用了以下代码: 模型 = KeyedVectors.load_word2vec_format(wv_path,

回答 4 投票 0

我可以同时使用 LoRa 和 Prompt Tuning 通过 GPT 进行文本摘要吗?

LoRA是插入并学习Transformer中对权重矩阵进行降维创建的秩组成矩阵。另一方面,提示调整通常使用软提示,...

回答 1 投票 0

为什么 OpenNLP CLI 在 Windows 上输出“SLF4J: 无法加载类“org.slf4j.impl.StaticLoggerBinder”?

基于Apache OpenNLP文档,我下载了OpenNLP的二进制版本,然后设置JAVA_HOME和OPENNLP_HOME。当我运行 opennlp 命令时,它面临以下异常: SLF4J:无法加载类...

回答 1 投票 0

如何使用 OpenNLP 为一个 token 分配多个标签?

我正在使用 OpenNLP,它可以很好地检测词性等: 尝试(InputStream modelIn = new FileInputStream(“en-pos-maxent.bin”){ POSModel 模型 = 新 POS...

回答 1 投票 0

在混乱的字符串中插入点/点以在Python中进行文本分析

我得到了一个又长又乱的字符串,缺乏句子结构,即该字符串并不始终包含点/点。 因此,我目前无法将长字符串分解为

回答 1 投票 0

如何结合多个OCR工具的结果以获得更好的文本识别

想象一下,您有不同的 OCR 工具来从图像中读取文本,但没有一个工具可以为您提供 100% 准确的输出。然而,综合起来,结果可能非常接近真实情况——什么会......

回答 1 投票 0

如何将从现有列派生的句子嵌入添加到新列中?

我有一个数据框,有四个 nw_data=['Qn_id', 'Qn_context', 'Qns', 'Anwsers']。这就是它的样子 Qn_id | Qn_上下文 | Qns |答案 01 | 1962年,英国给予……

回答 2 投票 0

训练 llm 以在图数据库中生成查询

如果我开发了一个有自己的查询语言的图数据库。我必须找到一种方法来向 llm 提供图表,然后 llm 应该能够生成我们数据库的查询。 我找到了

回答 1 投票 0

从头开始学习ai-ml的最佳网站或YouTube频道是哪个

我几个月前开始编程,了解一点Python和前端Web开发。 并从头开始学习 ai-ml,因此请建议最佳的学习资源。 我已经尝试过一些你...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.