word-embedding 相关问题

有关字嵌入的问题,自然语言处理中的语言建模技术。问题可能涉及特定方法,例如Word2Vec,GloVe,FastText等,或者字嵌入及其在机器学习库中的使用。

如何使用单词嵌入列表在 JSON 文件中搜索字符串并返回最近的出现次数?

我在 Python 中看到了一段代码,它生成一个包含嵌入表示(表示字符串的向量)的文件。 在模型“all-MiniLM-L6-v2”中生成的文件格式为: ...

回答 1 投票 0

Word2vec 中不存在该键

我在使用预训练模型时遇到了一些问题:w2v_512.model。 错误是“密钥‘xxx’不存在” 我认为这可能是“xxx”这个词无法转换为嵌入...

回答 1 投票 0

训练词嵌入时进行二次采样

NLP 新手,有一个关于词嵌入的问题。作为学习练习,我正在尝试训练自己的基于 word2vec 的一组词嵌入。我有一个英语句子语料库

回答 1 投票 0

Tensorflow 嵌入 InvalidArgumentError:索引 [18,16] = 11905 不在 [0, 11905) [[nodeequential_1/embedding_1/embedding_lookup

我正在使用 TF 2.2.0 并尝试创建 Word2Vec CNN 文本分类模型。但无论我如何尝试,模型或嵌入层始终存在问题。我找不到明确的解决方案...

回答 2 投票 0

旋转嵌入的平移不变性

RoPE(旋转位置编码),Llama中使用的位置编码,是一种相对位置编码。注意力分数必然仅由标记之间的相对距离决定。

回答 1 投票 0

在word2vec模型中测试时如何嵌入词汇?

我正在用 100 000 个词汇量训练我的 word2vec 模型(skip-gram)。但是在测试时,我得到了一些不在词汇表中的单词。为了找到它们的嵌入,我尝试了两种方法: 计算...

回答 1 投票 0

为什么可以将 OpenAI Embeddings 与 Anthropic Claude 模型一起使用?

我使用 Flowise 构建了一个 QnA 应用程序。 到目前为止,我将 ChatOpenAI 节点与 OpenAI Embeddings 一起使用。 今天,我想尝试一下 Anthropic Claude LLM,但找不到具体的 Anthropic Embedd...

回答 1 投票 0

初始化词汇表外 (OOV) 标记

我正在为 NLP 任务构建 TensorFlow 模型,并且正在使用预训练的 Glove 300d 词向量/嵌入数据集。 显然,有些标记无法解析为嵌入,因为没有包含在

回答 2 投票 0

如何使用 Huggingface 的生物医学模型来获取文本嵌入?

我有生物医学文本,我正在尝试获取使用生物医学变压器的嵌入: my_text = [“人类消费巧克力的历史可以追溯到公元 400 年,并且富含

回答 1 投票 0

有什么方法可以检索 langchain VectorStore 中的嵌入存储吗?

我正在使用 Langchain 加载文档,将其分割成块,嵌入这些块,嵌入它们,然后将嵌入向量存储到 langchain VectorStore 数据库中。我的用例要求我...

回答 1 投票 0

如何在langchain中嵌入文档?

我使用 langchain Python 库创建向量存储并根据用户查询检索相关文档。如何在矢量存储中嵌入文档? 例如,在这段代码中: 导入

回答 1 投票 0

将嵌入映射到 PyTorch/Huggingface 中的标签

我目前正在开展一个项目,其中使用预先训练的变压器模型来生成 DNA 序列的嵌入(有些有“1”标签,有些有“0”标签)。我正在尝试绘制地图...

回答 2 投票 0

如何使用 FastAPI 构建嵌入编码器

我只想使用 SentenceTransformer 中预先训练的开源嵌入模型来编码纯文本。 目标是使用 swagger 作为 GUI - 放入句子并取出嵌入。 来自 fas...

回答 1 投票 0

如何将fasttext模型保存为vec格式?

我使用 python 中的 fasttext.train_unsupervised() 函数训练了我的无监督模型。我想将其保存为 vec 文件,因为我将使用该文件作为 fasttext 中的 pretrainedVectors 参数。

回答 3 投票 0

高效的多对多嵌入比较

我试图向用户推荐最热门的“文章”,并嵌入他们所拥有的“兴趣”。 每个“用户”将有 5-10 个与其个人资料相关的嵌入,

回答 1 投票 0

是否可以使用Google BERT来计算两个文本文档之间的相似度?

是否可以使用Google BERT来计算两个文本文档之间的相似度?据我了解,BERT 的输入应该是有限大小的句子。有些作品使用 BERT 来实现相似性

回答 5 投票 0

2-3 个单词的短语与多个句子的文档之间的句子相似度

我想要实现的目标:我有数千个文档(事件描述),我想找到与短语匹配或与短语中的单词相似的文档。举个例子,...

回答 1 投票 0

如何在 .npy 文件中加载预先训练的词嵌入

我正在尝试使用斯坦福 NLP 团队在 HistWords 项目中预先训练的单词嵌入。但是当我从GitHub网站运行文档example.py时,出现错误:ModuleNotFoundEr...

回答 1 投票 0

为什么嵌入层中使用 V+1(`Embedding(V+1,D)(i)`),其中 V 是词汇量?

假设 从tensorflow.keras.preprocessing.text导入Tokenizer 分词器 = 分词器() ... V = len(tokenizer.word_index) 其中 V 是词汇量。 有人告诉我嵌入层 x =

回答 1 投票 0

LSTM 用于从单个单词生成一行诗?输入操作和模型创建帮助

X = [] Y = [] 对于文档中的行: 单词 = line.split() line_length = len(字数) if line_length > 1: # 排除 1 个单词或更少的行 input_sequence = [word_to_index.get(w...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.