使用手套预训练glove.6B.50.txt,以此为基础的嵌入字[R

问题描述 投票:1回答:1

我想文本数据转换成R中使用手套的载体。我的计划是平均句子的词矢量,但我似乎无法得到这个词量化阶段。我已经下载了glove.6b.50.txt文件,并从其父zip文件:https://nlp.stanford.edu/projects/glove/和我曾参观过text2vec的网站,并试图通过他们的榜样,他们加载维基百科的数据运行。但我不认为它就是我正在寻找(或也许我不理解的话)。我试图预训练的嵌入物装入的模型,因此,如果我有一句话(说“我爱灯”),我可以通过这句话迭代,并把每一个字,到我可以再平均(车削生词变成矢量零)与像矢量化(字的函数)。如何加载预训练的嵌入到手套模型作为我的语料库(是,即使是我需要做来完成我的目标是什么?)

r word-embedding text2vec glove
1个回答
0
投票

我终于想通了。该矩阵的嵌入是我所需要的。它已经在他们的翻译为rownames的话,所以我用这些来确定每个字的载体。

现在我需要弄清楚如何更新这些载体!

© www.soinside.com 2019 - 2024. All rights reserved.