Paragram_300_SL999 Word Embeddings文件是否损坏?

问题描述 投票:0回答:1

我需要为使用已发布文章(https://github.com/cecilialeiqi/adversarial_text)中的开源代码的项目使用Paragram_SL999_300嵌入。当我尝试从https://github.com/cecilialeiqi/adversarial_text运行第4步(生成对抗示例)时,出现ValueError提示期望int()但得到了','。我从Parame-SL999 300的readme.txt中知道,应该是每行一个令牌,然后是其嵌入。尝试打开Paragram_SL999_300.txt文件以查看其是否符合此条件时,它将加载大约一半,然后关闭TextEditor,而不让我对其进行编辑。此外,如果我尝试在其中打开LibreOffice,它也会崩溃。这是在Ubuntu 18.04虚拟机中。但是,我不确定这是否是因为作者的代码错误(在https://github.com/cecilialeiqi/adversarial_text/blob/master/src/discrete_attack.py处的distant_attack.py中)或由于文件已损坏,所以我尝试从Wieting的网站下载并提取Paragram-SL999 300归档文件([C0 ])在我的Windows计算机上,我收到一条消息,说明档案已损坏,这使我无法提取Paragram_SL999_300.txt文件并使用它。在另一台Windows计算机上,尝试提取存档时出现错误代码0x80004005:未指定的错误。

是否有任何方法可以解决此问题,或者可以提供任何见解的人?是否建议改用Wieting的GitHub(http://www.cs.cmu.edu/~jwieting/)产生嵌入?我非常感谢任何输入,因为这些嵌入对于我的项目至关重要。

python nlp lstm embedding cnn
1个回答
0
投票

我设法从https://github.com/jwieting/paragram-word的Google驱动器链接中下载了该文件。最后它起作用了,但是我不确定为什么其他时候我无法使它起作用。另外,我没有意识到对于我拥有的代码,我还需要在文件的第一行中添加词汇量和嵌入大小(1703756 300)。

© www.soinside.com 2019 - 2024. All rights reserved.