我试图使用fasttext标记一些数据[url]
or[PN]
只是为了在每个标签的6k训练后测试它并预测它保持预测[PN]
训练指挥
fasttext supervised -input input.txt -output model -minn 0 -maxn 0 -epoch 100 -lr 0.1
样本培训数据
__label__PN 5962-8904XA
__label__PN 585DD4P54ZP
__label__PN GQ0B11400FCT
__label__URL http://ws.com/qd/lat/ispls32883.pdf
__label__URL http://ws.com/pdfs//2004/0423/ds/m412b.pdf
__label__URL http://ws.com/pdfs//2004/0423/mc68.pdf
样本测试数据
945
74ACT399MTC
http://www.msn.com/mylink.pdf
MQ8797BH
74AC1153
ICL762PA+
54LS3482A
54LS76A/B
54HC27/A
www.google.com
FastText它基于WordNGrams,这意味着你需要一个完整的句子作为算法的输入。
在您的示例中,您只传递算法的单字组,并且根据您在模型中无法学习的参数中使用的WordNGrams
的数量。
ELI5:它所说的算法:我能够学习复杂的句子,因为单词的结构和它们的组合,但你只向我发送单词。我无法处理。