将LibShortText与LibSVM格式的文 件一起使用

问题描述 投票:1回答:1

我正在尝试使用LibShortText,但我不完全理解它是如何工作的。

README看起来它的功能是用于文本文件。但是,我需要对已经采用LibSVM格式的文​​件进行分类,所以我认为像text-train.pytext-predict.py这样的函数不会...?

README还指出:

If a preprocessor directory is given instead, then it is assumed that the 
training data is already in LIBSVM format.

有谁知道什么是preprocessor directory ...?

LibShortText documentations,我看到有一个“中级分类模式 - 学习者”可以处理像我这样的文件。但是,我不明白它是如何工作的!它没有LIBSVM所具有的所有参数,例如......我还没有成功找到如何保存或理解结果(权重和预测在哪里?)。

如果有人能够解释这句话我会非常感激的话(我现在已经测试了几个小时了)...谢谢!

machine-learning svm text-classification libshorttext
1个回答
1
投票

根据文档(http://www.csie.ntu.edu.tw/~cjlin/libshorttext/doc/libshorttext.html#quick-start),您可以使用-A选项附加.svm文件。

但是,如果您已经获得了libsvm格式的数据,则可以直接使用liblinear(libshorttext下的库)。

如果你有libshorttext的发行版,你已经有了liblinear。你可以通过cd'ing编译和运行(从你有libshorttext解压缩的地方),如下所示:

$ cd libshorttext/classifier/learner/liblinear $ make $ ./train train_file.svm $ ./predict test_file.svm model_file output_file

这里参考的是liblinear README:https://github.com/ninjin/liblinear/blob/master/README,我发现它非常方便。

© www.soinside.com 2019 - 2024. All rights reserved.