我正在使用文本挖掘来探索自然语言语料库中语音域的术语使用差异。该研究将主要关注关键术语的分布。有哪些适当且有效的方式可视化地呈现此类信息?
许多文本挖掘方法都以单字,双字和三字对的频率为中心 - 特别是如果您正在进行探索性数据分析。所以你可以依靠条形图/柱形图,直方图。如果不是太密集,没有太多克,词云可能是有用的。
如果您谈论ML结果,那么您可能会更少依赖可视化,更多地依赖于预测和系数。
我刚刚为我的Coursera课程做了一些探索性的文本分析:http://rpubs.com/polyoptik/coursera-capstone-milestone-report
我很乐意进一步讨论,我发现这项工作令人兴奋。