我想根据它们的语义来对一些句子进行分类。我如何在这里使用Doc2Vec?还是有比这更好的方法?

问题描述 投票:0回答:1

我想对从源中提取的各种评论实现doc2vec。我想将这些评论分类到用户定义的不同类中。我怎样才能做到这一点?

nlp semantics word2vec doc2vec
1个回答
0
投票

我认为这是一个有趣的问题。我会根据观察/评论的大小给你一些方法。

  • 您可以应用LSA(DTM上的SVD(入射或TF-IDF向量),您将获得三个向量作为输出 - USV .V转置是句子嵌入)。

使用此嵌入作为模型的输入以进行分类。

当你的语料库大小很大时,我建议使用LSA。

资源:link

  • 以类似的方式而不是使用LSA,您可以使用预先训练的嵌入说手套,在这里您将获得用于创建文档向量的文字嵌入使用反加权频率方法。使用此文档向量进行分类。

资源:link

© www.soinside.com 2019 - 2024. All rights reserved.