如何构建和标记非英语数据集以进行情感分析

问题描述 投票:0回答:1

最近我开始了一个关于情感分析的新项目,我应该用波斯语构建一个数据集。虽然构建数据集对于整个过程的准确性很重要,但我想在最短的时间内尽可能好地完成它。 构建和标记情感分析数据集的最优化方法是什么?

machine-learning deep-learning sentiment-analysis
1个回答
3
投票

您可以使用可用的数据集作为您的参考。获取情感分析数据集的来源有很多:

谷歌

sananalytics

kaggle

斯坦福

这里是给出各个单词的情感的数据集列表。

积极话语研究

我建议您研究上述数据集,以增加您对数据集及其标签的了解。

通常情感数据集使用有限的标签,例如 “正/负”或 “高兴”、“悲伤”、“愤怒”和“中性”或 “愤怒”、“悲伤”、“惊讶”、“恐惧”、“厌恶”、“喜悦”

希望对你有用。

© www.soinside.com 2019 - 2024. All rights reserved.