给出具有多个主题的文本,如何提取特定主题的详细信息

问题描述 投票:0回答:1

我正在研究毒品评论的情绪分析。每个评论的文字都可以包含一个或多个药物提及。文本包含针对同一疾病的多种相关药物的观点。因此,对于药物A,相同的评论可能是+ ve,对于药物B,相同的评论可能是-。我想知道是否存在任何有效的方法来提取与给定药物相关的评论,然后进行情感分析。

例如评论:[我只是认为,以一种平衡的方式呈现这一点,并理解为什么我们不从动物研究中的第一个有希望的展示直接转变为在人类身上使用药物的重要性,这一点很重要。尚有许多动物数据需要收集,而人类数据也需要收集才能让所有人知道它是安全还是有效的。您已经解决了药物A的一些不可预测性问题,其中存在无法预测的相互作用。但是一旦人们尝试了,医生就可以看到模式并弄清楚发生了什么。药物B非常令人兴奋,鉴于您对当前状况和您的个人风险承受能力所说的话,尝试尝试是有意义的。绝对不会适合所有人。

在上述评论中,对于B药物情绪为阳性而A药物情绪为阴性。因此,考虑到该文本和毒品,如何提取该毒品的相关文本。

我已经尝试过基于关键字的简单文本提取。但是并没有太大帮助。想知道是否存在任何基于nlp的方法来解决此类问题

nlp text-mining topic-modeling
1个回答
0
投票
hi i have made a similar project on this in java as well as java script 

1) you can run it "https://sentimentanalyservibhor.000webhostapp.com/"

2) git repo: just extract and run index.html
https://github.com/dev-vibhor/SentimentAnalysis_JavaScript/blob/master/SentimentAnalysisJS.zip

3) for analyzing different fields i have used n-gram algorithm
   "https://sentimentanalyservibhor.000webhostapp.com/ngram.html"

4) ngram git repo : 
https://github.com/dev-vibhor/SentimentAnalysis_JavaScript/blob/master/index.html

Bi Gram Implementation using JavaScript (N-GRAM)
__________________________________________________________
N-grams of texts are extensively used in text mining and natural language processing tasks. They are basically a set of co-occurring  words within a given window and when computing the n-grams you typically move one word forward (although you can move X words forward in more advanced scenarios). For example, for the sentence "The cow jumps over the moon". If N=2 (known as bi-grams), then the n-grams would be:
> the cow
>cow jumps
>jumps over
>over the
>the moon



_______________________________________________

for example:
text= the hotel food was good

If N=3(TRI-GRAM) and keyword== food

i will get result as

   1)the hotel food  : neutral , discard it 
   2)food was good   : positive

overall sentiment of keyword 'food'=positive


youtube: https://www.youtube.com/watch?v=qMe8wB8sOds

mail: [email protected]
© www.soinside.com 2019 - 2024. All rights reserved.