text-analysis 相关问题

data = {'documents'：[{'得分'：0.8806856870651245，'id'：'1'}，{'得分'：0.15902310609817505，'id'：'2'}，{'得分'：0.9225043058395386，'id' ：'3'}，{'得分'：0.9872093200683594，'id'：'4'}]，'错误'：...

python dictionary dataframe text-analysis

回答 1 投票 1

如何从python中的字符串arraylist中删除停用词？

我想从名为arrayList1的arraylist中删除停用词，该列表存储在数据变量中。我尝试下面的方法，但它不起作用。请帮我查一下以下代码......

python nltk text-analysis

回答 1 投票 1

如何减少语义相似的单词？

我从文档中提取了大量的单词。语料库中的词语可能意思相同。例如：“命令”和“命令”意思相同，“苹果”和“申请”并不意味着......

python-2.7 gensim word2vec text-analysis redundancy

回答 1 投票 0

unexst_tokens无法使用tidytext包处理R中的向量

我想使用tidytext包来创建一个包含'ngrams'的列。使用以下代码：library（tidytext）unnest_tokens（tbl = president_tweets，output = bigrams，...

r text-analysis tidytext

回答 1 投票 1

在Python 3中遇到了正则表达式子函数的问题

我试图从我从网站下载并使用BeautifulSoup解析的文本中删除\ x92，\ xa0等符号。然后我看到我到处都有这些符号（编码）。我是 ...

regex python-3.x nlp text-analysis

回答 1 投票 -1

关于LDA的建议

我正在尝试对一堆（约140个）文本文档进行文本分析。在预处理和删除不必要的单词和停用词之后，每个文档都有大约7000个句子（如...

python-3.x nlp gensim text-analysis

回答 1 投票 0

如果我只是'vectorizer.transform（短语）'而不适合它会发生什么？

当涉及到矢量化短语并将它们放入矩阵形式时，有些事情让我感到困惑。当您导入CountVectorizer或TfidfVectorizer时，.fit＆...的区别是什么？

transform vectorization sentiment-analysis text-analysis countvectorizer

回答 1 投票 0

单词向量是否意味着什么？

根据我的理解，单词向量仅用于与其他单词向量的关系。例如，“王”的单词向量减去“男孩”的单词向量应该给出一个向量关闭...

machine-learning data-science word2vec text-analysis word-embedding

回答 2 投票 -2

更改代码以使用多个核心

对于一个项目，我试图获得不同新闻文章的情绪。我试图使用sentimentr包来做到这一点。但是，由于我有一些文章，我试图加快这个...

r performance parallel-processing sentiment-analysis text-analysis

回答 1 投票 1

text-analysis 相关问题

最新问题