自然语言处理(NLP)是人工智能的子领域,涉及从自然语言数据转换或提取有用信息。方法包括机器学习和基于规则的方法。
加载spacy模型时出错AttributeError:module'msgpack._unpacker'没有属性'unpack'
我在为spacy 2.0.8加载模型时遇到问题,但对于以前的版本2.0.7也是如此。你有什么想法吗?在此先感谢nlp = spacy.load('en_core_web_lg',...
假设我有100条推文。在这些推文中,我需要提取:1)食品名称,以及2)饮料名称。推文的例子:“昨天我吃了可口可乐,午餐吃了热狗,还有一些bana分开......
如何使用Stemmer或Lemmatizer来阻止特定的单词
我目前正试图阻止一个大的语料库(aprox。800k句子)。我设法阻止了基本的一个。现在的问题是我只想阻止一个特定的单词,例如这个方法只...
我之前的帖子的更新,有一些变化:说我有100条推文。在这些推文中,我需要提取:1)食品名称,以及2)饮料名称。我还需要附上类型(饮料或食物)和......
我在改进的Lansky算法之后实现了简单的音节化算法,但是当我需要在语料库上运行这个算法超过200万字时它真的很慢。有人能指点我......
Stanford jawanslup regisonsoneroter apostarrope
RegexNERAnnotator似乎无法识别撇号。属性property = new Properties(); properties.setProperty(“annotators”,“tokenize,ssplit,pos,lemma,ner,entitymentions,regexner,...
如何获取path_similarity得分最高的synset
我理解以下代码使用syn2的synset迭代syn1的所有synset。我的问题是,如何获得最高分的synset?来自nltk.corpus import ...
使用Google NLP API将实体字符串传递给主要活动(Android)
我能够从我的主活动类中将一个字符串(一个句子)传递给Google的NLP API(在一个名为NLPService.java的单独类中配置),但我希望能够返回结果(某个...
假设我们有一个RNN模型,它输出在语料库上训练的给定上下文(或没有上下文)的单词的概率。我们可以将序列中每个单词的概率链接起来以获得整体...
在wn.all_synsets('n')中使用这个[x for x]我可以在NLTK的帮助下从Wordnet获取所有名词的所有名词。列表allnouns看起来像这个Synset('pile.n.01'),Synset('...
我使用sklearn的TfIdf。我想学习文档之间的相似性。但是,这些文档包含的标题比文档的其他部分带来更多信息。是否有可能 ...
我想在每次迭代后保存到Spacy自定义NER模型。我们是否有任何类似于tensorflow中的API,以便在每个/确定没有后保存模型权重。迭代。然后我可以......
我在spaCy中使用自定义标记器训练了一个自定义NER模型。我想在没有tokenizer的情况下保存NER模型。我在spaCy支持论坛中找到了以下代码:import ...
是否可以通过斯坦福最大熵分类器对新数据进行分类而不创建包含所有功能的外部文件?换句话说,我在下面有一个测试文件......
我如何使用NLTK模块来编写名词的单数和复数形式,或者告诉它在搜索单词的txt文件时不要区分单数和复数?我可以用NLTK制作......
我正在进行一些情绪分析。我需要在文本中计算词汇(不同的单词)。 ngram UDF似乎在确定unigrams方面做得很好。我想知道...
我正致力于从医学文本中提取信息(非常新的NLP!)。目前,我有兴趣找到并提取预定义药物清单中提到的药物。为......
让我说我有这样的话:“我的名字是John James Doe”{“rasa_nlu_data”:{“common_examples”:[{“text”:“我的名字是John James Doe”,“......
如何解决这个问题呢 ..?使用概念依赖性谓词演算/逻辑概念图来表示以下句子a)所有狗吠。 b)没有校车是紫色的。 C) ...