我目前正在使用R中的wordnet(我正在使用RStudio for Windows(64位))并从wordnet的data.x文件(其中x是名词,adj等)创建了包含data.frame
,synset_offset
和ss_type
的word
数据库。
可以像这样创建一个示例:
wnet <- data.frame(
"synset_offset" = c(02370954,02371120,02371337),
"ss_type" = c("VERB","VERB","VERB"),
"word" = c("fill", "depute", "substitute")
)
我的问题发生在使用wordnet包来获取我想要作为附加列添加的同义词列表时。
library(wordnet)
wnet$synonyms <- synonyms(wnet$word,wnet$ss_type)
我收到以下错误。
Error in .jnew(paste("com.nexagis.jawbone.filter", type, sep = "."), word, :
java.lang.NoSuchMethodError: <init>
如果我使用定义的值应用函数,它可以工作。
> synonyms("fill","VERB")
[1] "fill" "fill up" "fulfil" "fulfill" "make full" "meet" "occupy" "replete" "sate" "satiate" "satisfy"
[12] "take"
欢迎任何解决我的问题的建议。
由于某种原因,我无法在我的计算机上安装wordnet包,但是你似乎给了同义词函数数组参数而你不能,你应该能够通过apply来解决它。
syn_list <- apply(wnet,by=1,function(row){synonyms(row["word"],row["ss_type"])})
它将为wnet data.frame的每一行返回同义词函数的输出
目前还不清楚你想做什么:
wnet$synonyms <- synonyms(wnet$word,wnet$ss_type)
对于每一行,您将拥有一组同义词,这些同义词不适合您的data.frame的3行。
也许这样的东西对你有用:
wnet$synonyms <- sapply(syn_list,paste,collapse=", ")
编辑 - 这是上述问题的有效解决方案。
wnet$synset <- mapply(synonyms, as.character(wnet$word), as.character(wnet$ss_type))