使用 R 中的 tm 将具有元数据列的数据框转换为语料库

问题描述 投票:0回答:0

将数据框转换为语料库的问题

你好,我有一个包含 4 列的 df(1 是文本,其他三列是一些附加信息)。 我想将 df 转换为语料库,以便每一行的文本都是一个文档,同一行不同列中的相应信息是元数据。 列是:

reviews  overall_grades  ambiance_grades  identifier

structure(list(reviews = c(“很棒的食物,我个人不是素食主义者(虽然我是素食主义者)但这是我第二次去 Alter,每次都感觉像是一种享受!强烈推荐,素食与否,太棒了”,“伦敦最好的素食菜单之一。比萨饼面团太好吃了!”,“食物很棒,有多种口味!我一定会回来的town.", "太棒了!会再来并推荐给朋友的。", "很难找到大楼的门,很难找到餐厅。他们的菜单上只有混合鸡尾酒,没有经典。食物美味,服务很棒,有点贵。”),overall_grades = c(“5”,“5”,“5”,“5”,“3”),ambiance_grades = c(“5”,“5”,“5”,“5 ", "3"), identifier = c("Alter", "Alter", "Alter", "Alter", "Alter")), row.names = c(NA, 5L), class = "data.frame “)

r dataframe text-mining tm corpus
© www.soinside.com 2019 - 2024. All rights reserved.