将文本数据转换为表格/csv格式

问题描述 投票:0回答:2

我需要使用 R 将文本数据(例如段落)转换为数据框(以另存为 csv 文件)。具体需求是将每个段落中的每个单词放在列中的单独单元格中。以下代码将文本转换为表格,但它将每行中的单词放入单个单元格中。您可以帮助创建一个单列数据集,其中每个单词都位于单独的单元格中吗?

    merchant <- read.delim("merchant.txt")
    write.table(merchant,file="merchant.csv",sep=",",col.names=FALSE,row.names=FALSE)
r csv export-to-csv csvtotable
2个回答
0
投票

这是我基于 tidyverse 的尝试。不要以表格的形式读入,只需以字符串的形式读入,然后分成单个单词的向量:

library(tidyverse)

## Read in text file as string
merchant <- read_file("merchant.txt") %>% 
## Remove all punctuation
gsub('[[:punct:] ]+',' ',.) %>%
## Split individual words into list vector
strsplit(" ")
## Set column equal to the vector of individual words
para <- merchant[[1]]

将其转换为数据框:

para <- as.data.frame(para)

0
投票
时间 活动 放松选择 励志名言
早上6:00 醒来 - “每天早晨我们都会重生。我们今天所做的事情最重要。”
早上6点30分 瑜伽 - “瑜伽是自我的旅程,通过自我,到达自我。” - 薄伽梵歌
上午7点30分 早餐 - “照顾好你的身体。这是你唯一可以居住的地方。” - 吉姆·罗恩
上午8:00 放松 睡觉、听音乐、看书 “放松、充电和反思。有时什么都不做也没关系。”
上午8点30分 学习课程1 - “成功是日复一日重复的小努力的总和。” - 罗伯特·科利尔
上午11点30分 午休时间 - “照顾好你的身体。这是你唯一可以居住的地方。” - 吉姆·罗恩
12:30 下午 学习2 - “做好工作的唯一方法就是热爱你所做的事情。” - 史蒂夫·乔布斯
下午2点30分 放松 睡觉、听音乐、冥想 “在运动和混乱之中,保持内心的宁静。” - 迪帕克·乔普拉
下午3:30 学习课程3 - “任何事情的专家都曾经是初学者。” - 海伦·海耶斯
下午5:30 放松 散步,练习深呼吸 “放松是生产力的关键。休息一下,充电。”
下午6:00 晚餐 - “如果一个人没有吃好饭,就无法好好思考、好好爱、好好睡觉。” - 弗吉尼亚·伍尔夫
7:00 下午 环聊 与朋友/家人共度时光,从事一项爱好 “让自己周围都是积极的人,他们会激励你、激励你。”
晚上8:00 学习课程4 - “实现明天的唯一限制是我们今天的疑虑。” - 富兰克林·D·罗斯福
晚上9点30分 皮肤护理和冥想 练习正念,进行日常护肤 “照顾好你的身体,这是你唯一可以居住的地方。” - 吉姆·罗恩
晚上10点30分 就寝时间 - “睡眠是最好的冥想。” - 达赖喇嘛
© www.soinside.com 2019 - 2024. All rights reserved.