我有一个可以在]找到的数据集>
https://github.com/rudeboybert/JSE_OkCupid
您可以看到数据集中的每个用户都被要求撰写论文。因此,每个用户有9篇论文,分别标记为essay0,essay1,...,essay9。
我正在分析用户的文本,因此我需要创建一个名为allessays的变量,该变量将每个用户的9篇论文组合为一个变量。
作为简单的视觉效果,这就是现在写的样子。
User essay0 essay1 essay2 1 I love apples. I love bananas. I love oranges. 2 I love dogs. I love cats. I love birds. 3 I love cars. I love trucks. I love airplanes.
但是我需要它看起来像这样
User essay0 essay1 essay2 allessays
1 I love apples. I love bananas. I love oranges. I love apples. I love bananas. I love oranges.
2 I love dogs. I love cats. I love birds. I love dogs. I love cats. I love birds.
3 I love cars. I love trucks. I love airplanes. I love cars. I love trucks. I love airplanes.
我有一个数据集,可以在https://github.com/rudeboybert/JSE_OkCupid中找到您所看到的,数据集中的每个用户都被要求撰写论文。因此,每个用户有9篇文章标记为essay0,...
我不确定您将变量组合起来是什么意思,但是从您的描述来看,您似乎想要做的就是将文章背对背。