我有一个 R Markdown 文件,MyMarkdown.Rmd。该文件中的代码块引用另一个文件 MyData.RData 中存在的数据帧和其他对象。我希望能够将 R Markdown 文件提供给另一个人,并且该人能够完全复制我的结果,并且我希望能够做到这一点,而无需包含 MyData.RData 文件。有办法做到这一点吗?
此外,MyData.Rdata 文件相当大,大小在 2GB-3GB 之间(如果这有什么区别的话)。该数据是全年每次使用服务时记录的全年数据,因此数据框中大约有 600 万个观察值。
目前我确实有加载 MyData.RData 文件的代码,因为它和 R Markdown 文件都存在于同一文件夹中,但必须有更好的方法来做到这一点。
```{r load MyData, include=FALSE}
load(MyData.RData)
是的,有一种更好的方法来处理这种情况,而无需将大型 MyData.RData 文件与 R Markdown 文件一起分发。一种方法是将数据直接保存为可以轻松访问和分发的不同格式,而无需原始 .RData 文件。您可以考虑以下几种替代方法:
将数据保存为 CSV 或其他格式:
write.csv()
或 write.table()
函数将数据框保存为 CSV 文件。这样,您就可以在 R Markdown 文件中包含直接从 CSV 文件读取数据的代码。在 R 脚本中保存数据:
使用数据 API 或在线资源:
使用智能进行数据生成:
使用微小数据子集进行演示:
通过采用这些策略之一,您可以使您的 R Markdown 文件更加可移植并且独立于大型原始数据文件。每种方法都有其优缺点,因此请选择最适合您要求的一种。