在R
和Python
,我的一切都很好。但是,我无法阅读> 500 MB xlsx
有三张纸进入R
和Python
。想知道什么是有效的方法来阅读非常大的xlsx
到R
和Python
。谢谢
我不确定这是否解决了您的问题,但您可以尝试使用openpyxl优化模式。 openpyxl。
试试包xlsx
和openxlsx
这应该是读取数据的最快方式。
xlsx::read.xlsx2("myfile.xlsx", sheetName = "Sheet1")
它们避免内存问题的最佳方法就是不使用这种数据格式。 R中最有效的数据格式是压缩格式,如.Rdata
和.RDS
saveRDS(file, "myfile.RDS")
尺寸和速度会有很大差异:-)