高效读取> 500 MB xlsx到R和Python [关闭]

问题描述 投票:-1回答:2

RPython,我的一切都很好。但是,我无法阅读> 500 MB xlsx有三张纸进入RPython。想知道什么是有效的方法来阅读非常大的xlsxRPython。谢谢

python r bigdata xlsx
2个回答
1
投票

我不确定这是否解决了您的问题,但您可以尝试使用openpyxl优化模式。 openpyxl


1
投票

试试包xlsxopenxlsx

这应该是读取数据的最快方式。

xlsx::read.xlsx2("myfile.xlsx", sheetName = "Sheet1") 

它们避免内存问题的最佳方法就是不使用这种数据格式。 R中最有效的数据格式是压缩格式,如.Rdata.RDS

saveRDS(file, "myfile.RDS")

尺寸和速度会有很大差异:-)

© www.soinside.com 2019 - 2024. All rights reserved.