如何读取第一列仅包含数字的 csv 文件?也就是我只想导入具有 id

问题描述 投票:0回答:0

正如你们在图片中看到的那样,我从我的教授那里收到的论文数据集有点乱...... 我现在正试图将它读入 python,但由于未划线的混乱行而遇到了很多问题。有没有办法使用 pandas(或任何其他包来导入 df)并只读取具有整数 id 的行(如圆圈区域)?这将极大地帮助和清除我目前在数据集上遇到的所有问题。

我可能忽略了一个简单的修复方法,这让这有点尴尬。

仅供参考:我无法手动处理这个问题,因为我正在处理近 300 万行,也就是一个庞大的数据集。

试图省略错误的行,但令人尴尬的是绝对失败了。

python pandas dataframe dataset missing-data
© www.soinside.com 2019 - 2024. All rights reserved.