原始文件是一个.txt文件,由几万行和50“列”组成。
我使用指定列宽的 read_fwf 函数将文件作为数据框导入 r。问题是有些行分割不正确。
检查源文件中完全相同的行时,正确和错误拆分行之间的各个字符的位置没有差异。
X10 | X11 | X12 | X13 | X14 |
---|---|---|---|---|
EURO6;WLTP;AR;PI/CI;男,N1我 | 混合动力/柴油/E | 0010 | 36AP | 02993 |
EURO6;WLTP;AR;PI/CI;N1 III, N | 2柴油 | 000 | 236AR | 0196 |
EURO6;WLTP;AR;PI/CI;男,N1我 | 柴油 | 0002 | 36AP | 01968 |
在上面的示例中,第一行和第三行被正确拆分。第二行在 X10 和 X11 列之间错误分割。
使用MS Access导入数据集时出现同样的问题
读取数据如下图:
X10 | X11 | X12 | X13 | X14 |
---|---|---|---|---|
EURO6;WLTP;AR;PI/CI;男,N1我 | 混合动力/柴油/E | 0010 | 36AP | 02993 |
EURO6;WLTP;AR;PI/CI;N1 III, N2 | 柴油 | 0002 | 36AR | 01969 |
EURO6;WLTP;AR;PI/CI;男,N1我 | 柴油 | 0002 | 36AP | 01968 |