我有 800 万条记录,其中包含从数据库导出为 .csv 文件的订单详细信息。我将获得多个 txt 文件,每个文件的订单号至少为 800 000。我必须检查 txt 文件中的每个订单号是否存在于 DB 文件中。
挑战:
由于它必须是一个即使是非技术用户也应该使用的工具,所以我无法想到除了在 Excel 中使用宏之外。如果有更好的选择请建议我。
而且我确信在这种情况下宏不会有效。
PowerQuery 将成为您的朋友。电报风格的步骤:
将其他 CSV 保存在另一个目录中并重复这些步骤,但在第一步中选择“数据”>“获取数据”>“从文件”>“从文件夹”。
进入 powerquery 后,删除不需要的所有列并展开(列名称旁边的双箭头)“内容”列。 => 所有 csv 现在将合并在 1 个大表中。
转到主查询并选择“主页”>“合并”> 在两个查询中选择订单号>“左连接”。 在结果表中展开列并选择至少 1 列,空行将是不匹配的,有数据的是匹配的。
您可以过滤空白(列旁边的箭头)并选择“主页”>“关闭并加载”>“表格/新工作表”。
匹配的表将被加载到PQ。
注: