我有两个csv文件,csv1是变化的工作文件,csv2是静态的并用作参考集。
csv1 - 输入.csv
csv2 - 参考.csv
我在这里找到了这篇文章https://stackoverflow.com/a/14257599这帮助我开始了,但它的处理似乎不起作用
我正在使用此代码:
with open("input.csv", "r") as csv_input, open("reference.csv", "r")as assign_csv, open("output.csv", "w") as out_file:
reader = csv.reader(csv_input)
reader2 = csv.reader(assign_csv)
writer = csv.writer(out_file)
for error in reader:
writer.writerow(error)
for group in reader2:
if group[0] in error[1]:
error[5] = group[1]
writer.writerow(error)
这可以很好地读取输入和参考文件,但在 if 语句的最底部它没有执行任何操作,我不确定为什么。基本上,我希望它循环遍历 input.csv 中的每一行并检查“类型”列中的值,然后循环遍历引用.csv,如果文本包含在那里,则写入 output.csv 中的“组”列。
目前,代码本质上只是将 input.csv 复制到 output.csv,而不向 Group 列的单元格写入任何内容。我知道循环逻辑是正确的,因为我用单独的代码示例尝试了它,它工作得很好,所以我认为我的问题是 if 语句以及我放置 writer.writerow(error) 行的位置。
此类工作必须在每个文件的单独通道中完成:首先读取参考文件并存储查找值,然后读取其他 CSV 并使用查找结构。
Python 的 dict 非常适合保存查找键和值:
lookup: dict[str, str] = {}
with open("input1.csv", newline="") as f:
reader = csv.reader(f)
next(reader) # discard header
for row in reader:
lookup[row[0]] = row[1]
查找字典看起来像:
{
"fruit": "1",
"veggie": "2",
"meat": "3",
}
查找准备就绪后,读取其他 CSV 并检查每行的类型以查看其是否在查找中。我喜欢跳过不符合条件的行,而不是添加嵌套的 if 语句:
new_rows: list[list[str]] = []
with open("input2.csv", newline="") as f:
reader = csv.reader(f)
new_rows.append(next(reader)) # append header
for row in reader:
group = lookup.get(row[1])
if group == None:
continue
row[5] = group
new_rows.append(row)
然后写入最终文件:
with open("output.csv", "w", newline="") as f:
writer = csv.writer(f)
writer.writerows(new_rows)
| Name | Type | Owner | Status | Date | Group |
|---------|--------|---------|--------------|--------|-------|
| bananas | fruit | joe | In Stock | 1/1/23 | 1 |
| apples | fruit | Jim | Out Of Stock | 1/2/23 | 1 |
| tomato | veggie | bob | In Stock | 1/3/23 | 2 |
| kiwi | fruit | jane | In Stock | 1/5/23 | 1 |
| chicken | meat | francis | Out Of Stock | 1/6/23 | 3 |
| beef | meat | linda | In Stock | 1/7/23 | 3 |