Python串联/合并当前一个文件中的一行

问题描述 投票:0回答:4

我愿意在线连接两个文件,以便每个文件的每一行在第三个文件中连续合并。

所以我有以下代码和以下文本文件:

file1.txt
1
3
5
7

file2.txt
2
4
6

码:

from ast import literal_eval

def merge_lines():
    with open("file1.txt") as f1, open("file2.txt") as f2:
        with open("file3.txt", "r+") as tfile:
            f1_lists = (literal_eval(line) for line in f1)
            f2_lists = (literal_eval(line) for line in f2)
            for l1, l2 in zip(f1_lists, f2_lists):
                tfile.write(str(l1))
                tfile.write("\n")
                tfile.write(str(l2))
                tfile.write("\n")

combine_hands()

这很好,因为输出文件看起来像:

file3.txt
1
2
3
4
5
6

我的问题是为什么file1.txt的最后一行(编号7)没有被合并?

python merge concatenation
4个回答
3
投票

最后一行被省略,因为zip在较短的可迭代结束时停止。

你想要的可能是什么

from itertools import zip_longest
def merge_lines():
    with open("file1.txt") as f1,\
         open("file2.txt") as f2,\
         open("file3.txt", "w") as tfile:
        for l1, l2 in zip_longest(f1, f2, fillvalue="Empty line"):
            # Or you can place a sentinel value for `fillvalue` 
            # and check it and don't write to file when you see it.                
            tfile.write(l1.strip() + "\n")
            tfile.write(l2.strip() + "\n")

或者如果你不想写出来提交空行

for l1, l2 in zip_longest(f1, f2, fillvalue=None):
    if l1:                           
        tfile.write(l1)
    if l2:
        tfile.write(l2)

由于fillvalue的默认值是None,我们可以进一步简化它

for l1, l2 in zip_longest(f1, f2):
    if l1:                           
        tfile.write(l1)
    if l2:
        tfile.write(l2)

编辑

在阅读@DYZ的评论和回答后,进行了以下更改:

  1. 修复了多行“打开”语法错误。遗憾的是,我们无法使用括号对多行“with”语句进行分组。
  2. 添加了第二个选项以检查sentinel值(我在原始答案中已经提到过)。

2
投票

使用zip_longest函数,您的代码可以以非常紧凑的方式编写:

from itertools import zip_longest
with open("file1.txt") as f1,\
     open("file2.txt") as f2,\
     open("file3.txt", "w") as tfile:
        for l1, l2 in zip_longest(f1, f2, fillvalue=''):
            if l1 != '': tfile.write(l1)
            if l2 != '': tfile.write(l2)

不需要明确的阅读或类型转换。


1
投票

正如其他人提到的那样,这是因为你使用普通的zip(),最长列表(文件)的最后一行被省略.zip只会形成长度较短的列表

相反,您可以使用以下扩展拉链中的任何一个,这将填充最长的列表

    itertools.zip_longest -- in python 3.x +
    itertools.izip_longest  --in python 2.6+

0
投票

表达式zip(f1_lists, f2_lists)只返回一个元组列表,只要提供的迭代次数较短(在您的案例列表中)。因此,每个zip documentation都会出现这种情况。

如果要包含最后一行,请尝试使用itertools.ziplongest

from ast import literal_eval
from itertools import ziplongest

def merge_lines():
    with open("file1.txt") as f1, open("file2.txt") as f2:
        with open("file3.txt", "r+") as tfile:
            f1_lists = (literal_eval(line) for line in f1)
            f2_lists = (literal_eval(line) for line in f2)
            for l1, l2 in zip_longest(f1_lists, f2_lists, fillvalue='x'):
                tfile.write(str(l1))
                tfile.write("\n")
                tfile.write(str(l2))
                tfile.write("\n")

combine_hands()
© www.soinside.com 2019 - 2024. All rights reserved.