处理多个文件,并为每个文件写一个csv文件。

问题描述 投票:0回答:1

我写了一段代码,对于单个文件来说很好用,但是我必须改变每个文件的名称。它读取一个pickle文件,将其写入一个txt文件,然后在txt文件的上下文中做一些处理,并产生一个数字列表,最后将列表存储在一个数据框中,并将该数据框写入csv文件。

def get_value_of_list(bit_list):
p_number = 0
for i in bit_list:
    if i == 1:
        p_number = p_number + 1
return p_number

def cross_entropy(p, q):
    return -sum([p[i] * log2(q[i]) for i in range(len(p))])

if __name__ == "__main__":

file_name = 'pickleData_AIMchat2.txt'
pickle_file = 'AIMchat2.pickle'
pk = PickleToFile(file_name, pickle_file)
pk.create_pickle_file()
h = HexToBinary(file_name)
hex_list = h.read_file()
num_of_bits = 8

scale = 16
bin_data = []
for i in hex_list:
    bin_data.append(bin(int(i, scale))[2:].zfill(num_of_bits))

my_bit_list = []
for byte in bin_data:
    bit_list = []
    for bit in byte:
        bit_list.append(int(bit))
    num_of_one_divided_by_eight = get_value_of_list(bit_list) / 8
    my_bit_list.append(num_of_one_divided_by_eight)

cross_entropy_list = []
i = 0
while i < len(my_bit_list):
    cross = cross_entropy([my_bit_list[i]], [my_bit_list[i + 1]])
    cross_entropy_list.append(cross)
    i = i + 2

df = pd.DataFrame(cross_entropy_list)
df.to_csv(r'AIMchat2.csv', index=False, index_label=False, chunksize=1000000, header=False)

我已经改变了 create_pickle_file() 到下面的代码中去读取目录中的文件。

class PickleToFile:
    def __init__(self, name, pickle_file):
    self.name = name
    self.pickle_file = pickle_file

    def create_pickle_file(self):
    basepath = Path()
    files_in_basepath = basepath.iterdir('pickle/')
    for item in files_in_basepath:
        if item.is_file():
            checkThePickle = open(self.pickle_file, "rb")
            with open(self.name, 'w') as filehandler:
                for listItem in checkThePickle:
                    filehandler.write('%s\n' % listItem)

但由于读取文件后,它将其写入文本文件,然后再写入csv文件,我不知道该怎么做。感谢大家的建议。

python csv pickle
1个回答
1
投票

如果你正在寻找一个目录中的文件列表,并处理它们,这应该得到你想要的。

如何列出一个目录中的所有文件?

一旦你有了这个文件列表,做一个循环。

for each in list_of_files:
    process_function(each)

然后,你就可以开始了,其中 "process_function "是函数,而参数是文件名。

© www.soinside.com 2019 - 2024. All rights reserved.