我正在尝试从.txt文件的目录加载语料库,然后创建文档列表。
我以为这很简单,但是当我运行它时什么也没发生,我有什么遗漏吗?
import os.path
import re
import glob
def load_data_from_dir(path):
file_list = glob.glob('/transcripts/*.txt')
# create document list:
documents_list = []
for filename in file_list:
with open(filename, 'r', encoding='utf8') as f:
text = f.read()
f.close()
documents_list.append(text)
print("Total Number of Documents:",len(documents_list))
return documents_list
请确保在python中正确缩进代码。另外,检查代码的路径。给出绝对路径或相对路径。绝对路径会完美工作。
import os.path
import re
import glob
def load_data_from_dir():
file_list = glob.glob('./transcripts/*.txt')
# create document list:
documents_list = []
for filename in file_list:
with open(filename, 'r', encoding='utf8') as f:
text = f.read()
f.close()
documents_list.append(text)
print("Total Number of Documents:",len(documents_list))
return documents_list
load_data_from_dir()