我是python的新手。我用它来批量处理文件名和内容中包含Unicode字符的大量文本文件。我在开始时声明了编码。我能够处理Unicode内容但是当我尝试在Windows上列出文件时,这就是我得到的。
26-??????-P.txt
该文件的实际名称是
26-देहजरी-P.txt
这是我正在使用的脚本
# -*- coding: utf-8 -*-
import re
from os import listdir
allfiles = [f for f in listdir('./')]
for f in allfiles:
if f.endswith('.txt'):
print f;
我想有选择地打开和处理文本文件并输出与输入文件具有相似名称的新文件(以便以后可以匹配)。
请指导如何实现这一目标。提前致谢。
一种方法是在路径上设置Unicode。
例如:
import os
for i in os.listdir(u"C:\\Your\\Path\\Folder"): #I have used 'u' before the path
print i
输出:
26-देहजरी-P.txt