我喜欢Python中的pprint模块。我经常使用它进行测试和调试。我经常使用width选项来确保输出在我的终端窗口中很好地适应。
它一直运行良好,直到他们在Python 2.7中添加了新的ordered dictionary type(我非常喜欢的另一个很酷的功能)。如果我试着漂亮地打印一个有序的字典,它就不能很好地显示出来。而不是将每个键值对放在它自己的行上,整个事物显示在一条长行上,它包含很多次并且难以阅读。
这里有没有人有办法让它打印得很好,就像旧的无序词典一样?如果我花了足够的时间,我可能会想出一些东西,可能使用PrettyPrinter.format方法,但我想知道这里是否有人知道解决方案。
更新:我为此提交了一份错误报告。你可以在http://bugs.python.org/issue10592看到它。
作为临时解决方法,您可以尝试以JSON格式转储。你丢失了一些类型的信息,但它看起来不错,并保持秩序。
import json
pprint(data, indent=4)
# ^ugly
print(json.dumps(data, indent=4))
# ^nice
你可以重新定义pprint()
并拦截对OrderedDict
的调用。这是一个简单的例子。如上所述,OrderedDict
覆盖代码忽略了可能已经传递的任何可选的stream
,indent
,width
或depth
关键字,但可以进行增强以实现它们。不幸的是,这种技术不能在另一个容器内处理它们,例如list
的OrderDict
from collections import OrderedDict
from pprint import pprint as pp_pprint
def pprint(obj, *args, **kwrds):
if not isinstance(obj, OrderedDict):
# use stock function
return pp_pprint(obj, *args, **kwrds)
else:
# very simple sample custom implementation...
print "{"
for key in obj:
print " %r:%r" % (key, obj[key])
print "}"
l = [10, 2, 4]
d = dict((('john',1), ('paul',2), ('mary',3)))
od = OrderedDict((('john',1), ('paul',2), ('mary',3)))
pprint(l, width=4)
# [10,
# 2,
# 4]
pprint(d)
# {'john': 1, 'mary': 3, 'paul': 2}
pprint(od)
# {
# 'john':1
# 'paul':2
# 'mary':3
# }
如果字典项都是一种类型,你可以使用惊人的数据处理库pandas
:
>>> import pandas as pd
>>> x = {'foo':1, 'bar':2}
>>> pd.Series(x)
bar 2
foo 1
dtype: int64
要么
>>> import pandas as pd
>>> x = {'foo':'bar', 'baz':'bam'}
>>> pd.Series(x)
baz bam
foo bar
dtype: object
这是我打印OrderedDict的方法
from collections import OrderedDict
import json
d = OrderedDict()
d['duck'] = 'alive'
d['parrot'] = 'dead'
d['penguin'] = 'exploded'
d['Falcon'] = 'discharged'
print d
print json.dumps(d,indent=4)
OutPut:
OrderedDict([('duck', 'alive'), ('parrot', 'dead'), ('penguin', 'exploded'), ('Falcon', 'discharged')])
{
"duck": "alive",
"parrot": "dead",
"penguin": "exploded",
"Falcon": "discharged"
}
如果你想按排序顺序打印带有键的字典
print json.dumps(indent=4,sort_keys=True)
{
"Falcon": "discharged",
"duck": "alive",
"parrot": "dead",
"penguin": "exploded"
}
如果您的OrderedDict的顺序是alpha排序,则以下内容将起作用,因为pprint将在打印前对dict进行排序。
pprint(dict(o.items()))
这是另一个通过在内部覆盖并使用股票pprint()
函数的答案。与我的earlier one不同,它将处理另一个容器(如OrderedDict
)中的list
,并且还应该能够处理给定的任何可选关键字参数 - 但是它对另一个提供的输出没有相同程度的控制。
它通过将stock函数的输出重定向到临时缓冲区,然后在将其发送到输出流之前将其换行来进行操作。虽然产生的最终输出并不是特别漂亮,但是它可以“足够好”用作解决方法。
更新2.0
通过使用标准库textwrap
模块简化,并修改为在Python 2和3中工作。
from collections import OrderedDict
try:
from cStringIO import StringIO
except ImportError: # Python 3
from io import StringIO
from pprint import pprint as pp_pprint
import sys
import textwrap
def pprint(object, **kwrds):
try:
width = kwrds['width']
except KeyError: # unlimited, use stock function
pp_pprint(object, **kwrds)
return
buffer = StringIO()
stream = kwrds.get('stream', sys.stdout)
kwrds.update({'stream': buffer})
pp_pprint(object, **kwrds)
words = buffer.getvalue().split()
buffer.close()
# word wrap output onto multiple lines <= width characters
try:
print >> stream, textwrap.fill(' '.join(words), width=width)
except TypeError: # Python 3
print(textwrap.fill(' '.join(words), width=width), file=stream)
d = dict((('john',1), ('paul',2), ('mary',3)))
od = OrderedDict((('john',1), ('paul',2), ('mary',3)))
lod = [OrderedDict((('john',1), ('paul',2), ('mary',3))),
OrderedDict((('moe',1), ('curly',2), ('larry',3))),
OrderedDict((('weapons',1), ('mass',2), ('destruction',3)))]
样本输出:
pprint(d, width=40)
»{'john': 1, 'mary': 3, 'paul': 2}
pprint(od, width=40)
»OrderedDict([('john', 1), ('paul', 2),
('mary', 3)])
pprint(lod, width=40)
»[OrderedDict([('john', 1), ('paul', 2),
('mary', 3)]), OrderedDict([('moe', 1),
('curly', 2), ('larry', 3)]),
OrderedDict([('weapons', 1), ('mass',
2), ('destruction', 3)])]
要打印有序的字典,例如
from collections import OrderedDict
d=OrderedDict([
('a', OrderedDict([
('a1',1),
('a2','sss')
])),
('b', OrderedDict([
('b1', OrderedDict([
('bb1',1),
('bb2',4.5)])),
('b2',4.5)
])),
])
我做
def dict_or_OrdDict_to_formatted_str(OD, mode='dict', s="", indent=' '*4, level=0):
def is_number(s):
try:
float(s)
return True
except ValueError:
return False
def fstr(s):
return s if is_number(s) else '"%s"'%s
if mode != 'dict':
kv_tpl = '("%s", %s)'
ST = 'OrderedDict([\n'; END = '])'
else:
kv_tpl = '"%s": %s'
ST = '{\n'; END = '}'
for i,k in enumerate(OD.keys()):
if type(OD[k]) in [dict, OrderedDict]:
level += 1
s += (level-1)*indent+kv_tpl%(k,ST+dict_or_OrdDict_to_formatted_str(OD[k], mode=mode, indent=indent, level=level)+(level-1)*indent+END)
level -= 1
else:
s += level*indent+kv_tpl%(k,fstr(OD[k]))
if i!=len(OD)-1:
s += ","
s += "\n"
return s
print dict_or_OrdDict_to_formatted_str(d)
哪个收益率
"a": {
"a1": 1,
"a2": "sss"
},
"b": {
"b1": {
"bb1": 1,
"bb2": 4.5
},
"b2": 4.5
}
要么
print dict_or_OrdDict_to_formatted_str(d, mode='OD')
产量
("a", OrderedDict([
("a1", 1),
("a2", "sss")
])),
("b", OrderedDict([
("b1", OrderedDict([
("bb1", 1),
("bb2", 4.5)
])),
("b2", 4.5)
]))
这是一种破解pprint
实施的方式。 pprint
在打印前对键进行排序,因此为了保持顺序,我们只需按照我们想要的方式对键进行排序。
请注意,这会影响items()
功能。因此,您可能希望在执行pprint后保留和恢复被覆盖的函数。
from collections import OrderedDict
import pprint
class ItemKey(object):
def __init__(self, name, position):
self.name = name
self.position = position
def __cmp__(self, b):
assert isinstance(b, ItemKey)
return cmp(self.position, b.position)
def __repr__(self):
return repr(self.name)
OrderedDict.items = lambda self: [
(ItemKey(name, i), value)
for i, (name, value) in enumerate(self.iteritems())]
OrderedDict.__repr__ = dict.__repr__
a = OrderedDict()
a[4] = '4'
a[1] = '1'
a[2] = '2'
print pprint.pformat(a) # {4: '4', 1: '1', 2: '2'}
这非常粗糙,但我只需要一种方法来可视化由任意映射和Iterables组成的数据结构,这就是我在放弃之前提出的。它是递归的,因此它将通过嵌套结构和列表很好地落下。我使用集合中的Mapping和Iterable抽象基类来处理任何事情。
我的目标是使用简洁的python代码几乎像yuml一样的输出,但是并没有完全成功。
def format_structure(d, level=0):
x = ""
if isinstance(d, Mapping):
lenk = max(map(lambda x: len(str(x)), d.keys()))
for k, v in d.items():
key_text = "\n" + " "*level + " "*(lenk - len(str(k))) + str(k)
x += key_text + ": " + format_structure(v, level=level+lenk)
elif isinstance(d, Iterable) and not isinstance(d, basestring):
for e in d:
x += "\n" + " "*level + "- " + format_structure(e, level=level+4)
else:
x = str(d)
return x
和使用OrderedDict和OrderedDicts列表的一些测试数据......(sheesh Python需要OrderedDict文字太严重......)
d = OrderedDict([("main",
OrderedDict([("window",
OrderedDict([("size", [500, 500]),
("position", [100, 900])])),
("splash_enabled", True),
("theme", "Dark")])),
("updates",
OrderedDict([("automatic", True),
("servers",
[OrderedDict([("url", "http://server1.com"),
("name", "Stable")]),
OrderedDict([("url", "http://server2.com"),
("name", "Beta")]),
OrderedDict([("url", "http://server3.com"),
("name", "Dev")])]),
("prompt_restart", True)])),
("logging",
OrderedDict([("enabled", True),
("rotate", True)]))])
print format_structure(d)
产生以下输出:
main:
window:
size:
- 500
- 500
position:
- 100
- 900
splash_enabled: True
theme: Dark
updates:
automatic: True
servers:
-
url: http://server1.com
name: Stable
-
url: http://server2.com
name: Beta
-
url: http://server3.com
name: Dev
prompt_restart: True
logging:
enabled: True
rotate: True
我在使用str.format()的过程中有一些想法,以便更好地对齐,但不想深入研究它。您需要根据所需的对齐类型动态指定字段宽度,这将变得棘手或繁琐。
无论如何,这以可读的分层方式向我显示我的数据,因此对我有用!
def pprint_od(od):
print "{"
for key in od:
print "%s:%s,\n" % (key, od[key]) # Fixed syntax
print "}"
你去^^
for item in li:
pprint_od(item)
要么
(pprint_od(item) for item in li)
我已经在python3.5上测试了这个基于haholy monkey-patch的hack,它的工作原理如下:
pprint.PrettyPrinter._dispatch[pprint._collections.OrderedDict.__repr__] = pprint.PrettyPrinter._pprint_dict
def unsorted_pprint(data):
def fake_sort(*args, **kwargs):
return args[0]
orig_sorted = __builtins__.sorted
try:
__builtins__.sorted = fake_sort
pprint.pprint(data)
finally:
__builtins__.sorted = orig_sorted
您使pprint
使用通常的基于dict的摘要,并且还禁用对调用持续时间的排序,以便实际上没有键被分类用于打印。
pprint()
方法只是调用其中的__repr__()
方法,而OrderedDict
似乎没有在它的方法中做太多(或者没有一个或者什么)。
这是一个廉价的解决方案,如果你不关心在PPRINT OUTPUT中可见的顺序应该工作,这可能是一个很大的if:
class PrintableOrderedDict(OrderedDict):
def __repr__(self):
return dict.__repr__(self)
我真的很惊讶订单没有保存......好啊。