我面临的问题与如何强制“运行”窗口显示给定pandas数据帧的所有列有关,而不适合窗口的大小(通过截断列名称对我来说,或者通过不显示所有列)。
换句话说,我需要将数据显示在预期的行上,如果窗口视图太小而无法显示所有列,则应显示水平条(通常情况下),以便我轻松遍历数据。
背景:我已经处理了一些数据,我以表格格式自动选择和存储特定“.h5”文件中数据的不同部分。这是使用pandas数据帧和'to_hdf'函数完成的。然后我读了它并获得以下内容:
数据集由35列(不包括时间列)组成,每个列中包含x个条目。对于这篇文章,它们被任意命名,以说明问题。
注意:
File -> Settings -> Editor -> General
中禁用软包裹我想完成三件事:
这就是我尝试过的
我使用了以下两行来改善打印输出:
pd.set_option('display.max_columns', 20)
pd.set_option('display.width', 2000)
但是,并非显示所有35列,请参阅标记(1)/“...”。分数。当我将允许的列数从20增加到40,pd.set_option('display.max_columns', 40)
时,会发生这种情况:
我们似乎又回到了原点。幸运的是,其中一个负面影响已经消失,即截断效应,即。我认为删除显示的列。
但是,列的包装仍然会发生,现在有两倍的行数,而应该可以在自己的行上显示所有内容,同时自动显示一个水平栏以让用户遍历此数据。
我也看了这个link,用pandas的set_option方法了解更多选项。除了我使用的其他线路之外,我发现并尝试了这条线,pd.set_option('expand_frame_repr', True)
。但它并没有改变我的情况。
有任何想法吗?
我在程序结束时创建了一个最终变量,比如...... end ='end'
然后我在那里放了一个调试断点,并在调试模式下运行程序。它会在结束时停止,您可以在调试模式下打开数据帧,并且可以在整个数据帧中移动,颜色编码不少,其他选项在调试模式下可用。