Python Pandas 散点图可变点大小

问题描述 投票:0回答:1

我正在尝试用 pandas 可视化日志文件。在日志文件中是带有他们正在写入的变量的文件名。我正在使用:

graph = df.plot.scatter(x='variable',y='file')

我现在的散点图显示,当某个变量写入文件时,这是正确的。它看起来像一个矩阵。我的问题是,我想通过访问发生的频率来调整点的大小。我找到的所有教程都用我没有的给定专栏对其进行了解释。

我不确定 pandas 中是否有本地方法。我正在寻找一个解决方案,如何以动态方式操纵 c 参数,以调整点大小。

python pandas scatter-plot logfile
1个回答
0
投票

一种方法是在 pandas 中使用 groupby 方法按变量和文件列对数据进行分组,然后使用 size 方法统计出现的次数。然后,您可以使用 merge 将结果合并回原始数据帧,并将结果计数用作分散方法中的 c 参数。

示例代码:

counts = df.groupby(['variable', 'file']).size().reset_index(name='count')

df = pd.merge(df, counts, on=['variable', 'file'])

df['c'] = np.interp(df['count'], (df['count'].min(), df['count'].max()), (10, 100))

df.plot.scatter(x='variable', y='file', c='c')
© www.soinside.com 2019 - 2024. All rights reserved.