Jupyter:从 Visual Studio Code 数据查看器生成数据帧代码创建?

问题描述 投票:0回答:1

我在 Visual Studio Code 中使用 Jupyter 笔记本。

在分析大型数据集的多个步骤之后,我创建了一个简短的摘要数据框,列出了独特的数据。 在VS Code中,使用数据查看器,我可以在数据查看器中查看数据。 在 VS Code 中,使用数据查看器,我可以将其导出为 CSV。

问题:

  1. 有没有办法从 VS Code 自动生成静态生成结果数据帧 (df2) 所需的 Python 代码
  2. 或者,Python 或 Pandas 是否有本地方法来生成此 Python 代码?

示例(简化):

我从df1开始。 我从中导出 df2。

import pandas as pd

df1 = pd.DataFrame({'name': ['alice', 'bob', 'frank', 'carole', 'yuchen', 'navid'],
                   'role': ['dev', 'dev', 'dev', 'qa', 'ux', 'ux'],
                   'team': ['avengers', 'avengers', 'marvel', 'marvel', 'avengers', 'gotham'],
                   'country': ['china', 'china', 'US', 'US', 'china', 'US']})

df2 = df1[df1.country=='US']
display(df2)

我可以在 VS Code 数据查看器中查看 df2 的内容。 我可以将数据导出为 CSV。

我还可以自动生成重新创建此类数据结构(和关联数据)所需的代码吗?例如,可以通过单击 VS Code 中的某个位置(在数据查看器中?)。或者也可以通过在数据框上调用 Python 方法来实现。

目标是提供类似下面的内容,其中包含重新创建 df2 结构所需的数据和代码:

df2 = pd.DataFrame({'name': ['frank', 'carole', 'navid'],
                   'role': ['dev','qa', 'ux'],
                   'team': ['marvel', 'marvel', 'gotham'],
                   'country': ['US', 'US', 'US']})

再次强调:这不是要漂亮地打印数据框,而是要获取创建结构和数据所需的 Python 代码。

谢谢!

python pandas visual-studio-code jupyter data-wrangling
1个回答
0
投票

我猜你可能想要实现这样的东西:

这是代码:

import pandas as pd

df1 = pd.DataFrame({'name': ['alice', 'bob', 'frank', 'carole', 'yuchen', 'navid'],
                   'role': ['dev', 'dev', 'dev', 'qa', 'ux', 'ux'],
                   'team': ['avengers', 'avengers', 'marvel', 'marvel', 'avengers', 'gotham'],
                   'country': ['china', 'china', 'US', 'US', 'china', 'US']})

df2 = df1[df1.country=='US']

code = f"df2 = pd.DataFrame({df2.to_dict(orient='list')})"
print(code)
© www.soinside.com 2019 - 2024. All rights reserved.