如何将 DataFrame 的子集复制到另一个 .py 存档中?

问题描述 投票:0回答:1

我一直在使用 DataCamp 课程中的

Salary.csv
存档,我想复制它的一个子集以在 StackOverflow 上显示它,但我无法做到这一点,因为它存储为 DataFrame,我必须手动退出索引并写入逗号。

我知道一种方法是使用

str.replace()
(或者我认为),但我不确定如何做到这一点,因为值之间有空格并且看起来很复杂。

我为此创建了一个示例。假设我根据低中位数选择一个子集:

import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
import random
# Howdo we know the number of executives?
random.seed(3)
num_entries = 100
salaries = [random.randint(0,100000) for  x in range(num_entries)]

#Mapping salaries to salary_levels:
def map_salary_level(salary):
    if salary <= 25000:
        return "Entry"
    elif salary <= 50000:
        return "Mid"
    elif salary <= 75000:
        return "Senior"
    else:
        return "Executive"

salary_levels = [map_salary_level(salary) for salary in salaries]

data = {"Salary_USD": salaries, "Salary_Level": salary_levels}
salaries_df = pd.DataFrame(data)

salaries_median = salaries_df["Salary_USD"].quantile(0.5)

low50_salaries = salaries_df[["Salary_USD","Salary_Level"]].loc[salaries_df["Salary_USD"] <= salaries_median]
# 2. How do I paste this values in another .py archive to create a new df?
print(low50_salaries)

我的问题是,有没有办法复制或携带子集

low50_salaries
的内容以在另一个
.py
存档中创建新的DataFrame?

python dataframe copy subset
1个回答
0
投票

为什么不做:

  • 旅游结束时实际代码:

    low50_salaries.to_csv("low50_salaries.csv", index=False)

  • 在你的其他.py中:

    df_low50 = read_csv("low50_salaries.csv")

您也可以导入变量,但这也取决于您的项目上下文

© www.soinside.com 2019 - 2024. All rights reserved.