我一直在使用 DataCamp 课程中的
Salary.csv
存档,我想复制它的一个子集以在 StackOverflow 上显示它,但我无法做到这一点,因为它存储为 DataFrame,我必须手动退出索引并写入逗号。
我知道一种方法是使用
str.replace()
(或者我认为),但我不确定如何做到这一点,因为值之间有空格并且看起来很复杂。
我为此创建了一个示例。假设我根据低中位数选择一个子集:
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
import random
# Howdo we know the number of executives?
random.seed(3)
num_entries = 100
salaries = [random.randint(0,100000) for x in range(num_entries)]
#Mapping salaries to salary_levels:
def map_salary_level(salary):
if salary <= 25000:
return "Entry"
elif salary <= 50000:
return "Mid"
elif salary <= 75000:
return "Senior"
else:
return "Executive"
salary_levels = [map_salary_level(salary) for salary in salaries]
data = {"Salary_USD": salaries, "Salary_Level": salary_levels}
salaries_df = pd.DataFrame(data)
salaries_median = salaries_df["Salary_USD"].quantile(0.5)
low50_salaries = salaries_df[["Salary_USD","Salary_Level"]].loc[salaries_df["Salary_USD"] <= salaries_median]
# 2. How do I paste this values in another .py archive to create a new df?
print(low50_salaries)
我的问题是,有没有办法复制或携带子集
low50_salaries
的内容以在另一个.py
存档中创建新的DataFrame?
为什么不做:
旅游结束时实际代码:
low50_salaries.to_csv("low50_salaries.csv", index=False)
在你的其他.py中:
df_low50 = read_csv("low50_salaries.csv")
您也可以导入变量,但这也取决于您的项目上下文