我有一个名为
hourly_steps_merged
的数据集,在 Id
列中有许多唯一的 ID。我想按 Date
和 Id
对数据进行分组,因为我有一个月的数据。我想将唯一 ID 相互分层以进行比较并更好地分析数据集。我希望能够在 Seaborn 中做到这一点。
列列表:[“Id”、“ActivityHour”、“StepTotal”]
hourly_steps_merged['ActivityHour'] = pd.to_datetime(hourly_steps_merged['ActivityHour'])
hourly_steps_merged['Date'] = hourly_steps_merged['ActivityHour'].dt.date
hourly_steps_merged['Time'] = hourly_steps_merged['ActivityHour'].dt.time
hourly_steps_merged['Time'] = pd.to_timedelta(hourly_steps_merged['Time'].astype(str))
新的列列表:["Id", "ActivityHour", "StepTotal", "Date", "Time"]
行数:22099
如果我正确理解了你的要求,你可以尝试这个:
import seaborn
df = hourly_steps_merged.groupby(['Date', 'Id'])[
'StepTotal'].sum().reset_index()
sns.lineplot(data=df, x="Date", y="StepTotal", hue="Id")