我有一个数据集,我必须将其转换为数据框。这些数据框有 5 列(性别、组、课程、英语分数、final_score),列组有 5 个独特的组(a 组、b 组...e 组)。我需要的是在 a 组的 english_score 上绘制直方图,并将 bin 数量设置为 20。
这是一个示例代码:
import pandas as pd
import matplotlib.pyplot as plt
# assuming you have already converted your data to a data frame named df
df = df.reset_index()
# filter the rows for group a
group_a = df[df['group'] == 'group a']
# plot the histogram for english_score with 20 bins
plt.hist(group_a['english_score'], bins=20)
plt.title('English Score Histogram for Group A')
plt.xlabel('English Score')
plt.ylabel('Frequency')
plt.show()
此代码首先过滤数据框中与a组对应的行。然后,它使用 pandas 库绘制具有 20 个 bin 的 A 组的“english_score”列的直方图。最后,它使用 matplotlib 库显示直方图。
您需要编写的实际代码可能会有所不同,具体取决于数据的结构以及数据在数据框中的存储方式。话虽这么说,这个例子应该能让您大致了解如何解决这个问题。