我正在尝试按照 example
使用 Seaborn 获得分组箱线图我可以让上面的例子工作,但是行:
tips = sns.load_dataset("tips")
根本没有解释。我已经找到 Tips.csv 文件,但我似乎无法找到有关 load_dataset 具体功能的足够文档。我尝试创建自己的 csv 并加载它,但无济于事。我还重命名了提示文件,它仍然有效......
我的问题是:
load_dataset
实际上在哪里寻找文件?我真的可以将其用于我自己的箱线图吗?
编辑:我设法使用自己的
DataFrame
来制作自己的箱线图,但我仍然想知道 load_dataset
是否除了神秘的教程示例之外还用于其他用途。
load_dataset
在 https://github.com/mwaskom/seaborn-data 上查找在线 csv 文件。这是文档字符串:
从在线存储库加载数据集(需要互联网)。
参数
名称:str 数据集名称(
.csv) https://github.com/mwaskom/seaborn-data)。您可以获得以下列表 使用 :func:name
提供可用数据集get_dataset_names
kws:字典,可选 传递给pandas.read_csv
如果您想修改在线数据集或引入您自己的数据,您可能必须使用pandas。
load_dataset
实际上返回一个 pandas DataFrame
对象,您可以通过 type(tips)
确认。
如果您已经在名为 Tips2.csv 的 csv 文件中创建了自己的数据,并将其保存在与脚本相同的位置,请使用此文件(安装 pandas 后)将其加载到:
import pandas as pd
tips2 = pd.read_csv('tips2.csv')
只是为了添加“selwyth”的答案。
import pandas as pd
Data=pd.read_csv('Path\to\csv\')
Data.head(10)
成功完成这些步骤后。 现在绘图实际上是这样的。
假设您想绘制条形图。
sns.barplot(x=Data.Year,y=Data.Salary) //year and salary attributes were present in my dataset.
这实际上适用于seaborn中的每一个绘图。
此外,我们将没有资格在 Seaborn Git 上添加我们自己的数据集。
load_dataset用于seaborn数据集;如果你想使用自己的数据集,你应该用Pandas打开(或读取)它,然后你可以使用seaborn方法来绘制图表和可视化任务。例如,在 Jupyter Notebook 中,我将自己的数据集放在本地驱动器中,将文档放在我的机器中并读取它:
import pandas as pd
import seaborn as sns
AI_df=pd.read_csv('AI.csv')
ai_cor=AI_df.corr()
sns.heatmap(ai_cor,annot=True,cmap='coolwarm',linewidths=1)
尝试使用
cache=False
:
tips = sns.load_dataset("tips", cache=False)
您需要有互联网连接,因为 csv 文件不在您的本地计算机上,因此您的计算机需要在线才能下载数据集