Seaborn load_dataset

问题描述 投票:0回答:6

我正在尝试按照 example

使用 Seaborn 获得分组箱线图

我可以让上面的例子工作,但是行:

tips = sns.load_dataset("tips")

根本没有解释。我已经找到 Tips.csv 文件,但我似乎无法找到有关 load_dataset 具体功能的足够文档。我尝试创建自己的 csv 并加载它,但无济于事。我还重命名了提示文件,它仍然有效......

我的问题是:

load_dataset
实际上在哪里寻找文件?我真的可以将其用于我自己的箱线图吗?

编辑:我设法使用自己的

DataFrame
来制作自己的箱线图,但我仍然想知道
load_dataset
是否除了神秘的教程示例之外还用于其他用途。

python boxplot seaborn
6个回答
78
投票

load_dataset
https://github.com/mwaskom/seaborn-data 上查找在线 csv 文件。这是文档字符串:

从在线存储库加载数据集(需要互联网)。

参数


名称:str 数据集名称(

name
.csv) https://github.com/mwaskom/seaborn-data)。您可以获得以下列表 使用 :func:
get_dataset_names

提供可用数据集

kws:字典,可选 传递给pandas.read_csv

如果您想修改在线数据集或引入您自己的数据,您可能必须使用pandas

load_dataset
实际上返回一个 pandas
DataFrame
对象,您可以通过
type(tips)
确认。

如果您已经在名为 Tips2.csv 的 csv 文件中创建了自己的数据,并将其保存在与脚本相同的位置,请使用此文件(安装 pandas 后)将其加载到:

import pandas as pd

tips2 = pd.read_csv('tips2.csv')

10
投票

只是为了添加“selwyth”的答案。

import pandas as pd
Data=pd.read_csv('Path\to\csv\')
Data.head(10)

成功完成这些步骤后。 现在绘图实际上是这样的。

假设您想绘制条形图。

sns.barplot(x=Data.Year,y=Data.Salary) //year and salary attributes were present in my dataset.

这实际上适用于seaborn中的每一个绘图。

此外,我们将没有资格在 Seaborn Git 上添加我们自己的数据集。


0
投票

load_dataset用于seaborn数据集;如果你想使用自己的数据集,你应该用Pandas打开(或读取)它,然后你可以使用seaborn方法来绘制图表和可视化任务。例如,在 Jupyter Notebook 中,我将自己的数据集放在本地驱动器中,将文档放在我的机器中并读取它:

import pandas as pd
import seaborn as sns

AI_df=pd.read_csv('AI.csv')
ai_cor=AI_df.corr()
sns.heatmap(ai_cor,annot=True,cmap='coolwarm',linewidths=1)

0
投票

尝试使用

cache=False

tips = sns.load_dataset("tips", cache=False)

-1
投票

此处下载用于您的示例的所有 csv 文件(压缩)。

将 zip 文件解压到本地目录,然后从同一目录启动 jupyter 笔记本。 在 jupyter 笔记本中运行以下命令:

import pandas as pd
tips = pd.read_csv('seaborn-data-master/tips.csv')

您现在可以很好地使用您的示例了!


-1
投票

您需要有互联网连接,因为 csv 文件不在您的本地计算机上,因此您的计算机需要在线才能下载数据集

© www.soinside.com 2019 - 2024. All rights reserved.