pandas 相关问题

Pandas是一个用于数据处理和分析的Python库,例如统计数据,实验科学结果,计量经济学或金融学中常见的数据框架,多维时间序列和横截面数据集。 Pandas是Python中主要的数据科学库之一。

如何避免覆盖列(标记列的多个条件语句)pandas

我需要将列列表更新为适当的数据类型。有1500列,但很多都是重复。我正在尝试写一个脚本,我可以说'Key'和'claim'......

回答 1 投票 0

从Pickle打开大型Pandas DataFrame后会出现大延迟

要创建一个大型pandas DataFrame(其中数据框中的每个条目都是一个浮点数据,数据和数据帧大约为30,000行和几十列),可以在字典中完成...

回答 1 投票 0

在Python中创建一个可用的'str'对象

我需要创建一个str对象,以便在更大的代码块中使用。我有一个数据集作为名为“testset”的DataFrame读入。 testset = pd.read_csv('my_dataset_path')然后我想......

回答 1 投票 0

pandas - 将选定的列和行组合在一起,对单元格的内容进行求和

如何将某些列和行合并在一起,以便合并单元格的值相加?目前,我有一个大熊猫数据框,显示机场之间的航班数量。 ...

回答 1 投票 0

Pandas数据帧合并行以删除NaN

我有一些带有一些NaN的数据框:主机名期间Teff 51 Peg 4.2293 5773 51 Peg 4.231 NaN 51 Peg 4.23077 NaN 55 Cnc 44.3787 NaN 55 Cnc 44.373 NaN 55 Cnc 44.4175 NaN 55 Cnc NaN 5234 61 ...

回答 2 投票 0

将pandas.DataFrame转换为Python中的字典列表

我有一个字典,从数据框转换如下:a = d.to_json(orient ='index')字典:{“0”:{“yr”:2017,“PKID”:“58306,57011”,“主题 “:” ABC “ ”ID“: ”T001“}, ”1“:{ ”年“:2018年,” ...

回答 5 投票 4

Python散点图设计 - 根据其他列值为x轴选择变量的特定值

我是python的新手,我目前正在尝试使用pandas和seaborn生成基于某些数据的散点图。我正在使用的数据('ErrorMedianScatter')如下(道歉......

回答 1 投票 1

Python Pandas group by iteration

我在for循环的帮助下迭代Python 3.6中的pandas数据框中的groupby列。这个问题是,如果我有大量数据,它会变慢。这是我的代码:import ...

回答 1 投票 0

将日期操作应用于整个数据框

导入pandas为pd import numpy as np df = pd.DataFrame({'year':np.repeat(2018,12),'month':range(1,13)})在这个数据框中,我有兴趣创建一个名为'year_month'的字段,每个...

回答 3 投票 1

python中具有相同维度的2个数据帧的平均值

我使用read_csv在python中导入了两个csv文件。所以现在我有2个尺寸为40x300的数据帧。我想要做的是创建一个尺寸为40x300的新csv文件,其中每个单元格将具有...

回答 1 投票 1

如何从包含一系列值的列创建新的递增值列?

我对Pandas / Python很新,所以如果这很直截了当,请道歉。我正在开展一个工作项目,可以提供一些帮助。我有一些描述血液样本位置的数据......

回答 1 投票 1

在python中对值进行排序

我正在使用python(jupyter notebook)进行一些分析。我想通过函数sort_values()在我的熊猫数据框中对我的值进行排序。首先看起来它工作正常,但它......

回答 1 投票 0

优化内存使用 - 熊猫/ Python

我目前正在处理一个包含原始文本的数据集,我应该预处理:来自nltk.token的nltk.corpus导入停用词从nltk.stem导入word_tokenize导入SnowballStemmer ...

回答 2 投票 0

pandas按组值过滤行

这是我用导入pandas练习的数据pd df = pd.read_csv(“https://raw.githubusercontent.com/mwaskom/seaborn-data/master/tips.csv”)我想过滤单个行按分组......

回答 2 投票 3

如何从Pandas,Python中查找findall结果

我想使用从excel电子表格中提取的工作表名称列中的特定模式进行提取,并仅从结果列表中检索最后一个结果。例如:...

回答 3 投票 -1

将列的百分比设置为0(pandas)

我有一个pandas数据框,我想将一些列的百分比设置为0.假设df有两列。 A B 1 6 2 7 3 8 4 4 5 9我现在想要为第一个设置B ...

回答 3 投票 2

如何绘制单个数据点?

我有以下代码来绘制一条线和一个点:df = pd.DataFrame({'x':[1,2,3],'y':[3,4,6]})point = pd.DataFrame ({'x':[2],'y':[5]})ax = df.plot(x ='x',y ='y',label ='line')ax = ...

回答 2 投票 21

为多个图表重用轴对象

我有一个带有值的pandas DataFrame和季节指标。我想为整个集创建一个密度图,然后为每个季创建一个密度图,其中应包括整体密度加上...

回答 1 投票 0

如何将熊猫组数据分配给多索引Dataframe?

目标我有一个如下所示的初始数据框:序列号数据一个数据二0 01 0.258625 0.667996 1 01 0.192356 0.723055 2 01 0.738066 0.266488 3 ...

回答 1 投票 3

Pandas对列使用函数

为什么Pandas在尝试将此函数应用于列时会抛出错误?导入pandas为pd import math data = [['LAT',“LON”],[49.00,-83.04],[41. 00,-83.04],[26.00,-83 ....

回答 1 投票 1

© www.soinside.com 2019 - 2024. All rights reserved.