pandas 相关问题

Pandas是一个用于数据处理和分析的Python库,例如统计数据,实验科学结果,计量经济学或金融学中常见的数据框架,多维时间序列和横截面数据集。 Pandas是Python中主要的数据科学库之一。

获取DataFrame列值作为具有目标dtype的数组

我想从DataFrame中获取列值,DataFrame由数组组成。通过使用DataFrame.values,返回的dtype是object,我想要的是float64。一个= pd.DataFrame({ '载体':[np.array([1.1,2,3])...

回答 2 投票 1

使用pandas dataframe python中的pii对特定列进行匿名化

我已经加载了一个带有json文件的s3存储桶,并将其解析/展平为一个pandas数据帧。现在我有一个包含175列的数据框,其中4列包含个人身份信息。一世 ...

回答 4 投票 3

布尔比较多个数据帧

我有一个问题,我想比较多个数据帧的值。这是一个片段示例:data0 = [[1,'01 -01'],[2,'01 -02']] data1 = [[11,'02 -30'],[12,'02 -25' ]] data2 = [[8,'02 -30'],[22,'...

回答 2 投票 2

pandas groupby组列索引

假设我已经获得了数据帧的分组索引列表,我想使用groupby或其他函数获取子数据帧。我知道我可以像[df [df.index.isin(group)]一样使用isin ...

回答 1 投票 2

Pandas-Python中的连接

我有一个pandas数据框,我想从列中获取值,只有当这些条目的日期列和编号列匹配时才连接它们。以下是数据表的样本。日期......

回答 1 投票 -1

熊猫:在Dataframe中存储Dataframe

我对Pandas很新,当前尝试在Dataframe中插入Dataframe时遇到了问题。我想做什么:我有多个模拟和相应的信号文件......

回答 3 投票 1

Pandas Dataframe groupby两列并总结一列

我有以下格式的pandas数据帧:d = {'buyer_code':['A','B','C','A','A','B','B','A',' C'],'dollar_amount':['2240.000','160.000','300.000','10920.000','10920.000','235 ......

回答 2 投票 2

切片多索引行 - '不能做标签索引'

我有一个包含两个级别的多索引行的数据框。级别是类型: 和 ...

回答 2 投票 0

如何使用文本数据清理数据集并将其用于分类[关闭]

我正在研究具有许多缺失值和更多分类值的数据集上的性别分类器。我应该如何将分类值转换为数值以及我应该使用哪种算法来获取...

回答 1 投票 0

带有第一行数据的Concat列名,Python 3.6 Dataframe

我想将数据帧第一行的数据添加到其列名并删除第一行。 Source DataFrame:2013K2 2013K3 2013K4 2013K5 ABC1 ABC2 ABC3 ABC4 324 5435 543 543 6543 ...

回答 4 投票 4

如果其他列中存在值,则在Dataframe中创建列

我有一个包含多个列的DataFrame。有3列包含空白行,或者如果行对应于列变量,则具有随机数字/字母字符串。我会 ...

回答 2 投票 1

如何将具有重复文本的CSV列拆分为每个可能的文本变体的拆分0-1列?

我有一个像LABEL一样的CSV,如果你想要将它分成以下内容:LABEL_a LABEL_b LABEL_c LABEL_n_o LABEL_ye_s 1 0 0 0 0 0 1 ...

回答 3 投票 1

使用属性从JSON对象创建新的GeoJSON LineString

我想将几个Json对象组合成一个带有LineStrings的GeoJSON特征集合。例如,我有以下格式错误的json对象:{“lat”:16.0269337,“lon”:40.073042,“...

回答 1 投票 0

迭代在Pandas数据帧列表上的性能变化很大

背景:我正在构建一个股票交易策略反馈者。我有2446个包含OHLCV数据的CSV。每个CSV是一个交易日的数据。我还将这些文件连接成一个单独的CSV ...

回答 1 投票 2

将分类变量的Pandas DataFrame转换为具有计数和比例的MultiIndex

我有一个包含几个分类变量的Pandas DataFrame。例如:导入pandas为pd d = {'grade':['A','B','C','A','B'],'year':['2013','2013',' 2013','2012','2012']} df = pd ....

回答 4 投票 3

在DataFrame中平衡操作数据

我有一个飞机操作的DataFrame。当天气恶劣且飞机需要使用仪器而非依赖时,仅记录IFR飞行计划(仪表飞行规则)的操作...

回答 1 投票 2

使用loc函数找出日期pandas之间的差异

我有这个数据框打开高低收盘量TimeStamp 2017-12-22 13:15:00 12935.00 13200 ....

回答 2 投票 0

为什么pandas不执行sql查询?

为什么pandas不执行sql查询?导入sqlite3导入pandas为pd#load data df = pd.read_csv('curriculumAuditReport.csv')#strip whitespace from headers df.columns = df.columns.str.strip()...

回答 1 投票 1

熊猫:数据帧字典[重复]

我有一个功能,我分析实验数据(所有单独的.txt文件)这个函数输出一个字典({})的熊猫数据帧是否有一种有效的方法来迭代这...

回答 1 投票 0

Pandas,如何将多个列组合成一个数组列

我需要将组合列作为行的所有值的concat。来源:pd.DataFrame(data = {'a':[1,2,3],'b':[2,3,4]})目标:pd.DataFrame(data = {'a':[1, 2,3],'b':......

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.