pandas 相关问题

Pandas是一个用于数据处理和分析的Python库,例如统计数据,实验科学结果,计量经济学或金融学中常见的数据框架,多维时间序列和横截面数据集。 Pandas是Python中主要的数据科学库之一。

我在pandas数据框中有两列。一列具有相同的值(id),另一列中的对应值具有票数

id n_tickets 0 1586391 2 1 640 2 2 640 1 3 1181593 2 4 964842 1 5 780 1 6 780 1我有上述数据......

回答 2 投票 1

使用'if loop'时,Series的真值是不明确的

我有2个不等长df和df_IGR的数据帧,它们都有Lat和Lon列,我想比较一下。当我进行元素比较时,我能够提取任何列值......

回答 2 投票 0

如何计算倾斜的3D矢量的上升?

我有一个数据,显示3D空间中矢量的起点和终点的坐标,它们围绕3倍螺旋轴定向:x y z 0 38.522003 5.600998 129 ....

回答 1 投票 0

字数在数据框列中

我有一个包含大约4000个客户问题的数据集。我想了解客户最常询问的主题。我没有主题列表。我想得到永远的字数......

回答 1 投票 -4

将数据帧值转换为1D列表

我有一个数据帧如下:V Out [58]:P1 P2 P3 V1 abc V2 fgh V3 klm我想将它们全部存储在列表L中,使得:L = [a,b,c,f,g,h, k,l,m]从1行迭代到...

回答 3 投票 1

当类别是多字符串中的单个字符时创建虚拟对象

考虑我在Pandas系列中的数据s = pd.Series('1az wb58 jsui ne3'.split())s 0 1az 1 wb58 2 jsui 3 ne3 dtype:object我需要它看起来像:1 3 5 8 abeijns .. 。

回答 2 投票 3

熊猫 - 高效的iterrow和替换

我正试图找到一种更有效地完成这个过程的方法。由于我的数据帧有大约10万行,而每行最多可包含20k个字符串。我想删除列表中的单词...

回答 1 投票 1

如何在计算两个日期之间的差异时删除“天”?

使用以下方法计算两个日期之间的差异时:df_test ['Difference'] =(df_test ['First_Date'] - df_test ['Second Date'])我得到第三列“x Days”。我怎样才能转换“......

回答 2 投票 -1

Pandas read_csv有4GB的csv

尝试使用chunksize选项在jupyter笔记本中读取4GB的csv时,我的机器是滞后的:raw = pd.read_csv(csv_path,chunksize = 10 ** 6)data = pd.concat(raw,ignore_index = True)这需要... 。

回答 1 投票 0

Python pandas:concat垂直和水平

我试图水平地连接两个数据帧。 df2包含df1中每个观察的2个结果变量。 df1.shape(242583,172)df2.shape(242583,2)我的代码是:Fin = pd.concat([df1,...

回答 1 投票 2

将组平均值分配给python / pandas中的每一行

我有一个数据框,我希望根据商店和所有商店计算平均值。我创建了计算平均值的代码,但我正在寻找一种更有效的方法。 DF收银员#...

回答 2 投票 4

当并非所有单元格都包含该分隔符时,在分隔符之前删除所有内容

我有一个带有'timezone'列的数据框。部分参赛作品被列为“国家/城市”。我希望他们只是'城市'。 stackoverflow上有类似的问题,我想出了......

回答 1 投票 1

无法导入Pandas Profiling

我无法在jupyter笔记本中导入pandas profiling。有人可以告诉我什么是错的。

回答 2 投票 1

Python |正则表达式分裂行;不是专栏

我有一个包含5个嵌套行的数据帧(全部包含以下数据)1ItWB(NL)$ 327,481,7484,148 $ 123,403,4194,1039 / 8 / 172The ExorcistWB $ 232,906,145-n / a-12/26 / 733Get OutUni。$ 176,040,6653 ,$ 143 33 ...

回答 1 投票 2

如何使用pandas删除基于特定列的重复值?

目前,我将以下数据框从Excel导入到pandas中,我想删除基于两列值的重复值。 #Python 3.5.2#熊猫库版本0.22导入...

回答 2 投票 1

Pandas合并在数据帧的子组中

考虑数据帧df:SCHOOL ID SET NAME 0 Foo 1 0 Ben 1 Foo 2 0 Ben 2 Foo 3 1 Chris 3 Foo 4 1 Joe 4 Foo 5 0 Tom 5 Bar 1 0 Harry ...

回答 1 投票 0

如何在不触发SettingWithCopyWarning [duplicate]的情况下将新列分配给DataFrame

之前在类似的例子中已经提出了这个问题,但是我所看到的答案中没有一个以令人满意的方式解决这个特殊问题(见后文)。我有一个DataFrame df和它的一个......

回答 1 投票 0

如何在apache梁中使用熊猫?

如何在Apache beam中实现Pandas?我无法在多列上执行左连接,而Pcollections不支持sql查询。甚至Apache Beam文档都没有正确构图。我检查了 ...

回答 2 投票 3

替换为先前的值

我有一些如上所示的数据帧。该计划的目标是用前一个替换某些特定值。导入pandas为pd test = pd.DataFrame([2,2,3,1,1,2,4,6,43,23,4,1,3,3,...

回答 1 投票 -1

Python:计算列中每个值的有效概率[关闭]

我有一个像这样的pandas数据框:+ ----- + ---------- + |没有|数量| + ----- + ---------- + | 1 | 100.0 | | 2 | 102.3 | | 3 | 301.2 | | 4 | 100.6 | | 5 | 120.9 | | ...... | ...

回答 2 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.