pandas 相关问题

Pandas是一个用于数据处理和分析的Python库,例如统计数据,实验科学结果,计量经济学或金融学中常见的数据框架,多维时间序列和横截面数据集。 Pandas是Python中主要的数据科学库之一。

熊猫 - 高效的iterrow和替换

我正试图找到一种更有效地完成这个过程的方法。由于我的数据帧有大约10万行,而每行最多可包含20k个字符串。我想删除列表中的单词...

回答 1 投票 1

如何在计算两个日期之间的差异时删除“天”?

使用以下方法计算两个日期之间的差异时:df_test ['Difference'] =(df_test ['First_Date'] - df_test ['Second Date'])我得到第三列“x Days”。我怎样才能转换“......

回答 2 投票 -1

Pandas read_csv有4GB的csv

尝试使用chunksize选项在jupyter笔记本中读取4GB的csv时,我的机器是滞后的:raw = pd.read_csv(csv_path,chunksize = 10 ** 6)data = pd.concat(raw,ignore_index = True)这需要... 。

回答 1 投票 0

Python pandas:concat垂直和水平

我试图水平地连接两个数据帧。 df2包含df1中每个观察的2个结果变量。 df1.shape(242583,172)df2.shape(242583,2)我的代码是:Fin = pd.concat([df1,...

回答 1 投票 2

将组平均值分配给python / pandas中的每一行

我有一个数据框,我希望根据商店和所有商店计算平均值。我创建了计算平均值的代码,但我正在寻找一种更有效的方法。 DF收银员#...

回答 2 投票 4

当并非所有单元格都包含该分隔符时,在分隔符之前删除所有内容

我有一个带有'timezone'列的数据框。部分参赛作品被列为“国家/城市”。我希望他们只是'城市'。 stackoverflow上有类似的问题,我想出了......

回答 1 投票 1

无法导入Pandas Profiling

我无法在jupyter笔记本中导入pandas profiling。有人可以告诉我什么是错的。

回答 2 投票 1

Python |正则表达式分裂行;不是专栏

我有一个包含5个嵌套行的数据帧(全部包含以下数据)1ItWB(NL)$ 327,481,7484,148 $ 123,403,4194,1039 / 8 / 172The ExorcistWB $ 232,906,145-n / a-12/26 / 733Get OutUni。$ 176,040,6653 ,$ 143 33 ...

回答 1 投票 2

如何使用pandas删除基于特定列的重复值?

目前,我将以下数据框从Excel导入到pandas中,我想删除基于两列值的重复值。 #Python 3.5.2#熊猫库版本0.22导入...

回答 2 投票 1

Pandas合并在数据帧的子组中

考虑数据帧df:SCHOOL ID SET NAME 0 Foo 1 0 Ben 1 Foo 2 0 Ben 2 Foo 3 1 Chris 3 Foo 4 1 Joe 4 Foo 5 0 Tom 5 Bar 1 0 Harry ...

回答 1 投票 0

如何在不触发SettingWithCopyWarning [duplicate]的情况下将新列分配给DataFrame

之前在类似的例子中已经提出了这个问题,但是我所看到的答案中没有一个以令人满意的方式解决这个特殊问题(见后文)。我有一个DataFrame df和它的一个......

回答 1 投票 0

如何在apache梁中使用熊猫?

如何在Apache beam中实现Pandas?我无法在多列上执行左连接,而Pcollections不支持sql查询。甚至Apache Beam文档都没有正确构图。我检查了 ...

回答 2 投票 3

替换为先前的值

我有一些如上所示的数据帧。该计划的目标是用前一个替换某些特定值。导入pandas为pd test = pd.DataFrame([2,2,3,1,1,2,4,6,43,23,4,1,3,3,...

回答 1 投票 -1

Python:计算列中每个值的有效概率[关闭]

我有一个像这样的pandas数据框:+ ----- + ---------- + |没有|数量| + ----- + ---------- + | 1 | 100.0 | | 2 | 102.3 | | 3 | 301.2 | | 4 | 100.6 | | 5 | 120.9 | | ...... | ...

回答 2 投票 0

如何根据另一列过滤列?

我有一个这样的数据帧:XY A1 1 A2 2 A1 2 A3 3 A1 3 A1 4如果Y列的范围是1到4,我需要运行一个脚本,它返回Y的相应X值,范围是1到4。 ...

回答 1 投票 0

带有图例的Python散点图

我正在尝试为我的散点图创建一个与图中设置的颜色相匹配的图例。当我运行我的代码时,我得到两个图,颜色不匹配。有人可以帮我解决这个问题吗? #import文件......

回答 1 投票 1

pandas-将多个csv文件附加到一个HTML中并打印csv文件名

我正在使用这个脚本来获取4个html文件:#!/ usr / bin / python import pandas as pd import sys import json sys.stdout = open('output.html','wt')df = pd.read_csv( 'users.csv')print(df.to_html())For ...

回答 1 投票 1

将数据帧附加到空数据帧不起作用

我使用全局范围在我的文件顶部附近声明了一个空数据框:final_df = pd.DataFrame()我有stats_df成功打印正确的值,但是final_df在...后没有改变

回答 1 投票 0

如何找到使用Python的数据上最常用的单词? [重复]

我正在使用Python进行情感分析项目(使用自然语言处理)。我已经从twitter收集了数据并将其保存为CSV文件。该文件包含推文,主要是......

回答 2 投票 0

pandas的pd.read_table是否支持io.BytesIO和StringIO?

我有一个io.BytesIO对象,iostream,这是一个从磁盘读取的be2文件,我要将列标题附加到表/ iostream,f = io.BytesIO()f.write(b'A,B, C,D \ n')f.write(iostream ....

回答 1 投票 1

© www.soinside.com 2019 - 2024. All rights reserved.