pandas 相关问题

Pandas是一个用于数据处理和分析的Python库,例如统计数据,实验科学结果,计量经济学或金融学中常见的数据框架,多维时间序列和横截面数据集。 Pandas是Python中主要的数据科学库之一。

无法导入Pandas Profiling

我无法在jupyter笔记本中导入pandas profiling。有人可以告诉我什么是错的。

回答 2 投票 1

Python |正则表达式分裂行;不是专栏

我有一个包含5个嵌套行的数据帧(全部包含以下数据)1ItWB(NL)$ 327,481,7484,148 $ 123,403,4194,1039 / 8 / 172The ExorcistWB $ 232,906,145-n / a-12/26 / 733Get OutUni。$ 176,040,6653 ,$ 143 33 ...

回答 1 投票 2

如何使用pandas删除基于特定列的重复值?

目前,我将以下数据框从Excel导入到pandas中,我想删除基于两列值的重复值。 #Python 3.5.2#熊猫库版本0.22导入...

回答 2 投票 1

Pandas合并在数据帧的子组中

考虑数据帧df:SCHOOL ID SET NAME 0 Foo 1 0 Ben 1 Foo 2 0 Ben 2 Foo 3 1 Chris 3 Foo 4 1 Joe 4 Foo 5 0 Tom 5 Bar 1 0 Harry ...

回答 1 投票 0

如何在不触发SettingWithCopyWarning [duplicate]的情况下将新列分配给DataFrame

之前在类似的例子中已经提出了这个问题,但是我所看到的答案中没有一个以令人满意的方式解决这个特殊问题(见后文)。我有一个DataFrame df和它的一个......

回答 1 投票 0

如何在apache梁中使用熊猫?

如何在Apache beam中实现Pandas?我无法在多列上执行左连接,而Pcollections不支持sql查询。甚至Apache Beam文档都没有正确构图。我检查了 ...

回答 2 投票 3

替换为先前的值

我有一些如上所示的数据帧。该计划的目标是用前一个替换某些特定值。导入pandas为pd test = pd.DataFrame([2,2,3,1,1,2,4,6,43,23,4,1,3,3,...

回答 1 投票 -1

Python:计算列中每个值的有效概率[关闭]

我有一个像这样的pandas数据框:+ ----- + ---------- + |没有|数量| + ----- + ---------- + | 1 | 100.0 | | 2 | 102.3 | | 3 | 301.2 | | 4 | 100.6 | | 5 | 120.9 | | ...... | ...

回答 2 投票 0

如何根据另一列过滤列?

我有一个这样的数据帧:XY A1 1 A2 2 A1 2 A3 3 A1 3 A1 4如果Y列的范围是1到4,我需要运行一个脚本,它返回Y的相应X值,范围是1到4。 ...

回答 1 投票 0

带有图例的Python散点图

我正在尝试为我的散点图创建一个与图中设置的颜色相匹配的图例。当我运行我的代码时,我得到两个图,颜色不匹配。有人可以帮我解决这个问题吗? #import文件......

回答 1 投票 1

pandas-将多个csv文件附加到一个HTML中并打印csv文件名

我正在使用这个脚本来获取4个html文件:#!/ usr / bin / python import pandas as pd import sys import json sys.stdout = open('output.html','wt')df = pd.read_csv( 'users.csv')print(df.to_html())For ...

回答 1 投票 1

将数据帧附加到空数据帧不起作用

我使用全局范围在我的文件顶部附近声明了一个空数据框:final_df = pd.DataFrame()我有stats_df成功打印正确的值,但是final_df在...后没有改变

回答 1 投票 0

如何找到使用Python的数据上最常用的单词? [重复]

我正在使用Python进行情感分析项目(使用自然语言处理)。我已经从twitter收集了数据并将其保存为CSV文件。该文件包含推文,主要是......

回答 2 投票 0

pandas的pd.read_table是否支持io.BytesIO和StringIO?

我有一个io.BytesIO对象,iostream,这是一个从磁盘读取的be2文件,我要将列标题附加到表/ iostream,f = io.BytesIO()f.write(b'A,B, C,D \ n')f.write(iostream ....

回答 1 投票 1

添加groupby最小/最大/计数聚合

我有以下pandas数据帧。 ex_one ex_two weight fake_date 0 228055 231908 1 2004-12-17 1 228056 228899 1 2000-02-26 2 228050 230029 1 2003-01-27 3 228055 230564 ...

回答 1 投票 1

Python Pandas,Matplotlib:绘制多索引DataFrame可能吗?

这是我的df:用户年月消息日期2017-07-21 07:55:39 Jw 2017 7嘿2017-07-21 07:55:42 Jw 2017 7 bye bye 2017-07-21 07:55:48 Jw 2017 7 ...

回答 1 投票 0

Python Pandas:宽格式到长格式但不同 - 类似于反向虚拟列

从此链接输入表Product |。下载数据价格| CS_Medium | CS_Small | SC_A | SC_B | SC_C 0 R123 | 1.18 | 0.15 | | | | 0.38 1 R234 | 0.23 | ...

回答 3 投票 1

通过考虑来自另一个表的数据来延迟日期

有一个问题,是否可以在不进行for循环的情况下完成以下操作我有一个看起来像下面的CTRY LAG AU 2 US 3的ctry表我的数据表看起来像这样......

回答 1 投票 0

将数据写入pandas数据帧的最佳方式

以下代码有效,但我有兴趣了解是否有更有效的方式写入数据帧,而不是一次只有1行。我有一个json reponse workoutSamples ...

回答 2 投票 1

如何在python中浏览数组的列

我有一个csv文件,我导入了pandas file3 ='C:/Users/asus/Desktop/spmf/lignes.csv'names = ['A','B','C','D','E' ,'F','G','H','我','J','K','L','M','N','O','P','Q'] ligne = read_csv(file3,...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.