pandas 相关问题

Pandas是一个用于数据处理和分析的Python库,例如统计数据,实验科学结果,计量经济学或金融学中常见的数据框架,多维时间序列和横截面数据集。 Pandas是Python中主要的数据科学库之一。

python pandas - 运行idxmax / argmax后得到一个列值

我正在尝试通过一些数据来查找哪类产品的收入最高。通过运行,我可以获得收入最高的类别的实际总收入:...

回答 3 投票 1

Python:导入的csv没有被拆分成正确的列

我正在使用pandas将csv文件导入python,但数据框只在一列中。我在此链接中复制并粘贴了来自玩家站立字段表的逗号分隔格式的数据(...

回答 1 投票 -2

Python - 根据Levenshtein距离将最接近的字符串从列表A分配给列表B - (理想情况下是使用pandas)

作为介绍,我对python很新,我只知道如何使用pandas主要用于数据分析。我目前有2个100多个条目的列表,“关键字”和“组”。我想生成一个......

回答 1 投票 0

根据单独列中的值替换列的值

我有一个pandas DataFrame,它看起来像:ID | StateName | ZipCode ____________________________________ 0 MD 20814 1 90210 2 ...

回答 2 投票 1

无法将对象类型转换为字符串;然后过滤该字符串; python pandas dataframe

我试图从纽约证券交易所拉出所有股票代码,然后过滤掉那些市值高于5B的股票代码。我遇到了一个问题,因为基于我的数据加载在所有列中的来源是......

回答 3 投票 1

有条理地突出Python matplotlib中的数据

我有条件地绘制pandas数据帧。假设我们有一个4 * 4数据帧,列= ['A','B','C','D'],索引= [0,1,2,3]。假设我们做了一个df.plot.bar()。对于......

回答 1 投票 -1

如何在for循环中检索Pandas GroupBy对象的行

我有一个按对象分组。我想在for循环中按对象检索组的特定列的行并进行一些处理。例如,我在这里给出一个逐个对象的示例代码df = ...

回答 1 投票 0

在pandas df.plot中设置色彩映射限制

我有一个数据框,用于绘制线条和表格。色彩映射设置为Purples_r,从紫色变为白色。如何限制色彩图,使出现的最浅色...

回答 2 投票 3

计算重叠时间戳差异和重复时间的总和

我有一个包含两列的数据框,包含会话的开始和结束时间戳:1 2017-12-04 05:26:15 2017-12-04 05:28:39 2 2017-12-04 05:26:31 2017- 12-04 05:34:36 3 2017-12-04 05:28:44 ...

回答 1 投票 0

使用Pandas处理可变数量的列 - Python

我有一个看起来像这样的数据集(最多5列 - 但可以更少)1,2,3 1,2,3,4 1,2,3,4,5 1,2 1,2,3, 4 ....我正在尝试使用pandas read_table将其读入5列数据帧。一世 ...

回答 3 投票 59

在多个Pandas列上连接2个Dataframe

考虑2个数据帧,需要使用2个唯一列(idA,idB)连接2个数据帧并计算其col距离的总和。顺便说一句(idA,idB)等于(idB,idA),所以他们的距离有......

回答 2 投票 1

pandas value_counts()不按降序排列

有一个数据框,df索引日期名称类别0 2017-08-09 ABC-SAP 1 1 2017-08-09 CDE-WAS 2 2 ...

回答 1 投票 5

Pandas转置重置十进制舍入

我在一个大型结果表中按列仔细定义小数点,但是当我将它转置为适合我的报告中的页面(使用.to_latex)时,pandas将小数设置为...

回答 1 投票 2

比较数据帧python中的2列

我正在尝试比较我的数据帧中的一行是否为某个值。例如:如果word ='bleu'和ink ='blue',我想在我的数据框'congruent'= 1中有一个新列,如果不是= 0.我写了这个......

回答 2 投票 1

Pandas Timedelta是负面的,应该是积极的,如何克服局限

我想计算提到的smth和发布日之间的差异。所以我有下一个DataFrame df_test = pd.DataFrame([{'Mention Date':pd.Timestamp('2015-09-17 12:47:06')...

回答 1 投票 1

基于分组列的条件总和

基本上,我想创建一个列ERROR RATE,它取ERROR中的YES的总和,并将其除以ERROR中的NO,但是按照每个描述的LOCATION过滤ERROR RATE。 ...

回答 1 投票 1

ValueError:Series的真值是不明确的。使用a.empty,a.bool(),a.item(),a.any()或a.all()。用于字符串比较

对于能源中的国家:如果能源[国家] =='美国':这是在大熊猫中穿越一个名为能源的数据框架。能源所有国家按字母顺序排列,国家/地区为......

回答 2 投票 1

找到第一个负值并替换为最后的非零值?

我有一个数据帧:hrs running_hrs 0 203.889578 24 1 155.929832 24 2 180.248357 24 3 112.502220 24 4 102 ....

回答 1 投票 -1

从pandas专栏中的字符串中获取第二个单词

我需要获得存储在pandas列中的句子的第二个单词。我可以轻松地用以下行获得第一个单词:df ['First'] = df ['Sentence']。astype(str).apply(lambda x:x.split()[0])...

回答 1 投票 1

创建新的DF Col值,其中X和Y之间的时间范围

示例数据我想创建一个新列,其值取决于包含日期时间或时间数据的另一列。所以当时间在[x]和[y]之间时,新列的值是Z,其中Z是......

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.