pandas 相关问题

Pandas是一个用于数据处理和分析的Python库,例如统计数据,实验科学结果,计量经济学或金融学中常见的数据框架,多维时间序列和横截面数据集。 Pandas是Python中主要的数据科学库之一。

消除字典Python中的重复项

我有一个由制表符分隔的csv文件:我只需要关注两个第一列并找到,例如,如果对A-B再次作为B-A出现在文档中,如果出现B-A则打印A-B。 ......

回答 3 投票 0

Python - 循环时间性能降低

我有以下代码:#Create一个空数据框来存储项目的项目亲和力分数。 itemAffinity = pd.DataFrame(columns =('item1','item2','score'))rowCount = 0 for item1中的ind1:...

回答 1 投票 0

使用.style选项或自定义CSS的pandas to_html?

我正在关注熊猫的风格指南,它运作得很好。如何通过Outlook使用to_html命令保留这些样式?文档似乎有点缺乏我。 (df.style ...

回答 2 投票 12

使用唯一组合对数据进行分组

在我的下面的数据集中,我需要找到独特的序列并为它们分配序列号。数据集:用户年龄maritalstatus产品A年轻人结婚111 B年轻人结婚222 C年轻单身...

回答 1 投票 -3

如何在以前不知道列时填充pandas数据框

我在带有html文件的表上使用for循环进行迭代,并且在第一次迭代中我在变量名,gene_name_1,value1,gene_name_2,value2中具有以下值。 keyX和valueX是......

回答 1 投票 1

根据具有条件的其他列设置列的值

我很高兴与Pandas合作进行一些数据处理。我遇到了一个问题,它可以通过迭代这个DataFrame的行来完成,但可能会更优雅......

回答 2 投票 -1

如何以有序的方式存储大量数据?

我需要组织大量数据。我认为一个好的解决方案可能是使用熊猫DF然后腌制DF来保存它。唯一的问题,我还是不明白怎么...

回答 1 投票 0

python - 来自2个groupby列的聚合计数的最大值

我想从列名称和小时数的行数中获取最大值:导入pandas为pd小时= [8,8,9,9,8,9,10,10,8,9,12,12,10 ,11,12,12]姓名= ['A','B','......

回答 3 投票 0

如何将对象从数组更改为普通数组

这是一个.txt数据文件,其中前两行是一些标题:REC OBS REPORT TIME STATION LATI-LONGI-ELEV STN PR STN DSLP ALTIM AIR.T DEWPT R.HUM WIND ...

回答 1 投票 0

想要用Python替换某些值的列

使用的代码:def fn(x):for x in x:x = x.replace('Wood','Wooden')return x test ['Coming:'] = test ['Column:']。apply(fn)样本输出:列:即将来临:需要:木...

回答 2 投票 0

使用Pandas将列表附加到csv中的特定列

嗨大家我可以使用一些帮助,如果可能的话与Pandas:我有一个现有的csv具有以下结构:column1 column2 column3 column4 1 ww 1 Sam 2 ss 2 ...

回答 2 投票 1

每天计算实例pandas数据帧

我有一个数据帧df = pd.DataFrame(data = [[1,0],[1,0],[2,0],[2,1]],columns = ['day','class'])我想每天计算一级的实例。我用这种方式使用groupby,df.groupby(['...

回答 3 投票 0

将列添加到Multiindex Dataframe

我想在下面的df1中添加一个列SUM。它是一个Datetime MultiIndex,新列SUM应该返回价格行的总和。 multex = pd.MultiIndex.from_product([['price','weight','...

回答 1 投票 1

Python Pandas Fillna Median无效

我试图填充包含多列和多行的数据框中的所有nans。我正在使用它来训练多变量ML模型,所以我想用...填充每列的nans ...

回答 1 投票 3

Python pandas:“无法将DataFrame与类型实例合并 ”

我有两个df:df_jan_2001和df_feb_2001。我想使用以下语法进行完全外连接:new_df = pd.merge('df_jan2001','df_feb2001',how ='outer',left_on = ['names','name'],...

回答 3 投票 1

在Python中的Dataframe中查找遵循趋势的值

我有一个数据框,其中包含压缩机的信息,如下所示:压缩机的数据框:我想知道每个压缩机的加载时间。它可以通过查找...来计算

回答 1 投票 0

java.lang.String对象[]的数据类型与值meta [Date]不对应

使用Pentaho和Python插件,我有一个传入的CSV,它有两个字段,月和年,我需要创建一个日期。月包含完整的月份名称,例如“1月”,“2月”等......

回答 1 投票 0

将字符串与前一行进行比较并计算相似性Pandas

我们有什么方法可以使用Pandas来计算与列中前一行的字符串相似性?第1行:商业私人有限公司第2排:商业私人有限公司第3排:环球私人有限公司它将......

回答 1 投票 0

如果在pyspark数据帧中后续连续5'0,则获得第一个'1'条件

我有一个pyspark数据框,在user_id上每个月的事件列为0和1。我需要选择1的事件,它必须具有完全透明的行为5 0。如果这种情况......

回答 1 投票 0

如何将CSV文件转换为python字典

如果我有一个CSV(info.csv)文件如下:180101,S1,-1 180101,S2,15 180102,S4,-5 180103,S1,-5 ......这些列的意思是“日期”,“代码”,分别是“info1”。我想要 ...

回答 2 投票 1

© www.soinside.com 2019 - 2024. All rights reserved.