data-manipulation 相关问题

数据操作是将数据从不太有用的状态更改为更有用的状态的过程。

如何通过合并列将特定数据帧转换为序列

给出以下数据,其中3表示是,2表示否t = pd.DataFrame({“ v_1”:[2,2,3],“ v_2”:[2,3,2],“ v_3”: [3,2,2],})看起来像v_1 v_2 v_3 0 2 2 3 1 2 3 ...

回答 4 投票 0

(基本)在R中的组内相减并相乘

我想在每个X组的R中编写以下代码:(Y-1)* 1/3 * Z / 100因此,第2行的输出为:(2-1)* 1/3 * 25/100 = 0.083第2行和第8行的期望输出也作为示例添加了...

回答 1 投票 1

分组以在data.table中形成多个逗号分隔的列

问题:我基本上想根据data.table语法对数据进行分组,并并行创建两个或多个包含逗号分隔值的列(如下例所示)。方法:我认为...

回答 1 投票 1

通过R中的连续波删除具有相同值的行

我拥有一波又一波的友谊关系的面板数据框。我要删除连续出现的友谊关系,而只保留不连续的友谊关系。通过不连续的...

回答 2 投票 0

创建数组并将对象推入数组后,对象是[Object],而不是实际数据

在节点中,我试图将对象数组从S3(解析时超级烦人的响应)转变为更可用的前端。初始对象格式为:[{键:'some / folder / ...

回答 1 投票 0

如何基于“长”数据集创建新比率

这里是一个样本数据集:结构(list(LD_wday = c(6,2,6,1,1,4,4,7,6,1,3,1,3,6,1,6,6,4,7, 7,6,2,7,1,5,2,2,2,2,3,5,5,1,2,5,1,6,3,4,4,3,4,1,6,3,6, 2,6,5,5,5,4,3,...

回答 1 投票 0

过滤csv中的唯一值并将计数添加为新列

我有一个非常大的csv(5000万条记录,或多或少)文件,具有不同的列,例如:id,州,城市,来源,目的地,url,类型。在此文件中,我要检查每个重复的值,.. 。

回答 2 投票 0

在r中条件为FALSE时分配唯一ID

我需要分配唯一的ID,但是,除了大小减小以外,没有其他标识变量。我创建了一个TRUE / FALSE语句的向量,并且我想在...

回答 1 投票 0

将多个str编辑为单个.txt文件python

我已经使用硒从网页上抓取了一些评论,并将其保存到文本文件中。现在,我想对文本文件进行多次编辑,然后再次保存。我试图将以下分组...

回答 1 投票 1

将行成批放置到R中的列中

我的data.frame df看起来像这样:A 1 A 2 A 5 B 2 B 3 B 4 C 3 C 7 C 9我希望它看起来像这样:ABC 1 2 3 2 3 7 5 4 9 spread(),但可能方式不正确。有任何想法吗?

回答 1 投票 0

“ if”语句不适用于np.abs(np.max(f_5.all()))

对于ii在范围(0,70)中:对于jj在范围(0,70)中:对于k在范围(0,50)中,f_max = 0:如果np.abs(np.max(f_5.all()) )> f_max:f_max = f_5#(+/-)...

回答 1 投票 0

if语句不适用于np.abs(np.max(f_5.all()))

对于ii在(0,70)范围内:对于jj在(0,70)范围内:f_max = 0对于k在(0,50)范围内:如果np.abs(np.max(f_5.all()) )> f_max:f_max = f_5#(+/-)idx = k,此处f_5 ...

回答 1 投票 0

带收集的Dplyr变换

我正在尝试使用dplyr整理一个daraframe,但是我遇到了问题。我知道的数据看起来像这样:。$ AIC.x $ k_neigh_numb.x $ term $ estimate $ std.error $ Region ...

回答 1 投票 0

如何将带有列表的字典解包到数据框中?

我有一个从循环中生成的字典,如下所示:dict_items([('cm_Classification0.1',[FP 16 TP 13 TN 1名称:cm_Classification0.1,dtype:int64]),('cm_Classification0.2' ,[...

回答 1 投票 0

R dplyr-按名称模式重新排列列

我有一些长格式的数据,其中1)需要调整为较宽的宽度,然后2)需要根据其名称的样式对列进行排序。示例数据如下:#Orignial数据set.seed(100)...

回答 1 投票 2

从熊猫格式化Excel工作表

我正在使用以下代码将数据帧打印到csv; writer = pd.ExcelWriter('dataframe.xlsx',engine ='xlsxwriter')df.to_excel(writer,sheet_name ='dataframe')writer.save()但是我的df是...

回答 1 投票 1

pandas-查找每个用户的首次出现次数

我的熊猫数据帧如下:userID值步骤1错误1 1错误2 1良好3 2良好1 2不良2 ... 3000良好...

回答 1 投票 0

将ntile函数应用于具有不同存储桶大小的数据帧列表

我想在数据帧列表上使用dplyr的ntile函数或类似函数,但对每个数据帧使用不同的n。我的列表包含150个数据帧,因此需要手动解决方案,例如...

回答 1 投票 0

如何基于R中的单行将行转换为列?

我有一个看起来像这样的数据集AB 1960 1970 1980 xa 1 2 3 xb 1.1 2.1 NA ya 2 3 4 yb 1 NA 1我要转换列...

回答 3 投票 0

我如何实现以下输出(python)

[能否请您帮我重塑数据,如下所示:输入DF导入熊猫为pd df = pd.DataFrame({'1':[14561,'X store','Sales Quantity',1],'2': [14561,'X store','Net Sales',2],...

回答 2 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.