dataframe 相关问题

数据框是表格数据结构。通常,它包含数据,其中行是观察值,列是各种类型的变量。虽然“数据框架”或“数据框架”是这个概念用于多种语言的术语(R,Apache Spark,deedle,Maple,Python中的pandas库和Julia中的DataFrames库),“table”是用于的术语MATLAB和SQL。

将具有不同后缀的两个文件加载到一个数据帧中

我有一个文件目录:dog_A_final.bed dog_B_final.bed bird_A_final.bed bird_B_final.bed cat_A_final.bed cat_B_final.bed我想一次只添加两个文件到df,基于它们的前缀 - ...

回答 1 投票 -1

循环遍历每一行并写入ID(如果它存在于list - pandas中)

我想创建一个名为'LT'的新列,其中包含来自ID的值,如果该ID存在于列表lt:dataframe转换为列表中:ltlist = [1,2,3,4,5]是数据帧:org = ...

回答 2 投票 1

总结数据 - 维恩图 - 变量之间的共同值

(#我更新了我的问题,顺便提一下@Sammy ;-))我想用VennDiagram包绘制维恩图。事先,我需要正确总结我的数据,但我找不到好的......

回答 2 投票 0

使用包含嵌套列表的现有列的 出现总和创建一个新列

我有一个相对较大的数据框,如下所示:(我在这里上传了csv文件 - ufile.io/526t4)值0 [[1,92,“D”],[93,93,“C”],[ 94113, “S”],[114120, “C”],[121181, “S”],[182187“,...

回答 1 投票 1

Pandas:根据数据帧之间的比较,组合不同形状的数据帧

我有两个dfs:df1:no1 no2 other1 1 10 foo 1 50 foo 1 60 cat 1 70 cat 3 12 cat df2:no1 start stop other2 1 2 40 dog 1 ...

回答 1 投票 1

R data.frame删除因子[重复]

我有一个data.frame如下:myPhoneHTML X1 X2 X3 X4 X5 X6 X7 1品牌型号价格屏幕重量GB日期2 Apple iPhone7 24500 ...

回答 1 投票 0

R根据连续出现的值生成子因子

您有没有人知道如何连续地为具有相同值或因子的数据组制作子因子或唯一标记,以便我的数据看起来像这个值组分组1 a a ....

回答 3 投票 1

用r中的多个条件替换行值

目前我在一个项目上工作,陷入了一个问题。我必须用不同列中的两个条件替换列的行值。假设:x y m n 1 200P Jan Perm 1 ...

回答 3 投票 1

如何在python [重复]中透视数据帧

我有以下数据框:周国家年份价值类别1安哥拉2005年6 A 1安哥拉2005年13 A 1 ...

回答 2 投票 1

在Pandas Dataframe列中搜索和替换嵌套字典

有一些棘手的情况。 Pandas Dataframe df包含一个列col,它具有嵌套的字典,其值如下所示:{'code':'D104','description':'Error Occured','id':'...

回答 1 投票 1

Python pandas获取第一个和最后一个索引,如果第一个也是数据框中的组的最后一个,则重复

我正在努力获取数据框中第一次和最后一次出现ID的索引。但如果ID只出现一次,那么最后一次出现将与第一次出现相同。例如,......

回答 1 投票 2

Pandas按时间顺序重复行

我正在尝试复制我的pandas的数据框的行,并在列FROM和TO之间的几分钟内添加一个时间序列的附加列。例如,我有这个数据框。 ID FROM ...

回答 2 投票 0

Pandas DataFrames列未标识为数字

我正在使用Pandas数据框,使用位于http://archive.ics.uci.edu/ml/machine-learning-databases/credit-screening/crx.data的UCI存储库信用筛选文件。数据包含一些...

回答 2 投票 1

合并包含极值的数据帧

我有2个数据帧,df1和df2:df1输出[66]:AB 0 1 11 1 1 2 2 1 32 3 1 42 4 1 54 5 1 66 6 2 16 7 2 23 8 3 13 9 3 24 10 3 35 11 3 46 12 3 51 13 4 12 ...

回答 2 投票 -2

更改现有数据框架的架构

我想更改现有数据帧的模式,同时更改模式我遇到错误。我可以更改数据帧的现有模式。 val customSchema = StructType(Array(...

回答 2 投票 0

连接具有特定宽度整数的列

我有一个带有两个整数列的数据框'df':C1 C2 8 49 .. ..从这里,我想创建一个新列,它连接两个具有特定宽度的列。 C1应该是两位数的宽......

回答 3 投票 3

在pandas中创建列的编码列

我的pandas数据框中的列具有以下值之一[优秀,良好,平均,差,非常糟糕]。我想在同一个数据框架中创建一个列,每个列都包含[优秀,良好,平均,差...

回答 1 投票 -2

字符串操作到Dataframe

我从信用卡对帐单中提取了文本,仅对整个月内的交易进行了切片,并将其保存在列表中。这个列表长404个字符串,摘录了......

回答 1 投票 0

LableEncoder()错误(sklearn)

如何在python 3.0(Anaconda)中处理LableEncoder()?当我运行我的数据时出现错误,如'

回答 2 投票 -1

修改DataFrame索引

我有一个错误的DateTimeIndex DataFrame。小时和分钟必须向左移动:2016-07-07 00:08:30 - > 2016-07-07 08:30:00我知道如何使用正则表达式进行更改,但我不知道.. 。

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.