dataframe 相关问题

数据框是表格数据结构。通常,它包含数据,其中行是观察值,列是各种类型的变量。虽然“数据框架”或“数据框架”是这个概念用于多种语言的术语(R,Apache Spark,deedle,Maple,Python中的pandas库和Julia中的DataFrames库),“table”是用于的术语MATLAB和SQL。

使用NAN的行逐行替换pandas数据中的最后2个数值

我的数据每行中的最后2个实数都是错误的。我想用np.NAN替换它们。实数的数量因行而异(即,每行已经有一些NAN的...

回答 1 投票 2

Spark / Scala Rdd和DataFrame的groupBy函数之间的任何工作差异[重复]

我已经检查过并且有点好奇了解RDD和DataFrame的groupBy函数。是否有任何性能差异或其他?请建议。

回答 1 投票 0

将dict转换为dataframe时,pandas的内存错误

我有一个几乎70K X 70K维度的字典变量,我想通过wd = pd.DataFrame(wordDict)将其转换为Dataframe进行进一步操作但是在工作5分钟后它会给我跟随错误:...

回答 1 投票 0

R:导出txt或csv表,其中包含utf编码的希腊字符

我在R中写了一个包含希腊字符的表,并且无法以CSV或txt文件的形式导出表(我想稍后在Latex文件中调用该表)。 #example table:parm1

回答 1 投票 1

将一列重复值添加到dataframe

我有一些季度级别的金融交易数据,所以这是一个非常大的数据集。我现在想要将以下值添加到一遍又一遍地重复的新列:[ - 12,-11,-10,-9,-8,-7,-6,-5,-4,-3,-2 ,-1,0,1,2,...

回答 3 投票 3

根据单个列信任在大熊猫中合并两条记录

我最近开始使用Pandas(Python初学者)。我试图合并来自不同ID的两个记录,并创建一个最终记录,其中包含我信任的ID中每列的值...

回答 1 投票 0

大熊猫周日开始一周使用分组日期和计算期间的事件

我有一些数据和日期列。通过运行下面的命令,它将通过DF并计算该周内发生的所有事件。 DF [ '日期']。GROUPBY(df.date.dt.to_period( “W”))。AGG( '计数' ......

回答 2 投票 1

如何在python27中的数据框中找到行中的Common元素

我有一个包含许多行的数据框,我想在行中找到一个公共元素,在该行中找到最小值,我无法找到任何内置函数。将pandas导入pd df = pd ....

回答 3 投票 1

将具有不同后缀的两个文件加载到一个数据帧中

我有一个文件目录:dog_A_final.bed dog_B_final.bed bird_A_final.bed bird_B_final.bed cat_A_final.bed cat_B_final.bed我想一次只添加两个文件到df,基于它们的前缀 - ...

回答 1 投票 -1

循环遍历每一行并写入ID(如果它存在于list - pandas中)

我想创建一个名为'LT'的新列,其中包含来自ID的值,如果该ID存在于列表lt:dataframe转换为列表中:ltlist = [1,2,3,4,5]是数据帧:org = ...

回答 2 投票 1

总结数据 - 维恩图 - 变量之间的共同值

(#我更新了我的问题,顺便提一下@Sammy ;-))我想用VennDiagram包绘制维恩图。事先,我需要正确总结我的数据,但我找不到好的......

回答 2 投票 0

使用包含嵌套列表的现有列的 出现总和创建一个新列

我有一个相对较大的数据框,如下所示:(我在这里上传了csv文件 - ufile.io/526t4)值0 [[1,92,“D”],[93,93,“C”],[ 94113, “S”],[114120, “C”],[121181, “S”],[182187“,...

回答 1 投票 1

Pandas:根据数据帧之间的比较,组合不同形状的数据帧

我有两个dfs:df1:no1 no2 other1 1 10 foo 1 50 foo 1 60 cat 1 70 cat 3 12 cat df2:no1 start stop other2 1 2 40 dog 1 ...

回答 1 投票 1

R data.frame删除因子[重复]

我有一个data.frame如下:myPhoneHTML X1 X2 X3 X4 X5 X6 X7 1品牌型号价格屏幕重量GB日期2 Apple iPhone7 24500 ...

回答 1 投票 0

R根据连续出现的值生成子因子

您有没有人知道如何连续地为具有相同值或因子的数据组制作子因子或唯一标记,以便我的数据看起来像这个值组分组1 a a ....

回答 3 投票 1

用r中的多个条件替换行值

目前我在一个项目上工作,陷入了一个问题。我必须用不同列中的两个条件替换列的行值。假设:x y m n 1 200P Jan Perm 1 ...

回答 3 投票 1

如何在python [重复]中透视数据帧

我有以下数据框:周国家年份价值类别1安哥拉2005年6 A 1安哥拉2005年13 A 1 ...

回答 2 投票 1

在Pandas Dataframe列中搜索和替换嵌套字典

有一些棘手的情况。 Pandas Dataframe df包含一个列col,它具有嵌套的字典,其值如下所示:{'code':'D104','description':'Error Occured','id':'...

回答 1 投票 1

Python pandas获取第一个和最后一个索引,如果第一个也是数据框中的组的最后一个,则重复

我正在努力获取数据框中第一次和最后一次出现ID的索引。但如果ID只出现一次,那么最后一次出现将与第一次出现相同。例如,......

回答 1 投票 2

Pandas按时间顺序重复行

我正在尝试复制我的pandas的数据框的行,并在列FROM和TO之间的几分钟内添加一个时间序列的附加列。例如,我有这个数据框。 ID FROM ...

回答 2 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.