dataframe 相关问题

数据框是表格数据结构。通常,它包含数据,其中行是观察值,列是各种类型的变量。虽然“数据框架”或“数据框架”是这个概念用于多种语言的术语(R,Apache Spark,deedle,Maple,Python中的pandas库和Julia中的DataFrames库),“table”是用于的术语MATLAB和SQL。

基于回溯窗口扩展pandas数据框的行

给定以下形式的数据框: 日期 窗户 0 2009-01-01 00:00:00 2 1 2009-01-02 00:00:00 1 2 2009-01-03 00:00:00 3 可以通过以下方式生成 df = pd.DataFrame({'date': pd.date_range(start='200...

回答 1 投票 0

解析列内的字符串(pandas)

我正在尝试将此数据集中的“选择投资者”列解析为各个列(例如投资者1、投资者2、投资者3):https://www.cbinsights.com/research-unicorn-companies 我

回答 1 投票 0

连接python后删除后缀

我有这个 anndata 对象: 数据1x 数据2x 数据3x 数据4x 我想将它们连接成一个 df 。 ldata1x.obs.索引 索引(['KO_d6_r1_AAACCGGCACCTCGCT-1', 'KO_d6_r1_AAAGCCGCAAGGATTA-1', '

回答 1 投票 0

如何在 lambda 中传递 3 个值

Lambda 函数运行良好: funct = (lambda a,aa,aaa: (a-aa)/aaa 如果 aa>0 否则 a/aaa) 打印(函数(200,100,2)) 我想做的是将其应用到数据框中: df[['a','aa','aaa']] us...

回答 1 投票 0

如何检查数据框中的一系列日期是否一致?

假设我有这个示例 df (但有很多日期): 库(润滑) df = data.frame(id = 1:5, date1 = dmy(c('01/02/2021','03/05/2022','01/03/2021','08/12/2021','01/02/20...

回答 1 投票 0

Pandas 循环问题:Excel 数据提取中列每 10 行重复一次

我在“for i in range(10)”循环中使用Python和Pandas从Excel文件中提取数据。但是,我遇到了一个问题,即所需的列每 10 行不断重复,而不是

回答 1 投票 0

将 If 函数应用于数据帧[重复]

我正在尝试将 IF 函数应用于数据框中的列。很简单,如果工资超过 50,000 英镑,我希望它返回“超过 50,000 英镑”,如果低于 50,000 英镑,则返回“低于 50,000 英镑”。 我已经尝试过...

回答 2 投票 0

如果条件与数据框[重复]

我想要条件是否成立,如果 df[df["tg"] > 10 且 df[df["tg"] < 32 then multiply by five otherwise divide by two. However, I get the following error ValueError: The

回答 5 投票 0

Rstudio:序列的 for 循环

我想找到回溯序列(来自collatz猜想数据)在某个点高于该序列中的起始值。 我就是这样做的: 有_回溯<- function(seq) { length_s...

回答 1 投票 0

如何对 pandas 数据框中的多列进行分组?

我正在处理来自 BoardGameGeek 的棋盘游戏数据,我想创建一个数据框,根据最小玩家数量和类别对棋盘游戏进行分组。 以下是列名称:['name', '

回答 1 投票 0

DataFrame 将数据导出到字符串时格式化失败

当我使用 for 循环分配数据值时,不应用格式化。 Python 3.10.6;熊猫1.4.4; numpy 1.23.3 从 pandas 导入 DataFrame 作为 DF 将 numpy 导入为 np 数据 = np.array([[3.017088, 113.

回答 1 投票 0

如何在ggplot2中对齐不同年份的周?

如何在 x 轴上对齐不同年份的周,以便同一个月(例如 6 月)中发生的周对齐?请注意,数据不是在同一周的不同时间收集的

回答 1 投票 0

使用 python/pandas 进行多属性数据管理

我正在开发一个从大文件中提取数据的工具。 这些数据可以根据称为 P1 和 P2 的 2 个属性进行排序,并采用以下形式: -> P1[0] : |-> P2[0] :数据 |...

回答 1 投票 0

如何使用 SQLAlchemy 高效地将大型属性读取为 pandas DataFrame?

我正在开发一个项目,其中有一个大型数据集存储在关系数据库中,特别是包含历史股票价格的“PriceHistory”表。我还有一个“股票&q...

回答 1 投票 0

如何合并两个不同的数据框

我有两个数据框 数据框1 df1 = data.frame(city = c('新泽西', '纽约', '休斯顿')) 数据框2 df2 = data.frame(city = c('新泽西', '休斯顿'), 值 = c(5, 2...

回答 2 投票 0

无法获取自定义函数的输出

我的数据表如下 序列号 学术的 年 今年 0 0.0 0 2022年 1 0.0 0 2022年 2 0.0 0 2022年 3 0.0 0 2022年 4 0.0 0 2022年 ... ... ... ... 5298 0.0 0 2019年 5299 0.0 0 2019年 5300 0.0 0 ...

回答 1 投票 0

以下 R 闪亮代码行未按预期工作

我的代码中有以下行: 匹配行索引 <- which(apply(df1, 1, identical, row_df)) Here, row_df is a dataframe with only one row. df1 is another dataframe with many rows and ex...

回答 1 投票 0

在 matplotlib 中突出显示特定的 xlabel 值

这是我的数据框...... 数据 = {'PEOI': [190, 105, 100, 150, 100, 170], 'PCHOI': [11, 6, 3, 16, 21, 8], 'STKS': [200, 250, 300, 350, 400, 450], 'CCHOI': [3, 8, 13, 18, 3, 23], 'CEOI': [154, 190, 5...

回答 1 投票 0

如何合并两个不同的表

我有两个数据框 数据框1 df1 = data.frame(city = c('新泽西', '纽约', '休斯顿')) 数据框2 df2 = data.frame(city = c('新泽西', '休斯顿'), 值 = c(5, 2...

回答 2 投票 0

在所有 pandas 数据框列名称中插入前缀

我创建了以下 pandas 数据框: 将 pandas 导入为 pd ds = {"col1":[1,2,3,4,5], "col2":[6,7,8,9,10]} df = pd.DataFrame(数据=ds) 打印(df) 看起来像这样: ...

回答 1 投票 0

© www.soinside.com 2019 - 2023. All rights reserved.