dataframe 相关问题

数据框是表格数据结构。通常,它包含数据,其中行是观察值,列是各种类型的变量。虽然“数据框架”或“数据框架”是这个概念用于多种语言的术语(R,Apache Spark,deedle,Maple,Python中的pandas库和Julia中的DataFrames库),“table”是用于的术语MATLAB和SQL。

类型错误:无法转换为数字

这是我的代码: file_path = 'TEST3.csv' # 更新 CSV 文件的路径 列 = ['年份','T', 'TM', 'Tm', 'PP', 'Yields_Blé_dur'] n_steps_in、n_steps_out = 3、1 测试集年数 = 5 df = 加载_...

回答 1 投票 0

通过变换获取pandas group内的组名称

这就是我正在尝试做的事情。我在 pandas 中有以下 DataFrame: 将 numpy 导入为 np 将 pandas 导入为 pd n_列 = 3 n_样本 = 4 df = pd.DataFrame(np.arange(n_samples * n_cols).reshape(

回答 1 投票 0

在另一个字符串列中搜索一个字符串列值

我有两个名为 A 和 B 的数据框。在数据框 A 中,我有一列名为 Comments 的列,在数据框 B 中,我有一列名为 Solution 的列。 下面是 df_A 和 df_B 中两列的数据 df_A...

回答 1 投票 0

用关联的字符串替换列名称的元素

我有一个带有自动生成的列名的data.table。名称采用以下形式: 坐标系 其中 N 是一个字符(字面意思是 N),其余变量是整数。 我还有一个 .csv ......

回答 1 投票 0

将单元格与R中的数据表水平合并

我想在一行上水平合并单元格(合并2列)。 最小的、可重现的示例: 数据表(data.frame('A' = c('a', 1), 'B' = c('bc', 2), ...

回答 1 投票 0

追加不同长度的 DF Python

我有两个(或更多)循环,并且在每个循环内创建一个 DF。我想在新的 DF 中显示以下结果。我尝试编写以下代码: 表 = pd.DataFrame(列=['col_x', 'col_y', 'col_3...

回答 1 投票 0

将单独的日期和时间列与时间列中的 NaT 连接到日期时间列时出错

我们有一个日期列和时间列,如下所示,我们想要一个日期时间列 df['date'] = pd.to_datetime(df['date'], format='%Y%m%d', error='coerce').dt.date df['时间'] = pd.to_datetime(df['...

回答 1 投票 0

将单独的日期和时间列连接到日期时间列时出错(TypeError:+ 不支持的操作数类型:'DatetimeArray' 和 'str')

我们有一个日期列和时间列,如下所示,我们想要一个日期时间列 df['date'] = pd.to_datetime(df['date'], format='%Y%m%d', error='coerce').dt.date df['时间'] = pd.to_datetime(df['...

回答 1 投票 0

如何将多列矩阵转换为两列表?

我创建了一个 zscore 矩阵,如下所示 A列 L1 L2 L3 L4 L5 A 1.29 4.5 1.13 2.3 乙 3.46 5.7 C 3 8.16 2.1 6.23 我想将其转换为两列的表格,columnA 带有

回答 1 投票 0

一次从字符串中提取多个值

我正在尝试以这种格式清理字符串中的数据: 'Ti': ['88.115', '199.2', '44.4', '39.0', '1.89', '89', '0.870'] 我想提取值 [0]、值 [1] 和值 [-2]。手动执行此操作

回答 1 投票 0

合并 dfs 列表并提取索引作为新列

我有这个 dfs 列表: 我的列表<- list(structure(list(observations = c(1L, 5L), variables = c(4L, 8L)), class = "...

回答 1 投票 0

如何使用 1 来计算 pandas 数据框中的下一行?

我有一个像这样的数据框: 数据 = {'id':[1,1,1,2,2], 'prod_type':['A','B','C','A','C'], 'prod_order':[1,3,2,2,1], '产品价格':[100,150,300,10,40] “产品池”:[20...

回答 1 投票 0

使用 Python 和 Pandas 从 CSV 文件中提取和规范化嵌套 JSON 数据

问题描述: 我正在尝试使用 Pandas 库从 Python 中的 CSV 文件中提取数据。但是,CSV 文件中的数据是嵌套的 JSON 格式,并且由于

回答 1 投票 0

将 pandas df(不是 Nan)中的值替换为除前两列之外的列总和

给出以下数据: 数据= {'组织':['A','B','C','D','E','F', '汤姆': [NaN, 1, 1, 1, NaN, NaN], '凯利': [1, 1, 1, 1, NaN, 1], '瑞克': [1, 1, 1, 1, 1, 1], '戴夫':[1,NaN,1,NaN,1,NaN], “萨拉”...

回答 1 投票 0

npartitions 在 Dask 数据框中的作用是什么?

我在很多函数中看到参数npartitions,但我不明白它有什么用/有什么用。 http://dask.pydata.org/en/latest/dataframe-api.html#dask.dataframe.read_csv 头(...) 埃莱梅...

回答 2 投票 0

按条件添加小计列

您能否建议如何添加季度列,包含月份值的总和 部分 2024-03-01 00:00:00 2024-04-01 00:00:00 2024-05-01 00:00:00 2024-06-01 00:00:00 2024-07-01 00:00:00 2024-08-01 ...

回答 1 投票 0

python:矢量化 Def 仅适用于第一个条件。后续循环不受影响

我有一个矢量化的定义: def Selection_update_weights(df): # 定义“Win”的选择 Selections_win = ["W & O 2.5 (均未经测试)", "Win (未经测试) &a...

回答 1 投票 0

如何在 Pandas DataFrame 中查找特定时间窗口内每天的最高值

我有一个数据框,其中包含几天内以 5 分钟为间隔的值。我想找到每天 09:30-09:55 之间的最高值。这段代码给了我这个时间窗口内的最高值...

回答 2 投票 0

Python Pandas:查找两个数据帧的差异

将 pandas 导入为 pd a = [0.0, 0.6900000000000001, 1.3800000000000001, 1.3800000000000001, 2.0700000000000003, 2.7600000000000002, 2.76000000000000 02、3.45、4.1262、4.140000000000001、4.14000000000...

回答 1 投票 0

如何重构代码以修复 159 行 python 代码中已弃用的列表“.append”?

我们引用一位想要将数据迁移到 Hubspot 的客户的话,现在我们正在处理需要规划的数据建模和数据库问题。 在规划迁移时,我们对 Hubspot 数据进行 RTM,并且...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.