dataframe 相关问题

数据框是表格数据结构。通常,它包含数据,其中行是观察值,列是各种类型的变量。虽然“数据框架”或“数据框架”是这个概念用于多种语言的术语(R,Apache Spark,deedle,Maple,Python中的pandas库和Julia中的DataFrames库),“table”是用于的术语MATLAB和SQL。

用 id 替换另一个数据帧中的 NA 值

我有一个数据框 df1 如下 - ID计数 11 345 22 456 33 786 44765 55 不适用 66888 77 不适用 然后我有一个 df2 如下 - ID计数 11 536 22654 33 786 44 999 55 890 66111 ...

回答 4 投票 0

pd.date_range 包含结束日期

使用 pandas 2.2.2 和 python 3.11,为什么这不给我包含结束日期的日期范围: 将 pandas 导入为 pd 开始日期 = pd.to_datetime('2023-04-05T04:01:40Z') end_date = pd.to_datetime('

回答 1 投票 0

计算和比较数据帧之间的值以创建新数据帧

假设我有 50 个数据框,其中包含日期索引和标记为是/否的列。 我想计算数据框中特定日期是/否的数量以创建新的数据框...

回答 1 投票 0

使用 Pandas 删除 Excel 文件中的索引读取

如何删除未命名的列?我知道对于 csv 文件 代码: 将 numpy 导入为 np 将 pandas 导入为 pd df.to_excel('Excel_Sample2.xlsx',sheet_name = 'NewSheet',index = False) 结果: '在...

回答 3 投票 0

PANDAS 将一列设置为索引,另一列设置为字段

我在 PANDAS 中有以下数据框: 索引 职位名称 年份 薪资 0 POL - POL 47 总部警察局长 2022 243000 1 POL -...

回答 1 投票 0

如何将数据帧划分为不丢失且连续索引的数据帧?

假设我有以下 DataFrame 指数值 0 'A' 1 个“B” 2 pd NA 3 pd NA 4'C' 5 pd NA 然后,我正在寻找一个返回接下来两个 DataFrame 的函数:

回答 1 投票 0

我试图让 pandas 将 numpy 数组转换为 Excel 文件,但我的 CPU 给了我一个错误。这是我的代码:

将 numpy 导入为 np 将 pandas 导入为 pd 数据 = { "a": np.array([1, 4, 6]), "b": np.array([6, 9, 2]) } 数据[“c”] = 数据[“a”] + 数据[“b”] df = pd。

回答 1 投票 0

保留列的第一个实例并删除其他实例,在列名称中使用部分文本

A df 有列 ABC_81、ABC_y、ABC_aa、ZXC_aa、ZXC_5、ZXC_hi: 数据 = { 'ABC_81': [1,2,3], 'ABC_y': [4, 5, 6], 'ABC_aa': [7,8,9], 'ZXC_aa': [10, 11, 12], 'ZXC_5': [13, 14, 15...

回答 1 投票 0

在 pandas 数据框的列中填充空值

我有一个包含超过 4 列的 pandas 数据框。 col1 中的某些值丢失,我想根据以下方法设置这些丢失的值: 尝试根据平均值进行设置...

回答 2 投票 0

如何找到满足每组掩码条件的第一行?

这是我的数据框: 将 pandas 导入为 pd df = pd.DataFrame( { 'a': ['x', 'x', 'x', 'x', 'x', 'y', 'y', 'y', 'y', 'y', 'y', ' y'], 'b': [1, 1, 1, 2, 2, 1, 1, 1, 2, 2, 2, 2], ...

回答 1 投票 0

用关联值填充数据框 NULL 单元格

我需要使用已填充 ColA 组的值来填充 Null 值 原来的df: 科尔A 科尔B 科尔C 猫 20 蓝色 猫 28 黄色 鱼32红 夫...

回答 2 投票 0

.pandas.series 的 str.replace 方法无法按预期工作

抱歉,不太熟悉用单独的框发布问题。 我在项目的一个特定阶段遇到了这个问题。复制如下。 将 pandas 导入为 pd # 重新创建了一个...

回答 1 投票 0

将 duckdb 结果转换为 Streamlit 支持的数据帧的更快方法?

不确定我是否在我的 Streamlit 应用程序中正确使用了 DuckDB。 在我的 Streamlit 中使用 duckdb 的全部目的是使其足够快速且响应灵敏。 导入鸭数据库 将 pandas 导入为 pd 我...

回答 1 投票 0

通过将第二个数据框直接放置在第一个数据框下方而不删除键,将两个数据框与可扩展列组合

这是我的2个数据框: 数据框1: 键1 键2 键3 键4 键5 值1 值2 值3 值4 值5 数据框2: 键1 键2 键3 值1 值2 值3 价值4价值...

回答 2 投票 0

如何绘制一个 csv 中包含的唯一数据集?

我有一个大型数据集(内部由许多没有模式顺序的子数据集组成),类似于以下内容,保存为 csv: 数据集(字符串) 时间(浮动) 值(浮点数) 数据名称1 1....

回答 1 投票 0

识别两个给定文档中相应的单词更改

我有一个 Pandas 数据框,例如: |字数 |更改类型 | doc1_段落_编号 | doc2_段落_编号 | |----------|-------------|---------- --|------------------------| | 1 ...

回答 1 投票 0

颞叶多线

我正在尝试用我的数据框绘制大叶折线。 我有这样的数据 日期时间拉丁汽车 2021-06-01 4.5 1.1 车1 2021-06-01 4.8 0.8 车1 2021-06-01 4.4 0.9 车2 2021-06-02 4.7 1.0

回答 1 投票 0

在 data.frame 上应用 strsplit 会导致意外输出

我有一个数据框和两个函数: 我的数据框: s_words<-c("one,uno","two,dos","three,tres","four,cuatro") n_nums<-c(10,20,30,40) df1 <- data.f...

回答 2 投票 0

如何在 python 中仅修改 csv 文件的标题行?

我是Python新手,但取得了不错的进展。我从 AlphaVantatge 获取数据来分析各种股票形态。我遇到的问题是数据帧的标题与...

回答 1 投票 0

如何解构极坐标中的嵌套结构(python api)?

不幸的是,我不得不处理极坐标数据框中的一些嵌套数据。 (我知道这是不好的做法)考虑数据: 数据 = { “职位”:[ { “公司&q...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.