dataframe 相关问题

数据框是表格数据结构。通常,它包含数据,其中行是观察值,列是各种类型的变量。虽然“数据框架”或“数据框架”是这个概念用于多种语言的术语(R,Apache Spark,deedle,Maple,Python中的pandas库和Julia中的DataFrames库),“table”是用于的术语MATLAB和SQL。

使用 `case_when` 和 `mutate` 在多列中搜索条件

我正在尝试使用 dplyr 中的 case_when 功能在我的数据框(新)中创建一个新列。我能够运行下面的代码,但我想知道是否有办法创建这个新的

回答 1 投票 0

如何计算给定变量的哪些值以及多少个值满足另一个变量的条件?

我有一个以下形式的数据框 # 最小示例 > data.frame(变量 = c("A", "B", "C", "A", "B", "C"), + 数量 1 = c(2...

回答 1 投票 0

Polars:使用列值在when / then 表达式中引用其他列

我有一个 Polars 数据框,我想在其中使用“when/then”表达式派生一个新列。新列的值应取自同一数据帧中的不同列。然而,

回答 1 投票 0

Python Dataframe 列问题(消失)

从我之前提出的问题来看,我想递归地创建和排序某个父/子层次结构。 在一位成员的大力帮助下,他为我找到了完成这项工作的解决方案。 但是,是的...

回答 1 投票 0

使用 pandas 读取 Excel 文件时,任何使用 vlookup 到另一个表的单元格都会被读取为 NaN,有解决方法吗?

尝试将 .xlsx 文件读取到 pandas 中的数据帧时(使用 Python 3.9 和 3.12),工作表中包含 =VLOOKUP() 公式的任何单元格都会被读取为 NaN,这都发生在本地...

回答 1 投票 0

在Python中加载.data文件

我从 UCI 机器学习存储库下载了输血服务中心数据集的数据集。这两个文件是 1-输血.数据 2- 输血.名称 初学者如何才能同时加载...

回答 1 投票 0

每行不满足条件的值的计数

我想比较第1/01列中的值, 1/02、1/03、1/04、1/05、1/06 以及使用条件列中的条件的目标列中的值。我想获得所有执行过的值的计数...

回答 3 投票 0

如何将Python变量组合成单行数据框?

我有一个空数据框: dfObj = pd.DataFrame(columns=['combo', 'item1', 'item2', 'group1', 'group2', 'category1', 'category2', 'title1', 'title2']) 然后我将这些值放在单独的变量中...

回答 2 投票 0

如何从 pandas 数据框中选定的列中删除多行?

我有一个与奥林匹克运动相关的数据框,以及国家比赛和获得的奖牌数量/排名等。我的运动列表包括夏季和冬季运动会运动,我想...

回答 1 投票 0

‘data.frame’、‘tribble’和‘tibble’函数之间有什么区别?

data.frame、tribble 和 tibble 函数之间有什么区别?哪个更容易,哪个对于分析大量数据更有用?我正在创建一个数据框,但我不知道哪个......

回答 1 投票 0

在指定的 Pandas 日期范围内使用 Python math.prod()

我对Python比较陌生,但我有一个复杂的问题,我认为需要一些不同的函数,但我不知道从哪里开始。 在 Excel 中,通过使用 ...

回答 1 投票 0

截断 Pandas 数据框中固定数量的列

我有一个数据框,在某些情况下可能会增长到大量列。有时,出于显示目的,列数会变得过多。我想做的是

回答 1 投票 0

我需要合并数据框中的前两行

我的数据框采用以下格式 输入: |列1 |列2 |列3| |-----|-----|----| |ab |光盘| EF | |gh | ij |吉隆坡 | |mn |操作| qr | 我只想合并前 2 行 输出: |第 1 列|列2|列3| |----|...

回答 1 投票 0

如何从 GeoPandas MultiPolygon Geometry 列中删除 SRID=4326

我正在使用 .shp 文件中的形状数据,并使用 geopandas 将这些数据转换为我的 postgresql 表的 Multipolygons,其中包含几何类型的列(multipolygon,4326)NULL。我正在运行的问题...

回答 1 投票 0

频数表如何变换?

我正在生成一个带有代码表的频率表(data$col1,data$col2)。 col1 有是/否变量,而 col2 有 U/R 变量计数 结果表具有结构 记录 瓦尔 频率 不 右 40 是...

回答 1 投票 0

如何根据条件对多索引数据帧进行groupby

我有一个多索引数据框,我想根据某些条件组合行,并且我想组合每个索引的行。 将 pandas 导入为 pd # 数据 数据 = { '日期': ['01/01/17', '02/01/17...

回答 1 投票 0

使用 from_pandas 将 GeoDataFrame 转换为极坐标失败并出现 ArrowTypeError:未传递 numpy.dtype 对象

我尝试使用 from_pandas 将 GeoDataFrame 转换为极坐标 DataFrame。我收到一个 ArrowTypeError: Did not pass numpy.dtype object 异常。 预期结果将是带有

回答 1 投票 0

如何在 R 中创建拟合图来直观地表示时间序列数据集?

我在 R 中有一个 data.frame,其中包含来自三个地点的干旱数据: 干旱 <- data.frame("site_id" = c(1,1,1,2,2,2,2,3,3), "Drought_start" ...

回答 1 投票 0

Python - 根据另一个数据框中的列编辑和替换数据框中的列值

我是Python新手,遇到了一个问题。 df1 = pd.DataFrame({'col1': ['苹果', '香蕉', '樱桃', '苹果', '樱桃']}) df2 = pd.DataFrame({'col1': ['应用香蕉', '樱桃', '香蕉', '苹果', 'bn...

回答 1 投票 0

如何在大熊猫数据框中显示所有列的名称?

我有一个由数百列组成的数据框,我需要查看所有列名称。 我做了什么: 在[37]中: data_all2.列 输出是: 输出[37]: Index(['customer_id', '传入', 'outg...

回答 22 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.