pandas 相关问题

Pandas是一个用于数据处理和分析的Python库,例如统计数据,实验科学结果,计量经济学或金融学中常见的数据框架,多维时间序列和横截面数据集。 Pandas是Python中主要的数据科学库之一。

是否有比 df.nunique() 更好/更快的方法来查找数据帧的唯一值计数? (Python 熊猫)

我注意到 df.nunique() 大致随数据大小线性缩放。我想知道随着数据大小的增加是否有更好的解决方案?这是一个例子,如果你能来请告诉我...

回答 2 投票 0

如何根据单元格的字符串值留空/用零填充列?

我正在使用三个不同的工作表操作 Excel 文件: 理想情况下,默认情况下虚拟列必须填充零,除非学生的名字是“Roberto”或“Leonardo”...

回答 1 投票 0

如何识别 Pandas 数据框中的字符串

假设我有一个像这样的数据框: 将 pandas 导入为 pd 将 numpy 导入为 np df = pd.DataFrame( [[1,np.nan,2], [2, 3, '我'], [3, 4, 'II']], 列=['A', 'B', 'C']) df 我该怎么办

回答 4 投票 0

Pandas 如何识别数据框中的字符串

假设我有一个像这样的数据框: 将 pandas 导入为 pd 将 numpy 导入为 np df = pd.DataFrame([[1, np.nan, 2], [2, 3, '我'], [3, 4, 'II']], 列=['A', 'B', ...

回答 1 投票 0

Pandas 中的数据集需要多少 RAM?

所以这是我第一次处理大型数据集(~5gigs),我担心将数据加载到 Pandas 中。我的笔记本电脑上只有 ~4 GB 的可用内存,我担心如果我...

回答 1 投票 0

Pandas 中的 RAM 使用情况

所以这是我第一次处理大型数据集(~5gigs),我担心将数据加载到 Pandas 中。我的笔记本电脑上只有 ~4 GB 的可用内存,我担心如果我...

回答 1 投票 0

合并具有相同列名的数据框

我有多个数据帧存储在数据帧列表中,我需要从每个数据帧中取出某个列(例如['d'])并将其放入新定义的数据帧中,但将它们放在旁边...

回答 1 投票 0

带偏移量的累计总和

我正在开发一种机器学习模型来预测给定团队的得分。我想创建一个列来跟踪每支球队主场比赛的累积得分,最多但不包括...

回答 3 投票 0

当键是复合且唯一时,Pandas 合并抱怨非唯一标签

我正在尝试合并两个数据帧,这样我最终会得到一个具有相同列数但行数增加的数据帧。 将 pandas 导入为 pd,将 numpy 导入为 np data1 = [['日期'、'符号'、'值...

回答 2 投票 0

带有偏移量 pandas 的累积和

我正在开发一种机器学习模型来预测给定团队的得分。我想创建一个列来跟踪每支球队主场比赛的累积得分,最多但不包括...

回答 1 投票 0

Pandas 不更改图例标签

我正在尝试绘制我的数据,但是 pandas 使用我需要在图例中覆盖的列标签。我以为 label 关键字会改变这一点,但它似乎没有效果。谷歌搜索节目...

回答 4 投票 0

对以 False 结尾的条纹进行分组并应用向前/向后填充[重复]

我有一个数据框,我想在其中基于布尔系列 df['condition'] 向前/向后填充。 单个组由一系列 True 值组成,其中包括

回答 2 投票 0

pandas python 中基于行的过滤器和聚合

我有两个数据框,如下所示。 df1: 数据1 = { 'Acc': [1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 3, 3, 3, 3, 4], 'indi_val': ['Val1', 'val2', 'Val_E', 'Val1_E', 'Val1', 'Val3', 'val2', 'val2_E', 'va...

回答 3 投票 0

合并在列中迭代的两个数据帧

我有两个数据框,一个是球员数据框,其中包含他们的俱乐部 ID 和回合,另一个数据框包含比赛、分数和回合。 玩家|俱乐部ID |圆形的 一个 | 16 | 16 1 乙| 13 | 1 c...

回答 2 投票 0

在 pandas 数据框中对回合进行求和

我正在处理由加速度计生成的数据,每次姿势发生变化(例如,从坐姿变为站立)或每次......时,这个特定模型都会写入一行新数据。

回答 1 投票 0

如何将单列 Pandas DataFrame 转换为 Series

我有以下数据框: 将 pandas 导入为 pd d = {'基因': ['foo','bar'],'分数': [4., 3.,]} df = pd.DataFrame(d) df.set_index('基因',inplace=True) 哪个品牌: 在[56]中:df 输出[56]:

回答 4 投票 0

Pandas 无法将输入转换为时间戳错误

我在数据集中有两个变量开始日期(格式datetime64 [ns])和结束日期(格式datetime64 [ns])。我使用以下代码来获取开始日期和结束日期之间的日期。 PD.

回答 3 投票 0

根据中位数、标准差、25% 和 75% 值创建箱线图

中位数 = 3637 标准 = 1274.997414 perc_25 = 2627.0 perc_75 = 4238.0 我有 4 个从数据中得出的值。我怎样才能用这个制作箱线图?我期望一条代表中位数的线,一个由 25-

回答 1 投票 0

使用 pandas 将单列翻译成英语

我的数据框看起来像 - 序列号_无文本 23 {'标题': ['LA-西班牙语 (Español)[更改]', ...

回答 2 投票 0

Pandas CSV 到 Django 响应

我有一个从数据库生成的DataFrame。如何提供下载 CSV 的响应? 基本上, df = magic_dataframe_supplier() 响应 = HttpResponse(content_type='text/csv')

回答 2 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.