pandas 相关问题

我有一根绳子电子邮件 = '[email protected]' 和一个DF df = DataFrame({ ‘id’: [1, 2, 3], ‘email_address’: [‘[email protected]’, ‘[email protected]’, ‘[email protected]’]}) 我想添加一个名为“sc...

pandas difflib sequencematcher

回答 2 投票 0

Polars 比较两个数据帧 - 有没有办法在第一次不匹配时立即失败

我正在使用极地测试assert_frame_equal方法来比较两个包含相同列的排序数据帧，下面是我的代码： assert_frame_equal(src_df, tgt_df, check_dtype=False, check_row_order=

python pandas python-polars

回答 1 投票 0

将 pandas 导入为 pd NameError：名称“null”未在 jupyter 笔记本上定义

您好，我目前正在 Udemy 上参加数据分析师训练营课程，我正在使用带有 python 版本 3.9 的 jupyter 笔记本。我目前正在学习如何使用 pandas 库，我将其安装在我的电脑上...

pandas jupyter-notebook python-3.9

回答 3 投票 0

优化Databricks中Excel文件的读取和格式化功能

我编写了一个小函数来从 CSV 文件读取数据并将输出存储在格式化的 Excel 工作簿中。该代码将在 Spark 群集上运行的 Azure Databricks 笔记本中运行。我该怎么办...

python pandas pyspark azure-databricks xlsxwriter

回答 1 投票 0

循环并存储多个路径Pandas

目标：参数化多个路径并使用 pandas 合并 ID 上的所有数据。例如，我有以下多个路径： \用户\文档�301\data01.pqt \用户\文档�302\data02.pqt \用户\文档...

python pandas dataframe for-loop parameters

回答 1 投票 0

创建时变数据帧的最有效方法

我有以下数据框： from_year to_year ID 性别 1990 1993 1 女 1987 1992 2 男 2000 2000 3 男 2010 2011 4 女我愿意

python pandas

回答 1 投票 0

如何将数据集拆分为 X_train、X_test、y_train、y_test 后合并并保存为 CSV？

如何合并数据集并将其拆分为 CSV X = df.drop(['标签'],axis=1).values y = df.iloc[:, -1].values.reshape(-1,1) y=np.ravel(y) X_train、X_test、y_train、y_test =

python pandas dataframe csv

回答 1 投票 0

比较时间戳与日期时间

我有一个来自数据帧和日期时间对象的时间戳，我想比较它们以在数据帧中进行选择。我的数据如下：打印（类型（日期时间.日期时间.now（）））我有一个来自数据帧和日期时间对象的时间戳，我想比较它们以在数据帧中进行选择。我的数据如下： print(type(datetime.datetime.now())) <class 'datetime.datetime'> print(type((df.created_at[0]))) <class 'pandas._libs.tslibs.timestamps.Timestamp'> 如何使用日期时间对象选择该数据框中的特定行？如下： df[df.created > datetime.datetime.now()] 但它返回给我以下错误消息：TypeError: Cannot compare tz-naive and tz-aware datetime-like objects，知道如何解决这个问题吗？谢谢！ Timestamp 是一个时区感知对象，而从 datetime.datetime.now() 获得的日期时间对象是时区天真的对象，因为您没有另外指定，因此会出现错误。您应该进行转换，以便它们要么都支持时区，要么都不支持时区。例如，您可以像这样调用 datetime.datetime.now() 使其具有时区感知能力（将时间戳对象中的时区信息作为参数传递）： datetime.datetime.now(df.created_at[0].tzinfo) df[df.created.to_pydatetime() > datetime.datetime.now()] 应该可以工作pandas.Timestamp.to_pydatetime

python pandas datetime

回答 2 投票 0

根据特定条件向前填充

我有一个数据框，我想根据特定条件转发填充。当条件为 True 时，我想要向前填充和向后填充。条件为 False 意味着链接

python pandas

回答 2 投票 0

如何从本地项目csv文件获取数据并存储到docker中的mongodb中

我有一个废弃的Python项目，它将pandas数据帧存储在csv文件中。我设置了 docker run mongo 但无法弄清楚如何将 csv 文件的数据存储在 mongodb 中。我必须复制文件吗...

pandas database mongodb docker

回答 2 投票 0

基于

我有一个数据框，我想根据特定条件转发填充。当条件成立时，我想转发填充和回填。条件为假意味着