数据科学涉及以任何形式或形式从数据中提取知识或见解。它可以包含预测分析,通常需要进行大量的数据争论。请考虑在https://datascience.stackexchange.com/上发帖
在我的数据集中,我需要查找何时重复 280 次以上的 0,并返回数组中重复开始的第一行号。我使用的是 python 3.11。 样本数据:
在总共 27 个特征的 Pandas 数据框中,我有一列名为“children_count”,另一列名为“years”。第二个是包含
所以想象一下,我有这个数据,其中包含 2 个玩家相继玩一场游戏的条目,然后在他们都获得胜利或失败后,他们获得共享分数(这个逻辑是不重要的数字......
所以想象一下,我有这样的数据,其中包含 2 个玩家相继玩游戏的条目,然后在他们都获得胜利或失败后,他们获得共享分数(这个逻辑并不重要,数字是
如何使用主成分分析(PCA)来分析由 300 个随海拔高度变化的模型温度数据样本组成的数据集?
我有 300 个温度和海拔数据样本,每个样本大小为 20x300。每个样本都是使用不同的特征生成的。这 300 个温度曲线随海拔高度变化...
(蟒蛇) 我想定义一个函数如下...... 我有两个数据框,在所有行中都有浮点值。 两个数据帧都以日期时间作为索引。 两个数据框都有不同的列。 我想要...
Lime 错误:LIME 目前不支持没有概率分数的分类器模型
我是数据科学的初学者,这是我的第一个项目。所以我想做的很简单,就是0-1分类。 X= ['neighbourhood_code','room_type_code','price','minimum_nights','
我有一个数据集,其中每一行都是一个恐怖主义事件,我想找到每个国家/地区单位中每次袭击造成的死亡人数中位数。在 df1 中,每一行都是恐怖主义事件,其中
我有一个从 json 创建的 csv 文件。我的第一栏是我的关键。第一列仅具有唯一值。然后,行中的后续值是标识属性的代码
如何使用带标题的 csv 进行 sagemaker 批量转换?
我正在使用由 xgboost 估计器创建的变压器执行 sagemaker 批量转换。用于预测/批量转换的 csv 输入同时具有 ID 列和标题(名称为
出现错误。我也尝试询问chatgpt,但它已经没有解决方案了。我尝试降低库的等级并升级一些库,但仍然没有解决我的错误。输入
我想获取当前之前的所有值并计算它们的偏度,所以最后我可以得到一个系列,其中每行都有最后一个值的累积偏度。 请注意,r 级数还包含零...
我正在使用 VS code 和 python 3.10.5 以及 pip 24.0。即使安装后我也收到 nomodulefound 错误。我想使用 biopython 和 sciki-allele。我也创建了虚拟环境。你的...
我有一个参加不同长度比赛的科目列表,我计算了每公里的跑步速度,以便找到每个特定科目的最佳比赛长度(这...
我开发了一个函数,它根据用户输入使用参数化sql来获取记录。但是,我在查询的 where 子句中面临类型不匹配问题。请帮我解决它。
如何使用经过训练的模型(协调回归)并使用预测列值对新数据帧进行预测
我是数据科学的新手,正在自学数据科学的基础知识。 我有两组数据 - 一组用于训练 (train.csv),其中模型被估计并用于预测来自单独的值...
Python/Pandas:仅当两个数据帧中第一列的值相等时,如何按行将数据从一个数据帧添加到另一个数据帧?
我有2个数据框。对于 dataframe2 中的每一行,我想查看 dataframe1 是否已经在“名称”列中具有相同值的行。如果是这样,我想将 dataframe2 中的行的数据添加到
我最近为我的模型完成了 k 折交叉验证过程,其中我在每个训练集上预训练了模型,并在每个相应的验证集上对其进行了验证。这个过程帮助...