data-science 相关问题

数据科学涉及以任何形式或形式从数据中提取知识或见解。它可以包含预测分析,通常需要进行大量的数据争论。请考虑在https://datascience.stackexchange.com/上发帖

使用 pandas 重新格式化数据

我有一个数据集,其结构如所附图像。您能找到一种使用 Python Pandas 更好地格式化这些数据的方法吗?理想情况下,去掉每列中所有领先的 NAN。解释一下,对于

回答 1 投票 0

Jupyter 笔记本界面不同

我正在观看 YT 上的视频讲座系列来学习 pandas。我的电脑上的 jupyter 笔记本界面和教程中的界面不同。 这是教程中的界面: 原始界面 这...

回答 3 投票 0

如何为vscode的数据科学模式设置环境变量?

我正在使用vscode的数据科学模式。 当vscode运行jupyter内核时,我可以将所需的路径添加到jupyter内核的PYTHONPATH中吗? 在其他情况下,我使用了launch.json的“env”,但我不能......

回答 2 投票 0

对不平衡数据的回归 CNN 进行加权?

我有一个用于回归的 CNN,它获取图像并输出浮点数 0-10。我的模型表现不错,但数据不平衡存在严重问题,导致我的模型对几乎所有数据的预测都在 6-8 之间

回答 3 投票 0

随机森林 - 针对 AUC 或 F1 分数进行优化

我在sklearn中使用随机森林,并且我的数据集相当不平衡(20%的正类,80%的其他类)。有没有办法让它针对某些指标进行训练(优化),并将其纳入

回答 2 投票 0

开始AI和软件开发编程需要哪些工具?

作为一名菜鸟程序员,我对从哪里开始感到非常困惑。 我尝试学习我需要知道的内容,并且我希望这些内容对我的新手水平有用。我也希望每个人...

回答 1 投票 0

如何在power BI中使用日期时间格式

我想可视化包含日期和时间属性的 Power BI 报告。因此,我已将其数据类型转换为日期时间,但我无法同时使用这两个属性,即我...

回答 1 投票 0

我如何编写一些要求用户加载文件的代码

我正在为我工作的公司构建一个工具,并且我构建了一个程序,可以从任何 csv 文件返回不同的统计数据,当然具有特定的数据结构。现在,我的问题是我不知道

回答 1 投票 0

将聊天机器人部署到 AzureFunction

我正在尝试将聊天机器人部署到Azure Function。 我使用 vs code 来部署代码,并使用 Azure Tools 和 Azurite 进行调试。本地一切正常。 部署后出现这个错误: ...

回答 2 投票 0

在weka中重新采样过滤器

我的数据集中的数据实例数量很少。因此,我尝试了Weka中的“重新采样”过滤器来增加数据量,从而增强模型性能。可以设置一下吗...

回答 1 投票 0

如何使用一个变量绘制 qqline 图

我正在尝试使用以下代码绘制 qqnline 图并收到错误消息。我感谢您能提供的任何帮助。 日志数据 <- c(1.7917595,1.0986123,1.9459101,3.8066625, ...

回答 1 投票 0

如何检查并查找 pandas 数据框中的列中的空值并创建 CSV 日志文件并将空值详细信息写入日志文件中?

嗨,我有一个数据框,如下所示 代码区域角色类型 23.AA。经过 34.BB。 C.X 南。抄送。 A.Z 56. BB。 C.Y 67. 45.C.Y. 我需要检查...

回答 1 投票 0

计算数据框中持续的连胜

我有一组体育比赛的数据,其形式如下: 获胜者 = ['A', 'A', 'B', 'C', 'A', 'C', 'C', 'B'] 失败者 = ['B', 'C', 'A', 'A', 'B', 'A', 'B', 'C'] P1 = ['A', 'A', 'A', 'A'...

回答 2 投票 0

使用 Python Pandas 计算数据框中持续的连胜

我有一组体育比赛的数据,其形式如下: 获胜者 = ['A', 'A', 'B', 'C', 'A', 'C', 'C', 'B'] 失败者 = ['B', 'C', 'A', 'A', 'B', 'A', 'B', 'C'] P1 = ['A', 'A', 'A', 'A'...

回答 1 投票 0

Databricks 和 Spark 有什么区别?

我试图清楚地了解它们是如何相互关联的,以及使用其中一个是否总是需要使用另一个。如果您可以对它们中的每一个给出非技术性的定义或解释,我

回答 2 投票 0

在数据帧上运行函数时,Python TypeError“系列对象不能解释为整数”

我正在尝试运行此代码: 默认事实(x): 如果 x 在 [0, 1] 中: 返回1 r = 1 对于范围 (1, (x+1)) 中的 a: r = r*a 返回 r def ch(a, b): 返回事实(a)/(事实(b)*fa...

回答 1 投票 0

如果从其他文件运行脚本,Python 无法找到数据库

已在评论中解决 我在一个数据量大的项目中遇到了困难。我可以运行一个使用查询文件的文件——所有查询和转换器都在这里——没有问题,但是当我运行一个文件时......

回答 2 投票 0

处理时间序列中的异常值

我正在研究时间序列预测。在实现预测模型之前,我正在做一些数据处理。我有一些异常值。如果我删除包含异常值的行,我的行将不会

回答 1 投票 0

不同长度序列列表的分析

我有1000个列表如下: [[6,7,7,5,5,5,7,6,7,5,6,5], [7,7,7,5,5,6,6,7,7,7,7,6,5], [7, 7, 5, 6, 6, 5, 5, 7, 6, 6, 6, 5, 7, 5], [6,5,7,7,6,5,7,5,7,6,...

回答 2 投票 0

当 n = r

我最近发现了这个答案,它提供了 Cramer V 的无偏版本的代码,用于计算两个分类变量的相关性: 将 scipy.stats 导入为 ss def cramers_ Corrected...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.