data-science 相关问题

数据科学涉及以任何形式或形式从数据中提取知识或见解。它可以包含预测分析,通常需要进行大量的数据争论。请考虑在https://datascience.stackexchange.com/上发帖

在weka中重新采样过滤器

我的数据集中的数据实例数量很少。因此,我尝试了Weka中的“重新采样”过滤器来增加数据量,从而增强模型性能。可以设置一下吗...

回答 1 投票 0

如何使用一个变量绘制 qqline 图

我正在尝试使用以下代码绘制 qqnline 图并收到错误消息。我感谢您能提供的任何帮助。 日志数据 <- c(1.7917595,1.0986123,1.9459101,3.8066625, ...

回答 1 投票 0

如何检查并查找 pandas 数据框中的列中的空值并创建 CSV 日志文件并将空值详细信息写入日志文件中?

嗨,我有一个数据框,如下所示 代码区域角色类型 23.AA。经过 34.BB。 C.X 南。抄送。 A.Z 56. BB。 C.Y 67. 45.C.Y. 我需要检查...

回答 1 投票 0

计算数据框中持续的连胜

我有一组体育比赛的数据,其形式如下: 获胜者 = ['A', 'A', 'B', 'C', 'A', 'C', 'C', 'B'] 失败者 = ['B', 'C', 'A', 'A', 'B', 'A', 'B', 'C'] P1 = ['A', 'A', 'A', 'A'...

回答 2 投票 0

使用 Python Pandas 计算数据框中持续的连胜

我有一组体育比赛的数据,其形式如下: 获胜者 = ['A', 'A', 'B', 'C', 'A', 'C', 'C', 'B'] 失败者 = ['B', 'C', 'A', 'A', 'B', 'A', 'B', 'C'] P1 = ['A', 'A', 'A', 'A'...

回答 1 投票 0

Databricks 和 Spark 有什么区别?

我试图清楚地了解它们是如何相互关联的,以及使用其中一个是否总是需要使用另一个。如果您可以对它们中的每一个给出非技术性的定义或解释,我

回答 2 投票 0

在数据帧上运行函数时,Python TypeError“系列对象不能解释为整数”

我正在尝试运行此代码: 默认事实(x): 如果 x 在 [0, 1] 中: 返回1 r = 1 对于范围 (1, (x+1)) 中的 a: r = r*a 返回 r def ch(a, b): 返回事实(a)/(事实(b)*fa...

回答 1 投票 0

如果从其他文件运行脚本,Python 无法找到数据库

已在评论中解决 我在一个数据量大的项目中遇到了困难。我可以运行一个使用查询文件的文件——所有查询和转换器都在这里——没有问题,但是当我运行一个文件时......

回答 2 投票 0

处理时间序列中的异常值

我正在研究时间序列预测。在实现预测模型之前,我正在做一些数据处理。我有一些异常值。如果我删除包含异常值的行,我的行将不会

回答 1 投票 0

不同长度序列列表的分析

我有1000个列表如下: [[6,7,7,5,5,5,7,6,7,5,6,5], [7,7,7,5,5,6,6,7,7,7,7,6,5], [7, 7, 5, 6, 6, 5, 5, 7, 6, 6, 6, 5, 7, 5], [6,5,7,7,6,5,7,5,7,6,...

回答 2 投票 0

当 n = r

我最近发现了这个答案,它提供了 Cramer V 的无偏版本的代码,用于计算两个分类变量的相关性: 将 scipy.stats 导入为 ss def cramers_ Corrected...

回答 1 投票 0

根据日期范围创建直方图

我是数据科学和Python 的新手。 我有一个数据集,日期范围开始:“2020-03-15”,结束:“2022-02-23”。每个日期都有多项活动。 我在找

回答 1 投票 0

Python Web 报废 .cgi 表

我想从此页面抓取网球数据:https://www.tennisabstract.com/cgi-bin/leaders.cgi 为了一个任务。 我需要在 Jupyter Notebook 中使用 python 库。 当我尝试抓取这个 .cgi 时...

回答 1 投票 0

Python:GridSearchCV 花费太长时间才能完成运行

我正在尝试进行网格搜索来优化我的模型,但执行时间太长。我的总数据集只有大约 15,000 个观察值,大约有 30-40 个变量。我成功...

回答 3 投票 0

如何找到不同公司竞争对手产品矩阵与特定品牌数据集的相关性?有机器学习来预测适合度吗?

我非常感谢有关此挑战的任何建议,我正在尝试找到包含行上的客户和他们拥有的竞争对手产品的数据集(矩阵)的相关性

回答 1 投票 0

如何删除 Pandas 中不包含字符串的行?

假设我有以下数据集: >>> 将 pandas 导入为 pd >>> >>> data = {'索引': [0, 1, 2], '值': ['零', 1, '二']} >>> >>> df = pd.DataFrame(dat...

回答 1 投票 0

如何使用 Markowitz 获得正确的权重

我需要一些帮助。我正在尝试为具有相同资产的多个投资组合(不同权重)运行马科维茨模型。但我想要一个在所有位置上寻求给定风险和/或回报的函数...

回答 1 投票 0

有什么方法可以在 Nim 中使用 NetCDF 文件吗?

几天前我发现了 Nim 并且对它非常感兴趣。 但是,我需要知道我是否能够使用 NetCDF 文件(或至少 GRB 文件)来查看它是否适合我的日常生活...

回答 2 投票 0

Python Wordcloud:帮助获得(接近)设计师的要求

我正在从术语频率词典生成词云并得到以下结果: 通过使用以下词云参数: 词云 = 词云( 宽度=667, 身高=375, 字体_p...

回答 1 投票 0

处理Python中分类列的缺失值

在进行数据整理时,如何处理分类列的缺失值。 我是Python新手,想了解更多。我想清理和整理“Ti...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.