data-science 相关问题

数据科学涉及以任何形式或形式从数据中提取知识或见解。它可以包含预测分析,通常需要进行大量的数据争论。请考虑在https://datascience.stackexchange.com/上发帖

K 折交叉验证后在完整数据集上预训练模型的实践

我最近为我的模型完成了 k 折交叉验证过程,其中我在每个训练集上预训练了模型,并在每个相应的验证集上对其进行了验证。这个过程帮助...

回答 1 投票 0

下面给出的代码在正常的python环境中完美运行,但在jupyter笔记本环境中没有显示任何输出

代码: %matplotlib 小部件 将 matplotlib.pyplot 导入为 plt 导入 matplotlib.animation 作为动画 将 numpy 导入为 np # 生成随机数据用于演示 np.随机.种子(0) x = np.random.randn(...

回答 1 投票 0

主表的可视化

这是我的基表: 我想将其转换为矩阵所示的形式: 最后有 2 列,需要一些计算。 我的最终目标: 我想为差异制作折线图...

回答 1 投票 0

scikit-learn RandomForestClassifier 中的子样本大小

如何控制用于训练森林中每棵树的子样本的大小? 根据 scikit-learn 的文档: 随机森林是一种元估计器......

回答 3 投票 0

如何在hdbscan中获取集群层次结构?

我有数据点的标签。我的主要目的是在这些标签之间建立层次关系,我们称之为 L。 因此,我执行 hdbscan,我可以使用 clusterer 绘制层次结构树。

回答 1 投票 0

预处理原始数据的单元测试错误

将 pandas 导入为 pd 导入spacy 从 spacy.lang.en.stop_words 导入 STOP_WORDS 导入nltk nlp = spacy.load("en_core_web_md") 类文件读取: def 读取文件(自身): 文件路径...

回答 1 投票 0

scikit-learn 自定义转换器从底层模型中抛出 NotFittedError

我想创建自己的 scikit-learn 转换器来编码包含分类的数字特征,例如邮政编码或行业代码(NAICS、MCC 等)。在这些代码中有一个

回答 1 投票 0

使用 scikit-learn 估计器作为变压器

我想创建自己的 scikit-learn 转换器来编码包含分类的数字特征,例如邮政编码或行业代码(NAICS、MCC 等)。在这些代码中有一个

回答 1 投票 0

我无法在pycharm和spyder上运行streamlit。我正在 window 上运行最新的 python 版本。当我尝试代码时,它说语法无效

#此代码用于在浏览器中打开streamlit 导入流线型 将streamlit导入为st 将 pandas 导入为 pd 从 FPL 导入 Predict_team、get_overview_data、extract_player_roster、 extract_teams_da...

回答 4 投票 0

检索极坐标的行号(索引)的推荐方法是什么?

我知道 Polars 不支持设计索引,所以 df.filter(expr).index 不是一个选项,我能想到的另一种方法是在应用任何过滤器之前添加一个新列,不确定这是否是一个操作...

回答 2 投票 0

Word2Vec 和上下文嵌入之间的区别

我试图理解词嵌入和上下文嵌入之间的区别。 以下是我的理解,如有错误请补充。 词嵌入算法具有全球通用性...

回答 3 投票 0

如何使用python编辑具有链接数据的列?

我有一个包含多列、行和部分的文本数据文件。在这里,我想删除第 5 列、第 6 列或第 7 列大于 50 的行。 挑战是: 在“原子”部分,fi...

回答 1 投票 0

3维点集的聚类(python)

我从显示球轨迹的电影中提取了一组点。 每个点都有与从电影中提取的图像中球的位置相对应的坐标 (x,y),以及 z 坐标...

回答 1 投票 0

从给定字符串数组中的文本中删除空格

我正在做一些练习,我必须从给定的文本创建 numpy 数组,并删除 numpy 数组文本之间的空格。请帮助如何实现它。我正在尝试但没有成功...

回答 1 投票 0

我的神经网络只预测一件事

我正在尝试从头开始在Python上实现它。我尝试了很多,但在我的实现中找不到错误。每当我使用“预测”函数时,它总是输出 0。 我也测试了每个...

回答 2 投票 0

Python 中点计算中的积分

我在一本书中发现了这个积分近似函数。它看起来很高效,并且可以用更少的子区间 ((n)) 提供准确的结果。 def approximation_integral(a, b, n, f): delta_x = (b...

回答 1 投票 0

代码在 jupyter 笔记本(anaconda)中不起作用

我在 google colab 上运行此代码并得到输出,但是当我在 anaconda jupyter 笔记本中运行它时,我收到此错误:带有 dtype 类别的分类'不支持减少'平均值' df.pivot_table(

回答 1 投票 0

蛋白质序列聚类(有/无 MSA)

我有 NGS 数据(仅限唯一克隆),我想使用 Python 语言根据相似性(最好是聚类)对它们进行分组。请查看以下示例序列。也给我...

回答 2 投票 0

将函数应用于特定的 DataFrame 列,并保留其余列

假设我们有以下 pandas DataFrame: df = pd.DataFrame({ '名称': ['foo', 'bar', 'baz'], “值”:[1,2,3], '持续时间': ['1s', '2s', '3s'], }) 现在,说我想转型...

回答 1 投票 0

如何获得更好的 AUC 分数? (和累积提升)

我有一个包含 600k 条记录和 173 个专注于二元分类的特征的数据集。班级比例约为 98.7:1.3(1.3% 目标=1)。 目前,我正在努力提高我的性能...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.