data-science 相关问题

数据科学涉及以任何形式或形式从数据中提取知识或见解。它可以包含预测分析，通常需要进行大量的数据争论。请考虑在https://datascience.stackexchange.com/上发帖

我最近为我的模型完成了 k 折交叉验证过程，其中我在每个训练集上预训练了模型，并在每个相应的验证集上对其进行了验证。这个过程帮助...

machine-learning data-science cross-validation pre-trained-model reproducible-research

回答 1 投票 0

下面给出的代码在正常的python环境中完美运行，但在jupyter笔记本环境中没有显示任何输出

代码： %matplotlib 小部件将 matplotlib.pyplot 导入为 plt 导入 matplotlib.animation 作为动画将 numpy 导入为 np # 生成随机数据用于演示 np.随机.种子(0) x = np.random.randn(...

matplotlib animation jupyter-notebook data-science visualization

回答 1 投票 0

主表的可视化

这是我的基表：我想将其转换为矩阵所示的形式：最后有 2 列，需要一些计算。我的最终目标：我想为差异制作折线图...

powerbi data-science powerbi-desktop

回答 1 投票 0

scikit-learn RandomForestClassifier 中的子样本大小

如何控制用于训练森林中每棵树的子样本的大小？根据 scikit-learn 的文档：随机森林是一种元估计器......

machine-learning scikit-learn random-forest data-science

回答 3 投票 0

如何在hdbscan中获取集群层次结构？

我有数据点的标签。我的主要目的是在这些标签之间建立层次关系，我们称之为 L。因此，我执行 hdbscan，我可以使用 clusterer 绘制层次结构树。

data-science hdbscan

回答 1 投票 0

预处理原始数据的单元测试错误

将 pandas 导入为 pd 导入spacy 从 spacy.lang.en.stop_words 导入 STOP_WORDS 导入nltk nlp = spacy.load("en_core_web_md") 类文件读取： def 读取文件（自身）：文件路径...

python pandas nlp data-science

回答 1 投票 0

scikit-learn 自定义转换器从底层模型中抛出 NotFittedError

我想创建自己的 scikit-learn 转换器来编码包含分类的数字特征，例如邮政编码或行业代码（NAICS、MCC 等）。在这些代码中有一个

python machine-learning scikit-learn data-science

回答 1 投票 0

使用 scikit-learn 估计器作为变压器

我想创建自己的 scikit-learn 转换器来编码包含分类的数字特征，例如邮政编码或行业代码（NAICS、MCC 等）。在这些代码中有一个

python machine-learning scikit-learn data-science

回答 1 投票 0

我无法在pycharm和spyder上运行streamlit。我正在 window 上运行最新的 python 版本。当我尝试代码时，它说语法无效

#此代码用于在浏览器中打开streamlit 导入流线型将streamlit导入为st 将 pandas 导入为 pd 从 FPL 导入 Predict_team、get_overview_data、extract_player_roster、 extract_teams_da...

python-3.x pandas numpy data-science streamlit

回答 4 投票 0

检索极坐标的行号（索引）的推荐方法是什么？

我知道 Polars 不支持设计索引，所以 df.filter(expr).index 不是一个选项，我能想到的另一种方法是在应用任何过滤器之前添加一个新列，不确定这是否是一个操作...

python dataframe data-science python-polars

回答 2 投票 0

Word2Vec 和上下文嵌入之间的区别

我试图理解词嵌入和上下文嵌入之间的区别。以下是我的理解，如有错误请补充。词嵌入算法具有全球通用性...

machine-learning deep-learning nlp data-science

回答 3 投票 0

如何使用python编辑具有链接数据的列？

我有一个包含多列、行和部分的文本数据文件。在这里，我想删除第 5 列、第 6 列或第 7 列大于 50 的行。挑战是：在“原子”部分，fi...

python pandas data-science

回答 1 投票 0

3维点集的聚类（python）

我从显示球轨迹的电影中提取了一组点。每个点都有与从电影中提取的图像中球的位置相对应的坐标 (x,y)，以及 z 坐标...

python neural-network data-science cluster-analysis

回答 1 投票 0

从给定字符串数组中的文本中删除空格

我正在做一些练习，我必须从给定的文本创建 numpy 数组，并删除 numpy 数组文本之间的空格。请帮助如何实现它。我正在尝试但没有成功...

python pandas numpy data-science

回答 1 投票 0

我的神经网络只预测一件事

我正在尝试从头开始在Python上实现它。我尝试了很多，但在我的实现中找不到错误。每当我使用“预测”函数时，它总是输出 0。我也测试了每个...

python machine-learning deep-learning neural-network data-science

回答 2 投票 0

Python 中点计算中的积分

我在一本书中发现了这个积分近似函数。它看起来很高效，并且可以用更少的子区间 ((n)) 提供准确的结果。 def approximation_integral(a, b, n, f): delta_x = (b...

python math data-science integration integral

回答 1 投票 0

代码在 jupyter 笔记本（anaconda）中不起作用

我在 google colab 上运行此代码并得到输出，但是当我在 anaconda jupyter 笔记本中运行它时，我收到此错误：带有 dtype 类别的分类'不支持减少'平均值' df.pivot_table(

pandas data-science pivot-table

回答 1 投票 0

蛋白质序列聚类（有/无 MSA）

我有 NGS 数据（仅限唯一克隆），我想使用 Python 语言根据相似性（最好是聚类）对它们进行分组。请查看以下示例序列。也给我...

python-3.x data-science bioinformatics biopython hierarchical-clustering

回答 2 投票 0

将函数应用于特定的 DataFrame 列，并保留其余列

假设我们有以下 pandas DataFrame： df = pd.DataFrame({ '名称': ['foo', 'bar', 'baz'], “值”：[1,2,3], '持续时间': ['1s', '2s', '3s'], }) 现在，说我想转型...

python-3.x pandas dataframe data-science

回答 1 投票 0

如何获得更好的 AUC 分数？（和累积提升）

我有一个包含 600k 条记录和 173 个专注于二元分类的特征的数据集。班级比例约为 98.7:1.3（1.3% 目标=1）。目前，我正在努力提高我的性能...

machine-learning data-science classification data-modeling auc

回答 1 投票 0

data-science 相关问题

最新问题