data-science 相关问题

数据科学涉及以任何形式或形式从数据中提取知识或见解。它可以包含预测分析,通常需要进行大量的数据争论。请考虑在https://datascience.stackexchange.com/上发帖

分类深度学习问题 - 我的模型总是学会预测 0.5 值

我有一个预测市场位置(向上或向下)的分类问题。我正在使用具有许多附加功能的资产的历史数据 (130)。我正在尝试使用深度...

回答 1 投票 0

如何从 PySpark 的 SQLLite 数据库文件加载表?

我正在尝试从存储在本地磁盘上的 SQLLite .db 文件加载表。 PySpark 有没有干净的方法可以做到这一点? 目前,我正在使用一种可行但不够优雅的解决方案。首先我读了

回答 3 投票 0

Python 使用嵌套列表对字典列表进行排序

我有一个字典列表(消息线程),其中包含另一个字典列表(消息) 我需要按最新消息的日期对线程进行排序。 数据是什么样的 [...

回答 1 投票 0

将所需列中的分类数据更改为数值数据,以便可以对其应用线性回归

在此输入图像描述 给定数据集上的某些列包含分类数据。我必须将数据更改为数字,以便我可以应用简单线性回归来预测...

回答 1 投票 0

如果一行包含至少两个非 NaN 值,则将该行拆分为两个单独的值

我正在尝试将 datafarame 转换为所需的输出格式,并满足下面提到的要求。 提供的要求: 每行只能保留一个非Nan值(Trh1和Trh2除外) 我想避免

回答 1 投票 0

DATA_SOURCE_NOT_FOUND 找不到数据源:mlflow-experiment。请在`https://spark.apache.org/third-party-projects.html

我正在尝试按照本页的建议使用Python在databricks上加载MLflow实验运行数据。 但是当我尝试做同样的事情时,我收到错误“org.apache.spark.SparkClassNotFoundExce...

回答 1 投票 0

如何在 Vertex AI 中部署自定义容器作为端点

我正在尝试在 vertex ai 中部署自定义容器作为端点(REST URL 或 API),我能够成功构建 docker 映像,但无法从日志中将模型部署为端点...

回答 1 投票 0

在 Pandas Groupby 对象中查找重复值

我有一个 Pandas DataFrame: 消息 ID 标识符 001 堆栈溢出 001 堆栈溢出 002 堆栈溢出 002 交叉验证 我想删除每个唯一值的标识符中的重复值...

回答 1 投票 0

早期数据科学项目的有用结构(jupyter 笔记本)

我正在开始一个新的数据科学项目。这将是一个早期实验项目,不是为了生产,而是为了概念验证。 我想确定好的/有用的架构(文件夹结构)

回答 1 投票 0

修改R代码以获得5个或更多方程和未知变量的增广系数矩阵

有人可以帮我修改这段代码吗?从上周开始我就陷入了这个困境。我试图让这段代码适用于以下方程,但没有任何效果。 另外,我这样做是为了我可以

回答 1 投票 0

执行 PCA 后如何在 Python 中显示散点图?

我自己制作了一个随机数据,其中包含一个 18 行 5 列的文本文件,其中所有条目均为整数。 我成功地进行了 PCA,但现在陷入困境。我无法绘制散点图......

回答 3 投票 0

Matplotlib 图例(不同的结果)

我是 matplotlib 的新手,但是当我使用 python 列表和 numpy 数组进行编码时,我发现了不同的情况。 Python列表代码 将 matplotlib.pyplot 导入为 plt 将 numpy 导入为 np 名称 = ['苏...

回答 1 投票 0

如何在 Pandas 数据框中将多行折叠为一行

我目前有一个包含 3 行 10 列的数据框。每列中只有一个值。它看起来是这样的: 段 1 2 3 ... 8 9 ...

回答 1 投票 0

我获取了列名称,但没有获取列的数据?

我已经给出了如图所示的这些命令,但我看不到数据 我试图查看整个数据而不仅仅是列,但我只获取我已经尝试过的列名称

回答 2 投票 0

使用 StandardScaler 与 Min-Max Scaler 的线性回归模型性能差异

问题: 我正在研究线性回归问题,我注意到使用不同的缩放技术(StandardScaler 和 Min-Max Scaler)时模型性能存在显着差异。我...

回答 2 投票 0

类型错误:“模块”对象不可调用 - 使用 UMAP 时

将 umap 导入为 UMAP 导入umap 重新目标 = {df_train['target'].value_counts().reset_index()['index'][i]: i for i in range(len(df_train['target'].value_counts()))} 重定向2 = {i: k for k, i in re...

回答 2 投票 0

我想使用 .weekday() 创建一个新的分组数据框,其中仅包含带假期的日期

所以我有一个数据框: 日期代表日月年病例死亡人数国家/地区名称土地.面积..平方公里..公里。 0 2021-09-21 21 9 2021 1162 7 奥地利 82520.0 1 2021-09-20 20 9 2021 170...

回答 2 投票 0

更改 Plotly 中的默认调色板

我可以使用以下方法更改默认主题: 将plotly.io导入为pio pio.templates.default = 'plotly_white' 但我如何更改默认调色板?

回答 1 投票 0

更改 Plotly 中的默认调色板

我可以使用以下方法更改默认主题: 将plotly.io导入为pio pio.templates.default = 'plotly_white' 但我如何更改默认调色板?

回答 1 投票 0

当我在coursera中使用python在数据科学中运行以下代码时出现错误

当我针对该问题运行以下代码时出现错误。 问题: 让我们探讨一下小时候母乳喂养与接种季节性流感疫苗之间的关系

回答 6 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.