data-science 相关问题

数据科学涉及以任何形式或形式从数据中提取知识或见解。它可以包含预测分析,通常需要进行大量的数据争论。请考虑在https://datascience.stackexchange.com/上发帖

如何使用 Python 将多个 CSV 文件合并为一个大 CSV 文件 [重复]

我有一个 zip 文件,其中包含 70 多个 csv 文件。我想将所有这些文件中的信息合并到一个大的 csv 文件中。在python中使用append方法会花费很长时间,因为我会...

回答 1 投票 0

Python Polars 如何根据行条件过滤列

根据列中的值过滤(排除列)极坐标数据帧的正确方法是什么? 例如: Polars_df.std() 输出: col_1 (f64) col_2 (f64) 20242.888632 0.0 # 不...

回答 2 投票 0

如何将这些函数转换为作用于整个数据框并加速我的Python代码

为了对被广泛讨论的交易方法(称为“智能货币概念”)进行回溯测试,我制作了一个包含一些函数的 Python 类。 现在,我犯的错误是让每个功能都运行......

回答 1 投票 0

pandas 的最小浮点数据类型/最小化变换大小

我有一个包含 17000 列和 50000 行整数值(~1 GB)的数据框。 我将数据帧的每一列除以列的总和(例如,标准化数据)。 我需要指定

回答 1 投票 0

文本分类中处理不均匀数据的最佳方法

我正在尝试使用 sklearn 和 Python 对一些文本数据(推文)运行文本分类模型。我已经手工编码了近 1,500 个案例,但是数据不平衡。 案例按主题进行编码。一个...

回答 1 投票 0

如何构建多输出回归模型的目标变量?

我想使用 XGBoost 构建一个多输出模型,其中输出是联系客户时的预测销售,例如: 输出 1 是联系后的预测销售,并且 输出2是预测...

回答 1 投票 0

SVM 问题 - 名称“model_SVC”未定义

我的代码有问题: 从 sklearn 导入 svm model_SVC = SVC() model_SVC.fit(X_scaled_df_train, y_train) svm_prediction = model_SVC.predict(X_scaled_df_test) 错误

回答 3 投票 0

有没有其他方法(将一列的值组合到不同的组中),而不是在下面的问题中多次使用 'df.replace( )' ?

在: char_df['Loan_Title'].unique() 出去: array(['债务合并', '信用卡再融资', ‘家装’、‘信用整合’、‘绿色贷款’、‘其他’、 '搬家和重新安置...

回答 1 投票 0

(简单,但奇怪)循环遍历大型 JSON 数据文件 JS、Python 时出现问题[重复]

上下文 您好,我有一个 JSON 文件,其中包含与此类似的对象列表: [{ “科迪戈”:“01”, "描述":"Animais vivos.", “Data_Inicio”:“01/04...

回答 1 投票 0

我在尝试运行作业时遇到启动错误

因此,我尝试在 AWS 上运行作业,但每次运行都会失败,并收到以下错误: 我不确定该去哪里查看或问题出在哪里。我是新人,仍在学习,请指导

回答 1 投票 0

计算 K 折交叉验证的准确率、精确率、召回率、f1 分数

这是我用Python编写的代码,用于计算K-Fold交叉验证的准确度、精确度、召回率、f1分数。在我的代码中,我总结了我的每一个准确率、召回率等。然后我将其除以n_folds。 ...

回答 1 投票 0

在 pd 数据框中转换为 2d 数组后,3d 数组图像缺少蓝色值

我正在尝试编写一个Python代码,将3d数组图像转换为格式为“RGB(r,g,b)”的2d数组并将它们插入到pd数据帧中,一切正常,我有一个...

回答 1 投票 0

用于机器学习算法的 csv 流

我有一个很大的 CSV 文件(大约 5GB)。 我试图逐行读取整个文件,并尝试应用最典型的算法(SVM、朴素贝叶斯、线性回归等)。 将 numpy 导入为 np 导入

回答 2 投票 0

如何使用 matplotlib.pylot.stackplot() 在堆栈图中添加数据标签?

我目前正在学习如何在 MatPlotLib 中创建不同的绘图。到目前为止,我可以创建一个基本的堆栈图,但我想知道是否可以在数据值上添加标签。 下面是我的代码: `举个例子

回答 1 投票 0

Python 中的“类型错误:列表索引必须是整数或切片,而不是 NavigableString”

从名称列表中我想排除具有两个单词名称的元素。 这是原始列表: native=['Aontroim', 'Contae Aontroma', 'Ard Mhacha', 'Contae Ard Mhacha', 'Ceatharlach', 'Co...

回答 1 投票 0

设置可迭代错误时必须具有相等的 len 键和值

在将数据写入数据帧时,我遇到了这个问题“ValueError:使用可迭代设置时必须具有相等的 len 键和值”。这个 csv 有 98 行,我试图将值分配给...

回答 1 投票 0

有没有办法预测多个商店中多种产品的销量?

我的数据采用这种格式(多变量和多变量时间序列) 我需要使用时间来预测不同商店(商店 1、商店 2、商店 3)中每种产品的销售单位数 -

回答 2 投票 0

如何将 BeautifulSoup 网络抓取表格保存到 csv 文件

我使用这种方法在网络上抓取了表格的内容,现在我希望将其保存到 csv 文件中,但我不确定如何保存(这是针对课堂上的项目,所以我无法发布任何实际代码因为...

回答 1 投票 0

使 excel 或 csv 文件具有按相同顺序从图像中提取的像素颜色

我有一个任务,需要提取图像的像素RGB或十六进制代码值,并将它们以与所选图像中的像素顺序相同的顺序存储在pandas数据框中。 有人知道我的项目是否...

回答 1 投票 0

如何在数学模式jupyter笔记本中书写百分比符号

当我在 $$ $$ 之间写 % 时,它看起来像这样。请帮助我

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.