data-science 相关问题

数据科学涉及以任何形式或形式从数据中提取知识或见解。它可以包含预测分析,通常需要进行大量的数据争论。请考虑在https://datascience.stackexchange.com/上发帖

对具有 DNA 序列的 fasta 文件进行聚类,以找到最不匹配的克隆

我正在尝试创建一个集群来分析 DNA 序列并找到其中不太匹配的模式(例如 <25% match). Is it possible to perform cluster analysis (k-means or any other approa...

回答 1 投票 0

使用 xlwings 将公式添加到表格的列

我正在尝试使用具有 2 个表格的 Xlwings 自动化 Excel 工作表。我想在两个表的性能列中添加一个公式,这样如果我将新数据输入到表中,它会自动...

回答 1 投票 0

对数据科学训练营的看法(以及我目前的立场)。感谢任何帮助

一些关于我自己的背景: 我最近从欧洲(特别是西班牙)一所著名大学获得了计算机科学硕士学位(我拥有经济学学士学位)。然而

回答 1 投票 0

Conda env 未删除

使用Mac终端,当我尝试删除环境时,会显示此代码。 它说停用,但我尝试了很多次。 (base) ariyan_mac@Ariyans-MacBook-Air ~ % conda 停用 ariyan_mac@Ariyans-MacB...

回答 1 投票 0

如何在 Polars Dataframe 中创建非字母顺序的分类列?

在 Pandas 中,您可以从现有字符串列创建“有序”分类列,如下所示: column_values_with_custom_order = [“B”、“A”、“C”] df["

回答 3 投票 0

AttributeError:“FloatProgress”对象没有属性“style”

将 numpy 导入为 np 将 pandas 导入为 pd 进口火炬 从 torch.utils.data 导入数据集 导入节 节.download('en') nlp = stanza.Pipeline(lang='en') 上面的代码用于创建管道...

回答 2 投票 0

属性错误:“DataFrame”对象没有具有 extractall 功能的属性“str”

我的函数中出现此错误“AttributeError:'DataFrame'对象没有属性'str'”。 我的代码是这样的。 def date_sorter(): # 这里是你的代码 # 完整日期 格洛...

回答 1 投票 0

如何更新之前运行的 MLFlow?

我想更新以前使用 MLFlow 完成的运行,即。更改/更新参数值以适应实现中的更改。典型用例: 使用参数 A 记录运行,并且...

回答 3 投票 0

如何从 pandas 的行中提取列

我有txt文件中的数据。数据存储为单列。但我需要从行中提取列。当我使用 pd.read_table() 方法读取数据时,它返回为单个列和许多 r...

回答 1 投票 0

卡方检验 - 为什么零(H0)和替代(H1)假设检验结果出错或者我的理解有问题

从 scipy.stats 导入 chi2_contingency # 定义表 数据 = [[1,2,3,4,5,], [10,20,30,40,50]] stat、p、dof、预期 = chi2_contingency(数据) # 解释 p 值 阿尔法 = 0.05 打印(&q...

回答 1 投票 0

是否可以编写一个适用于整个项目中所有表的 dbt 测试?

为了确保新数据不间断地不断到达Snowflake,我想在我的dbt项目中添加一些测试。我想在 Elementary 中使用 freshness_anomalies 测试,这是一个包

回答 2 投票 0

如何在不拆分数据帧的情况下传递不同的数据集进行训练和测试。 (蟒蛇)?

我已经解决了多个问题,这些问题有助于将数据帧分为训练和测试,使用 scikit 或不使用 scikit 等。 但我的问题是我有 2 个不同的 csv(来自不同的 2 个不同的数据帧...

回答 3 投票 0

如何在海量数据上训练机器学习模型?

关键点:数据集太大了,我几乎无法将其存储在硬件中。 (拍字节) 假设我的数据集中有数万亿行。该数据集太大,无法存储在内存中...

回答 3 投票 0

无法在Windows 10上的Python 3.12中安装Ta-Lib

我想做外汇技术分析,并尝试在Python中安装Ta-Lib,但尝试了很多次都失败了。 目前我使用Python的ltest版本:3.12.1 我也...

回答 1 投票 0

如何删除绘图中由“颜色”属性生成的标签

我正在使用plotly.graph_objects来绘制时间序列,但是生成“颜色”属性的标签使用了所有空间。我想知道 update_layout(...

回答 1 投票 0

Keras LSTM - 验证损失从 Epoch #1 开始增加

我目前正在进行我的第一个“真正的”深度学习项目(令人惊讶)预测股票走势。我知道我以 1000:1 的比例去创造任何有用的东西,但我很享受它并希望看到它完成,我已经...

回答 3 投票 0

如何安装Detectron2

我正在安装布局解析器并点击此链接。使用以下软件包没有遇到任何问题。 pip 安装布局解析器 pip install "layoutparser[effdet]" 点安装

回答 3 投票 0

即使使用 IQR 方法删除异常值。异常值仍然存在于数据中

我使用箱线图方法找到了数据中的异常值。 在此处输入图像描述 箱形图 在应用 IQR 方法之前 文件1.形状 # (457, 11) 我已将 IQR 方法应用于数据。 ...

回答 1 投票 0

是否建议对已经one-hot编码的数据进行主成分分析(PCA)

我正在做一个项目,虽然机器学习模型做得还不错,但我觉得还可以更好。该模型可以很好地预测多数类别,但不能很好地预测少数类别。召回和

回答 1 投票 0

数值变量和分类变量之间的逻辑回归偏差方差

我为客户流失数据集拟合了逻辑回归模型,结果如下 对数结果 我用验证集测试了这个模型并计算了 ROC AUC 分数,这是

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.