数据科学涉及以任何形式或形式从数据中提取知识或见解。它可以包含预测分析,通常需要进行大量的数据争论。请考虑在https://datascience.stackexchange.com/上发帖
对具有 DNA 序列的 fasta 文件进行聚类,以找到最不匹配的克隆
我正在尝试创建一个集群来分析 DNA 序列并找到其中不太匹配的模式(例如 <25% match). Is it possible to perform cluster analysis (k-means or any other approa...
我正在尝试使用具有 2 个表格的 Xlwings 自动化 Excel 工作表。我想在两个表的性能列中添加一个公式,这样如果我将新数据输入到表中,它会自动...
一些关于我自己的背景: 我最近从欧洲(特别是西班牙)一所著名大学获得了计算机科学硕士学位(我拥有经济学学士学位)。然而
使用Mac终端,当我尝试删除环境时,会显示此代码。 它说停用,但我尝试了很多次。 (base) ariyan_mac@Ariyans-MacBook-Air ~ % conda 停用 ariyan_mac@Ariyans-MacB...
如何在 Polars Dataframe 中创建非字母顺序的分类列?
在 Pandas 中,您可以从现有字符串列创建“有序”分类列,如下所示: column_values_with_custom_order = [“B”、“A”、“C”] df["
AttributeError:“FloatProgress”对象没有属性“style”
将 numpy 导入为 np 将 pandas 导入为 pd 进口火炬 从 torch.utils.data 导入数据集 导入节 节.download('en') nlp = stanza.Pipeline(lang='en') 上面的代码用于创建管道...
属性错误:“DataFrame”对象没有具有 extractall 功能的属性“str”
我的函数中出现此错误“AttributeError:'DataFrame'对象没有属性'str'”。 我的代码是这样的。 def date_sorter(): # 这里是你的代码 # 完整日期 格洛...
我想更新以前使用 MLFlow 完成的运行,即。更改/更新参数值以适应实现中的更改。典型用例: 使用参数 A 记录运行,并且...
我有txt文件中的数据。数据存储为单列。但我需要从行中提取列。当我使用 pd.read_table() 方法读取数据时,它返回为单个列和许多 r...
卡方检验 - 为什么零(H0)和替代(H1)假设检验结果出错或者我的理解有问题
从 scipy.stats 导入 chi2_contingency # 定义表 数据 = [[1,2,3,4,5,], [10,20,30,40,50]] stat、p、dof、预期 = chi2_contingency(数据) # 解释 p 值 阿尔法 = 0.05 打印(&q...
为了确保新数据不间断地不断到达Snowflake,我想在我的dbt项目中添加一些测试。我想在 Elementary 中使用 freshness_anomalies 测试,这是一个包
如何在不拆分数据帧的情况下传递不同的数据集进行训练和测试。 (蟒蛇)?
我已经解决了多个问题,这些问题有助于将数据帧分为训练和测试,使用 scikit 或不使用 scikit 等。 但我的问题是我有 2 个不同的 csv(来自不同的 2 个不同的数据帧...
关键点:数据集太大了,我几乎无法将其存储在硬件中。 (拍字节) 假设我的数据集中有数万亿行。该数据集太大,无法存储在内存中...
无法在Windows 10上的Python 3.12中安装Ta-Lib
我想做外汇技术分析,并尝试在Python中安装Ta-Lib,但尝试了很多次都失败了。 目前我使用Python的ltest版本:3.12.1 我也...
我正在使用plotly.graph_objects来绘制时间序列,但是生成“颜色”属性的标签使用了所有空间。我想知道 update_layout(...
Keras LSTM - 验证损失从 Epoch #1 开始增加
我目前正在进行我的第一个“真正的”深度学习项目(令人惊讶)预测股票走势。我知道我以 1000:1 的比例去创造任何有用的东西,但我很享受它并希望看到它完成,我已经...
我正在安装布局解析器并点击此链接。使用以下软件包没有遇到任何问题。 pip 安装布局解析器 pip install "layoutparser[effdet]" 点安装
我使用箱线图方法找到了数据中的异常值。 在此处输入图像描述 箱形图 在应用 IQR 方法之前 文件1.形状 # (457, 11) 我已将 IQR 方法应用于数据。 ...
是否建议对已经one-hot编码的数据进行主成分分析(PCA)
我正在做一个项目,虽然机器学习模型做得还不错,但我觉得还可以更好。该模型可以很好地预测多数类别,但不能很好地预测少数类别。召回和
我为客户流失数据集拟合了逻辑回归模型,结果如下 对数结果 我用验证集测试了这个模型并计算了 ROC AUC 分数,这是