数据科学涉及以任何形式或形式从数据中提取知识或见解。它可以包含预测分析,通常需要进行大量的数据争论。请考虑在https://datascience.stackexchange.com/上发帖
我正在做一个t检验,看看两组A和B的平均值是否不同。 A组 - 样品大小约20K组B - 样品大小约670K t测试A和B由于P值较小...
我一直在努力使用python中的sklearn进行因子分析。在运行以下代码后的R中:x.f
我有大量用户的位置数据(数十万)。我存储当前位置和一些历史数据点(分钟数据返回一小时)。我该怎么办......
series / dataframe和ndarray有什么区别?
留下他们来自两个不同的二进制文件。我知道系列/数据帧可以包含任何数据类型,而ndarray也是异构数据。而numpy的所有切片操作都是......
如何同步修改后的项目并在floydhub中运行?我正在尝试运行我新修改的项目。但是每次$ floyd在命令行中运行“python main.py”时,它都运行较旧的(...
(Python)Markov,Chebyshev,Chernoff上界函数
我在学习的路上遇到了一项任务。对于二项分布X~Bp,n具有平均μ= np和方差σ** 2 = np(1-p),我们希望上限为c≥1的概率P(X≥c⋅μ)。 ...
我正在研究minmax算法,我想做alpha-beta修剪......我读了一个有这棵树的例子。我不明白,如何获得子节点的值,用红色标记。有人可以......
我搜索了大熊猫文档和食谱配方,很明显你可以使用dataframe.columnName.round(decimalplace)轻松地舍入到最近的小数位。你是怎么做到的......
我是初学者,我正在努力让我的生活能够理解这个与流程相同的其他堆栈与我有同样的问题.Logistic回归:未知标签类型:'连续'这是......
没有找到任何关于此的内容,所以我希望我的问题能在这里找到答案。问题集:一切都属于采用布隆过滤器的隆起采矿。我有成千上万的绽放过滤器...
Sklearn模型系数并预测linear_model中的不匹配
我对ML和sklearn相对较新,我正在尝试使用具有不同正则化参数值的linear_model.Lasso来训练具有6种不同特征的输入数据的线性模型。 ...
在为神经网络训练准备训练集时,我找到了两种可能的方法。传统方式:计算整个训练集的均值,并在发送之前减去每个图像的固定平均值...
我已经预先训练了一个模型并保存。现在我想将它用于另一个数据集的训练测试目的。有点像转学习。我的模型架构如下。 model.summary()...
我在文本文件中有几个句子,如下所示。 1)篮子里必须有面包和果酱2)可能含有任何水果(如橙子,苹果,葡萄等),现在我想得到......
使用Pandas DataSeries在Jupyter中工作我有一个像这样的行的数据集:color:white engineType:diesel make:Ford manufacturingYear:2004 accidentCount:123我需要做的是绘制......
如何使用pygal(python)在一个图表中绘制多个图形?
我正在尝试使用两个测量来绘制多个系列(所以它实际上是使用pygal在一个图中的num_of_时间序列* 2个图。数据看起来应该是这样的:来自集合导入...
我不是数据科学家,也不是数据科学/机器学习的新手。我的目标是预测某些文本是否属于特定类。我看起来很天真的海湾来分类文字......
我有一个简单的R脚本来创建基于文件的预测。数据自2014年以来已被记录,但我无法实现以下两个目标:仅绘制预测的一部分......
确定以下数据点的回归线:(x1,y1)=(1,4),(x2,y2)=(2,3),(x3,y3)=(3,9)即函数h( x)= w + hx,最小化该数据的平方误差损失。