data-mining 相关问题

数据挖掘是分析大量数据以查找模式和共性的过程。

机器学习中使用的“相对绝对误差”和“根相对平方误差”的公式(由Weka计算)

在开源数据挖掘软件Weka(用Java编写)中,当我运行一些数据挖掘算法(如线性回归Weka)返回模型和一些模型评估测试数据的指标时。看起来...

回答 3 投票 7

如何使用置换特征重要性获取值

我有一个5K(和60个要素)记录的数据集,主要用于二进制分类。请注意,此解决方案在这里不起作用,我正在尝试使用置换生成特征重要性...

回答 1 投票 1

如何为ML模型正确设置种子值?

我不熟悉ML,并且运行不同的分类模型。我观察到的是,每次运行模型时,我都会得到略有不同的结果。我在网上了解到,这与设定种子价值有关。但是我...

回答 1 投票 0

ErrorException(E_NOTICE)试图获取非对象[重复]的属性'sentimen'>>

[帮助,我收到一条错误消息ErrorException(E_NOTICE)。试图获取非对象公共函数prediksi(){$ collection = array();的属性'sentimen'。 $ ...

回答 1 投票 -2

ErrorException(E_NOTICE)试图获取非对象的属性“ sentimen”

大家好,我在我的代码$ collection = array();中遇到错误; $ title =“数据处理专家”; $ testing_data = DataTesting :: count(); $ klasifikasi = DataTesting :: with(...

回答 1 投票 0

[一维数字数组聚类

可能重复:最佳地对一维数据进行聚类?所以说我有一个像这样的数组:[1,1,2,3,10,11,13,67,71]有没有一种方便的方法可以将数组划分成类似...

回答 2 投票 61

Laravel“ ErrorException(E_NOTICE)未定义的变量:类” [重复]

每个人都可以帮助我,我遇到了一个问题“ ErrorException(E_NOTICE)未定义的变量:类” $ title =“数据培训”; foreach(Sentimen :: all()as $ stm){$ class ['class'...

回答 1 投票 0

如何查找一个数据集是否受到另一个数据集的影响?

我对这种数据挖掘非常陌生。我有2个数据集,分别是人类发展指数和预期寿命指数,我想知道预期寿命数据集是否正在影响HDI的值...

回答 1 投票 -1

不同的数据类型会影响特征选择算法的规范化

假设我们的数据集有1000个数据(矩阵行)和700个要素(矩阵列)。我想运行各种类型的特征选择算法以找到最佳特征。此数据集的特征是...

回答 1 投票 0

为什么可以将不同的股票合并在一起以建立一个单一的预测模型?

给定具有股票A的d个特征的n个样本,我们可以建立(d + 1)维线性模型来预测利润。但是,在某些书中,我发现如果我们有m个不同的股票,其中n个样本且d ...

回答 1 投票 0

如何根据R中的条件替换列值

我有一个不同订单的数据集以及该订单的数量给客户。我想从所有行中删除ordertype ==“ cap”并为该订单形成相应的数量...

回答 1 投票 0

以编程方式修改gnuplot脚本中的变量

我有一个从程序中生成的值的成对的t文件,教授给了我们一个基本的gnuplot脚本供您使用。但是,标题,输出文件名和输入数据文件都是硬-...

回答 2 投票 2

您如何在数据挖掘/数据科学中基于关联规则找到集群?

假设您有一个数据库Transcation-ID Item_list 1 [面包,黄油,牛奶,尿布] 2 [面包,黄油] 3 [可乐,尿布] 4 [芯片,...

回答 2 投票 0

如何计算pyspark RDD中每对行中相等值的数量

[我正在尝试在pyspark中实现LSH,为此我为我的文档集中的每个文档创建了最小哈希签名,然后分成带(在这里,我发布了一个简化示例,仅带2个带和一个...

回答 1 投票 0

数据挖掘的最小支持和最小置信度

我想知道在挖掘关联规则中是否可以自动确定最小支持和最小置信度?如果是这样,则任何指向资源的提示或指针都将是很好的。

回答 1 投票 4

数据集元数据的文件格式

我想知道并比较尽可能多的文件格式,它们可以存储要素,属性或字段的元数据。属性的元数据可以是:存储类型:字符串,数字,...

回答 1 投票 0

对文本挖掘中的K均值分类

目标是创建一个计算机生成的新闻网站,该新闻网站汇总来自世界各地不同新闻来源的头条新闻:看一下我想了解的质心表结果...]

回答 2 投票 0

在sklearn(python 2.7)中创建具有分组约束的训练,测试和交叉验证数据集?

[在Python中创建训练,测试和交叉验证示例时,我看到默认方法为-:1.跳过标题后,读取数据集2.创建训练,测试和交叉验证...

回答 2 投票 3

哪种数据集最适合这些常见分类器?

哪种数据集最适合朴素贝叶斯? KNN?和决策树?您能否为每个示例提供一个简单的示例。我知道决策树更像是二进制分类器,因此它可以工作...

回答 1 投票 -2

使用Khatri-Rao积的综合排名

我已经构造了2个图并计算了每个节点的特征向量中心性。每个节点都可以视为一个单独的项目贡献者。考虑2个不同的项目排名...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.