unsupervised-learning 相关问题

无监督学习是指机器学习环境,其中没有先前的“训练”时期,其中学习代理被训练在已知类型的对象上。因此,监督学习包括诸如数学聚类之类的学科,其中数据基于数学属性的最小化或最大化而被分割成聚类,而不是通过理解正确的上下文来分类。

如何评估 5 个数据点与 1 个目标数据点的相似程度

我正在努力解决我需要解决的问题。 假设我们有一个汽车数据集 (1),其中包含许多具有不同特征(id、年龄、里程、颜色、型号……)的不同汽车。哦...

回答 1 投票 0

类型错误。__init__()得到了一个意外的关键字'madataset_iter'。

我的问题是关于K-means聚类算法,我一直得到错误的TypeError。__init__()得到了一个意外的关键字'madataset_iter',当我试图在拟合后可视化聚类时...。

回答 1 投票 0

一位培训师在视频中这样做了。他只是简单地解释说,他这样做是因为R的默认性质。然而,我从来没有见过这种应用。它是正确的,为什么他这样做?

回答 1 投票 0

文件的聚类与它的结构。

我的工作是通过观察文档的结构来进行聚类。到目前为止,我所做的。在下面的代码中提取了嵌入(Bert embeddings)中的结构变量X。我所...

回答 2 投票 2

深度强化学习中的状态值

我正在学习深度强化学习。我在状态值方面有点困惑。是否可以在状态中使用动态值,或者我们必须使用离散值,并为每个值创建一个状态,我们 ...

回答 1 投票 0

我想让我的脚本查看给定年份的抽象列,以创建一个集群。

谢谢你的时间,伙计们,请我需要你的帮助。这个看的是所有带文字的栏目,应该是只看抽象的栏目,按每个年份来得出聚类。所以...

回答 0 投票 0

KMeans中不同簇的数量小于n_clusters?

我将一些食物图像存储在一个文件夹中。所有图像都没有标签,也没有存储在单独的文件夹中,例如“意大利面”或“肉”。我当前的目标是将图像聚类到...

回答 1 投票 0

OPLS-DA假人脚本[关闭]

我需要进行OPLS-DA歧视性分析,但是我不知道如何开始编写脚本。也许这太广泛了,但我完全迷失了。任何人都可以帮助!?谢谢!莉莉

回答 1 投票 -1

建模流失(有监督与无监督)

非常感谢您的反馈/意见。我正在尝试预测我的业务流失。我正在处理相对较少的流失和1年的时间跨度。今天未搅拌的客户可能...

回答 1 投票 0

对于多标签外部聚类评估指标,NMI和B3相等

归一化互信息(NMI)和B3用于外部聚类评估指标。当每个实例(样本)...

回答 1 投票 0

多语言自由文本项目用于改进推荐系统的文本分类

为了改善买方物料组的推荐人系统,我们公司愿意使用客户历史支出数据来训练模型。该模型应在历史上的“短文本...

回答 1 投票 1

无论簇中心如何初始化,均可以保证Kmeans算法收敛?为什么?

K-均值是一种迭代算法,可随机初始化聚类中心。无论簇中心如何初始化,均可以保证Kmeans算法收敛吗?为什么?

回答 1 投票 0

sklearn匹配结果在数据集增加时变得未对齐

我一直在使用sklearn NearestNeighbors进行名称匹配,并且在某些时候结果变得不对齐。我的标准化名字列表是1亿个。我的名字列表是...

回答 1 投票 0

如何在pyspark中添加新列,并将其值基于其他列?

我有一个如下的数据集nogk是一个具有多列的数据框。现在我想创建一个新列filed_position,它仅基于位置取3个值。新列只能取3个...

回答 1 投票 0

使用Gensim实现潜在的Dirichlet分配

我正在做有关LDA主题建模的项目,我使用gensim(python)来做到这一点。我阅读了一些参考资料,它说要获得最佳的模型主题,thera是我们需要确定的两个参数,...

回答 1 投票 0

电子邮件分类中有word2vec和KMeans的问题(无论买方还是非买方)

该数据集包含大约1万封电子邮件文本。想法是将它们分为买方或非买方类别。买方电子邮件中的某些标准字词遵循以下模式:请求报价...

回答 1 投票 -1

数据点被很好分类的概率

我混合了带标签的数据和未带标签的数据,这最后一个我想使用半监督学习对其进行分类。假设我已经有一种算法,可以在...

回答 1 投票 0

在R中的一个城市中对长/时热点区域进行聚类的最佳方法?

我是R和(无监督)机器学习的新手。我正在尝试为R中的数据找到最佳的群集解决方案。我的数据是关于什么的?我有一个+/- 800长/纬度WGS84的数据集...

回答 1 投票 0

聚类数据-不良结果,特征提取

我已经获得了在不同运行条件下运行的风力涡轮机的测量数据(振动)。我的数据集包括工作条件以及我从...

回答 1 投票 0

从纯文本中提取结构化数据的实用方法:寻找想法和反馈

我是一个本地乘车分享Facebook组的成员。该小组专门针对两个城市以及介于两者之间的所有事物,因此该职位(主要)是这样的:“我要从城市A开车到城市Z ...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.