unsupervised-learning 相关问题

无监督学习是指机器学习环境,其中没有先前的“训练”时期,其中学习代理被训练在已知类型的对象上。因此,监督学习包括诸如数学聚类之类的学科,其中数据基于数学属性的最小化或最大化而被分割成聚类,而不是通过理解正确的上下文来分类。

在Weka中标记未标记的电影评论

我的数据集只有一行,即电影评论。我想执行情感分析,但如果不为电影评论分配标签,我就无法做到这一点。我需要帮助标记这些电影评论。我...

回答 1 投票 0

类型错误:pyclustering 库中未调整大小的对象的 len()

我正在使用 pyclustering 库来执行 K 均值。我正在使用的数据集以 CSV 格式读取,如下面的代码所示。我尝试过将 X_scaled 作为 numpy 数组传递,作为我们的列表......

回答 1 投票 0

任何人都可以建议更好的机器学习算法吗?

你能建议一个更好的算法吗? 我有一个数据集,有 29 个输入和 1 个输出。目前训练数据集由 2242 行组成。 我尝试了几种算法,我得到的最好的是

回答 1 投票 0

使用 TSNE 和 Kmeans 进行无监督学习

我正在尝试对数据集进行无监督学习来进行特征提取,并找出哪组数据聚集在一起以及该组数据的主要特征(质心)是什么......

回答 1 投票 0

在无监督 GNN 中,为什么我的参数没有更新以及为什么损失只是噪声

我想实现一个无监督的 GNN,以便它可以标记我的节点。我想定义损失函数来描述节点值与其邻居值之间的关系。

回答 1 投票 0

隔离森林中是否可以动态调整污染参数?

我使用隔离森林构建了一个异常检测模型,污染参数默认设置为 (0.1)。它在我当前的数据集上运行得很好,但现在我有不同的文件......

回答 2 投票 0

深度学习中无监督学习的核心思想是什么?

无监督学习的核心思想是什么? 在许多教程中,都列出了监督学习的示例,例如 MNIST 手写数字识别和 IMDB 电影评论分类。豪...

回答 2 投票 0

实施隔离森林来检测异常

我想使用隔离森林来识别帐户访问系统的持续时间(分钟)的异常值。当系统访问时间超过 40 分钟时...

回答 1 投票 0

GMM 用于无监督异常检测(成分和分数)

我必须对由 50 个特征组成的大型数据集执行无监督异常检测,并且我对高斯混合模型 (GMM) 有一些疑问。 经过网格搜索后,我是...

回答 1 投票 0

K-均值算法

我正在尝试用Java编写k-means算法。我计算了许多数组,每个数组都包含许多系数。我需要使用 k-means 算法来对所有这些进行分组

回答 8 投票 0

为什么BERT或GPT-3等模型在预训练时有输出(标签)时就被认为是无监督学习

我对无监督学习不是很有经验,但我的一般理解是,在无监督学习中,模型在没有输出的情况下进行学习。然而,在预训练期间...

回答 1 投票 0

我们可以通过进行一些特征工程来为未标记的数据集生成标签吗?

我对机器学习非常陌生,目前我正在构建一个可以预测重复献血者的模型(分类问题)。我有一个包含 25 个特征(性别、身高...

回答 1 投票 0

如何从该图中使用AIC和BIC方法在K均值聚类中选择K?

我必须通过使用 AIC 和 BIC 评分方法来确定 k 来确定 Mall_Customers.csv 中的组,有 2 个变量是支出分数 (1-100) 和年收入 (k$) 在此处输入图像描述 我想要一个

回答 1 投票 0

使用Python进行时间序列分割

我有一个 TimeSeries 数据集,其中包含如下所示的图。我正在尝试找到对时间序列进行分割的最佳方法。我需要将时间序列分为三个区域 - 'R...

回答 4 投票 0

在机器学习中,关联和回归有什么区别?

我知道关联属于无监督学习,回归属于监督学习,但我不明白它们之间的实际/实际差异。 据我搜索,...

回答 1 投票 0

降维创建唯一变量

我有一个数据集,其中包含数十个与健康相关的变量:其中一些是定量的(例如“身体质量指数”),其中一些是定性的(例如变量 isDrinking,需要...

回答 0 投票 0

是否有任何用于无监督训练的情感论坛数据集?

我最近完成了一个机器学习课程,想做一个论坛情绪分析工具,将其应用到股票相关的论坛中。 这个想法是: 使用

回答 2 投票 0

您如何知道哪些数据示例使用自组织地图分类最准确?

这是我应用 SOM 通用规则的数据示例: 如果 distance1 > distance2 比 class C1 else class C2 ; 所以在这个例子中,我使用了一个自组织映射,它只聚集了两个类......

回答 0 投票 0

hdbscan.fit() 上的进度条

我正在以这种方式使用 HDBScan 执行聚类: hdbscan_cluster = hdbscan.HDBSCAN( min_cluster_size = min_cluster_size, min_samples=最小样本, 公制=公制, 阿尔法=阿尔法,

回答 1 投票 0

scikit-learn 文档示例:“有一个意外的关键字参数”

从 scikit-learn 文档运行此示例时,我收到错误 v_measure_score() 得到了一个意外的关键字参数“beta”: 从 sklearn 导入指标 labels_true = [0, 0, 0, 1, 1,...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.