如何将CSV文件转换为SVM以进行ML培训

问题描述 投票:-1回答:1

我有这个数据集,我希望在Apache Spark 2.1.1中训练多个ML模型。它由10列组成,其中2列包含字符串。删除这些列不是一种选择,因为它们对我希望收集的信息至关重要。但是,由于此问题,我无法将CSV文件转换为SVM以继续进行实验。

我已经尝试将其转换为RDD,然后成功保存为SVM,但文件永远不会保存。还有其他方法吗?

python csv pyspark svm naivebayes
1个回答
0
投票

您可以在相关的两列中创建两个字符串数组,并使用索引作为要素(而不是使用字符串值)来训练模型。

© www.soinside.com 2019 - 2024. All rights reserved.