撤消比例数据pyspark

问题描述 投票:2回答:1
from pyspark.ml.feature import MinMaxScaler
from pyspark.ml.linalg import Vectors

df = spark.createDataFrame([
   (0, Vectors.dense([5.0, 0.1, -1.0]),),
   (1, Vectors.dense([2.0, 2.1, 1.0]),),
   (2, Vectors.dense([3.0, 10.1, 7.0]),)
], ["id", "features"])

scaler = MinMaxScaler(inputCol="features", outputCol="scaledFeatures")
scaler_model = scaler.fit(df)
scaled_data = scalerModel.transform(df)

scaled_data是转换后的数据。

在拟合机器学习模型后,如何进行反比例分析结果?

apache-spark pyspark apache-spark-mllib
1个回答
1
投票

MinMaxScaler添加了缩放功能作为新的scaledFeatures列,因此您的实际数据不会丢失。

在将features输出列用于机器学习模型之前,您可以使用scaledFeatures列来分析它。

© www.soinside.com 2019 - 2024. All rights reserved.