如何管理多个数据集 - 机器学习Azure

问题描述 投票:0回答:1

是否有任何模块可以接受多个数据集进行处理?例如,“拆分数据”,“编辑元数据”和“选择数据集中的列”不接受多个数据集作为输入。

这就是我所做的:我的模型中有几个数字和分类变量。我使用“转换为指标变量”模块为我的数据创建虚拟变量。如何将指标变量和数值变量包含到一个数据集中,以便我可以拆分模型的数据?

截至目前,我正在使用Python进行数据争论,并在Azure MLS中移动数据集进行建模。理想情况下,我需要在Azure MLS中处理数据争用。

我希望有一个模块可以整合Azure MLS中的分类分箱变量和数值变量

azure-machine-learning-studio data-transform
1个回答
0
投票

是的,有几个模块接收多个数据集 - Add ColumnsApply SQL TransformationExecute Python Script,仅举几例。

不知道为什么你需要它们作为指标值 - 假设你正在谈论训练/测试分裂,那么我只是在调用“转换为指标值”模块后拆分数据。

© www.soinside.com 2019 - 2024. All rights reserved.