是否有任何模块可以接受多个数据集进行处理?例如,“拆分数据”,“编辑元数据”和“选择数据集中的列”不接受多个数据集作为输入。
这就是我所做的:我的模型中有几个数字和分类变量。我使用“转换为指标变量”模块为我的数据创建虚拟变量。如何将指标变量和数值变量包含到一个数据集中,以便我可以拆分模型的数据?
截至目前,我正在使用Python进行数据争论,并在Azure MLS中移动数据集进行建模。理想情况下,我需要在Azure MLS中处理数据争用。
我希望有一个模块可以整合Azure MLS中的分类分箱变量和数值变量
是的,有几个模块接收多个数据集 - Add Columns,Apply SQL Transformation,Execute Python Script,仅举几例。
不知道为什么你需要它们作为指标值 - 假设你正在谈论训练/测试分裂,那么我只是在调用“转换为指标值”模块后拆分数据。