sklearn.preprocessing中LabelEncoder的类似方法?

问题描述 投票:0回答:1

为了编码像sex这样的分类数据,我们通常在LabelEncorder()中使用scikit learn。但是,如果我要使用Tensorflow而不是Scikit Learn,那么执行此类任务的等效功能或方法是什么?我知道我们可以用one hot encoding轻松地做tensorflow,但之后它会创建标签为1001而不是10

tensorflow machine-learning scikit-learn data-science
1个回答
0
投票

TensorFlow中有一个名为tf.feature_columns的包,它包含4个从输入数据创建分类列的方法:

  • categorical_column_with_hash_bucket(...):将输入值哈希到固定数量的类别
  • categorical_column_with_identity(...):如果您有数字输入,并且您希望将值本身视为分类列
  • categorical_column_with_vocabulary_list(...):根据固定(记忆)单词列表输出类别
  • categorical_column_with_vocabulary_file(...):与_list相同,但从文件中读取词汇表

该软件包还提供了更多将输入数据输入模型的方法。有关概述,请参阅该软件包开发人员编写的blogpost

© www.soinside.com 2019 - 2024. All rights reserved.