我有一个同时具有分类和浮点dtypes的csv。我要执行以下操作:
pd.unique()
)。说u_l
作为专栏len(u_l)
决定我要嵌入的特定类别列使用的嵌入尺寸(此步骤是我无法使用tensorflow_transform的原因)category (token)
值映射到嵌入索引的有状态节点,因此随后我可以从我在步骤2中创建的嵌入矩阵中查找嵌入。我目前不知道该怎么做。我看到的一个非常优雅的解决方案是使用tensorflow_datasets:
encoder = tfds.features.text.TokenTextEncoder(u_l,decode_token_separator=' ')
c_l
)连接整个列(c_l
现在是一个字符串,然后使用encoder.encode(c_l)
这是一个非常基本的东西,我认为tensorflow可以相对轻松地完成。请引导我找到正确的解决方案
我有一个同时具有分类和浮点dtypes的csv。我要执行以下操作:对于每个分类列,我将使用pandas来计算出现在...