我需要使用ML.NET来处理大量的文本块,并确定任何给定的文本块是否有可能属于许多不同的类别。
目前我有多个布尔值列,当通过ML.NET发现任何给定的文本块匹配时,我想将其标记为真。
我是一个完全陌生的ML,当通过样本进行分类时,它似乎只是 一个 任何一个文本块的分类。谁能给我指出一个方向来处理 众多 单一文本块的分类?或许可以提供一些示例代码?
这是一个所谓的多分类问题。在我们正在处理(一个)布尔列的情况下,这是一个二进制的情况,它可以是Yes或No,True或False。你需要做的是,代替的是有一个 类型 列,其中有多个可能的值,例如每种文本类型都有一个。一个好的例子可能是这里的问题分类器。
如果你对使用Jupyter Notebooks很满意,这里还有一个我创建的例子。https:/github.comaslottemlnet-jupyterblobmastersrcDataViewmulti-class%20classification.ipynb。
希望对大家有所帮助!