为什么手写数字分类中没有明确的顺序?

问题描述 投票:0回答:1

摘自The Elements of Statistical Learning的第二章:

from chapter 2

显然可以订购0、1、2、3 ...,9。我有什么误会?是因为这些数字的排序无助于分类吗?

machine-learning mnist
1个回答
0
投票

这里的关键词是手写

当我们尝试对手写数字(MNIST)的图像进行分类时,实际数字的算术值(以及由此而来的排序)不属于分类问题;其中,类别(即数字)“ 9”不比类别“ 8”“大”(也不也不是“小于”),并且类别“ 9”和类别“ 8”之间的距离与距离相同在“ 9”和“ 3”之间(实际上,所有成对的类之间都相同)。换句话说,数字被视为分类变量。

换句话说,这里的分类方法与我们用来对手写的字母进行分类的方法相同,当然,它们在算术意义上没有任何排序(没有字母是“更大”或“更少” ”。)>

另一个可能有用的类比是在数字

9字符 '9'之间;实际上,在手写数字分类中,我们是在处理第二个数字,而不是数字。而且字符/字符串(如字母)没有任何算术顺序。

例如,与虹膜数据集的情况相同,或者在我们尝试预测性别(男性/女性)的问题中。

存在are

个分类问题,尽管标签是分类的,但标签也是ordinal(即它们是有序的),例如高/中/低但是对MNIST数字进行分类不属于此类别-而是关于数字图像的模式识别和区分,而无需使用其实际值或顺序。
© www.soinside.com 2019 - 2024. All rights reserved.