Fasttext中的精确度和召回率

问题描述 投票:1回答:2

我是Fasttext的新手。我已经有一些关于这个库的问题,对某些人来说它们看起来很明显,但我真的想要得到正确的直觉。非常感谢您的帮助。

首先,我在谈论Fasttext的Text分类部分。根据here提供的教程,我们预测给定文本的不同标签。我们是否真的为每个标签分配给定的测试文本,并且该文本符合标签的概率?

第二个问题,任何人都可以澄清/解释P 1(精确度1)和R 1(召回1)的含义,在这种情况下Fasttext中使用的度量标准吗?我找到了一个答案here。但这个答案给我带来了更多问题:

  • 在链接提供的响应中 - 那么P @ 1和R @ 1是什么?根据那里的逻辑和解释,P 1是一个结果(在我们的上下文中 - 标签),我们可能有1个正确或1个不正确的标签,这意味着P @ 1只能取值0或1 , 对?我们如何在这里获得概率?我们应该只计算所有文本样本中所有1的份额吗?如果是,那么R @ 1是什么?在这种情况下如何计算?在这种情况下,R @ k一般是什么?

tutorial提供的例子中P @ 1和R @ 1是什么,他们计算了P @ 5和R @ 5,对吧?

非常感谢提前,

precision text-classification precision-recall fasttext
2个回答
0
投票

是的,为不同的标签分配概率。您可以通过运行以下命令来查看每个标签的概率,其中my_model.bin和data.test替换为相应的名称,k是数据集中的标签数量:./ fasttext predict-prob my_model.bin data .test k


0
投票

首先,精度是正确预测的标签数量与模型预测的标签数量之比,而@ 1是指时期。默认情况下,fastText运行5个时期。其次,Recall是正确预测标签数量与验证数据集中实际标签数量的比率。

例如:数据集中输入的实际标签:A,B,C,D,E

模型输入的预测标签:A,B,C,G

正确预测标签:A,B,C

精度:3/4 = 0.75

回忆:3/5 = 0.6

© www.soinside.com 2019 - 2024. All rights reserved.