Fasttext中的精确度和召回率

我是Fasttext的新手。我已经有一些关于这个库的问题，对某些人来说它们看起来很明显，但我真的想要得到正确的直觉。非常感谢您的帮助。

首先，我在谈论Fasttext的Text分类部分。根据here提供的教程，我们预测给定文本的不同标签。我们是否真的为每个标签分配给定的测试文本，并且该文本符合标签的概率？

第二个问题，任何人都可以澄清/解释P 1（精确度1）和R 1（召回1）的含义，在这种情况下Fasttext中使用的度量标准吗？我找到了一个答案here。但这个答案给我带来了更多问题：

在链接提供的响应中 - 那么P @ 1和R @ 1是什么？根据那里的逻辑和解释，P 1是一个结果（在我们的上下文中 - 标签），我们可能有1个正确或1个不正确的标签，这意味着P @ 1只能取值0或1 ，对？我们如何在这里获得概率？我们应该只计算所有文本样本中所有1的份额吗？如果是，那么R @ 1是什么？在这种情况下如何计算？在这种情况下，R @ k一般是什么？

在tutorial提供的例子中P @ 1和R @ 1是什么，他们计算了P @ 5和R @ 5，对吧？

非常感谢提前，

0
投票

是的，为不同的标签分配概率。您可以通过运行以下命令来查看每个标签的概率，其中my_model.bin和data.test替换为相应的名称，k是数据集中的标签数量：./ fasttext predict-prob my_model.bin data .test k

0
投票

首先，精度是正确预测的标签数量与模型预测的标签数量之比，而@ 1是指时期。默认情况下，fastText运行5个时期。其次，Recall是正确预测标签数量与验证数据集中实际标签数量的比率。

例如：数据集中输入的实际标签：A，B，C，D，E

模型输入的预测标签：A，B，C，G

正确预测标签：A，B，C

精度：3/4 = 0.75

回忆：3/5 = 0.6