跳到主要内容

分类:正误分类的一些基础概念

相信大家以前都听过一则《狼来了》的寓言故事,以此来警示各位小朋友不要向大人说谎,寓言大致讲的是一个调皮的牧羊小孩,三番五次的谎称狼来了以此来捉弄大家,而当狼真的来时就没人再相信他说的话了。

用狼来了的故事来举例,村民们其实只关注一个结果:狼真的来了吗?为了进行统计实验,首先需要对该结果集做一个定义:

  • 正例(Positive):狼来了。
  • 负例(Negative):狼没来。

而牧童作为观察者,对该结果进行经验性地预测,这时我们就会分别得到四种预测结果:

  • 真正例(True Positive / TP):真的狼来了,实际来了。
  • 假负例(False Positive / FP):假的狼来了,实际没来。
  • 真负例(True Negative / TN):真的狼没来,实际没来。
  • 真负例(False Negative / FN):假的狼没来,实际来了。

再进一步概述就是,TP/TN 指模型正确的预测了结果,而 FP/FN 代表模型错误的预测了结果。对于牧童而言,由于他每次都传递错误的结果,就导致他预测的准确性在村民的心中已经不可行,因此当他在传递正确的结果时,已经没有人再相信它了。