分类:正误分类的一些基础概念
相信大家以前都听过一则《狼来了》的寓言故事,以此来警示各位小朋友不要向大人说谎,寓言大致讲的是一个调皮的牧羊小孩,三番五次的谎称狼来了以此来捉弄大家,而当狼真的来时就没人再相信他说的话了。
用狼来了的故事来举例,村民们其实只关注一个结果:狼真的来了吗?为了进行统计实验,首先需要对该结果集做一个定义:
- 正例(Positive):狼来了。
- 负例(Negative):狼没来。
而牧童作为观察者,对该结果进行经验性地预测,这时我们就会分别得到四种预测结果:
- 真正例(True Positive / TP):真的狼来了,实际来了。
- 假负例(False Positive / FP):假的狼来了,实际没来。
- 真负例(True Negative / TN):真的狼没来,实际没来。
- 真负例(False Negative / FN):假的狼没来,实际来了。
再进一步概述就是,TP/TN 指模型正确的预测了结果,而 FP/FN 代表模型错误的预测了结果。对于牧童而言,由于他每次都传递错误的结果,就导致他预测的准确性在村民的心中已经不可行,因此当他在传递正确的结果时,已经没有人再相信它了。