先决条件: target=“_blank”>开始分类
null
在本文中,我们将讨论一种计算效率的方法 二元分类器 .假设存在一个问题,我们必须对属于a类或B类的产品进行分类。
让我们定义几个统计参数:
总磷 (真正数)=A类产品的数量,分类为A类产品。 FN (假阴性)=分类为B类产品的A类产品数量。 TN (真负)=分类为B类产品的B类产品数量。 FP (假阳性)=分类为A类产品的B类产品数量。
FP = N-TP; // where number N is the number of class A type productsFN = M-TN; // where number M is the number of class B type products
我们将看看这个例子,以便更好地理解这些参数。
如果 (+) 表示适合该职位的候选人,以及 (-) 表示不适合这份工作的候选人。
为了计算分类器的效率,我们需要计算 敏感性、特异性 和 精确 .
体贴 测量正确识别为阳性的比例。 也称为 真阳性率 (TPR)。
特异性 测量正确识别的底片比例。 也称为 真阴性率 (TNR)。
精确 测量测试预测TPR和TNR的程度。
Sensitivity = ( TP / (TP+FN) ) * 100;Specificity = ( TN/(TN+FP) ) * 100;Accuracy = ( (TP+TN) / (TP+TN+FP+FN) ) * 100;Efficiency = ( Sensitivity + Specificity + Accuracy ) / 3;
让我们以上面的例子来计算选择的效率:
假设合适的候选人属于A类,不合适的候选人属于B类。
Before Interview : N = 4 and M = 4After Interview : TP = 2 TN = 2 FP = N - TP = 2FN = M - TN = 2Sensitivity = 2/(2+2)*100 = 50Specificity = 2/(2+2)*100 = 50Accuracy = (2+2)/(2+2+2+2)*100 = 50Efficiency = (50+50+50)/3 = 50So,Efficiency of selection of candidates is 50% accurate.
其他绩效指标:
- 错误率 =(FP+FN)/(TP+TN+FP+FN)
- 精确 =TP/(TP+FP)
- 回忆起 =TP/(TP+FN)
- BCR(平衡分类率) =1/2*(TP/(TP+FN)+TN/(TN+FP))
- AUC =ROC曲线下的面积
接收机工作特性曲线:
- 接收机工作特性(ROC)曲线:由分类算法的一个参数参数化的二维曲线。
- AUC始终在0和1之间。
- ROC曲线可以通过绘制y轴上的TPR和x轴上的TNR来获得。
- AUC给出了所提出模型的准确性。
参考资料:
© 版权声明
文章版权归作者所有,未经允许请勿转载。
THE END