计算二元分类器的效率

先决条件: target=“_blank”>开始分类

null

在本文中,我们将讨论一种计算效率的方法 二元分类器 .假设存在一个问题,我们必须对属于a类或B类的产品进行分类。

图片[1]-计算二元分类器的效率-yiteyi-C++库

让我们定义几个统计参数:

总磷 (真正数)=A类产品的数量,分类为A类产品。 FN (假阴性)=分类为B类产品的A类产品数量。 TN (真负)=分类为B类产品的B类产品数量。 FP (假阳性)=分类为A类产品的B类产品数量。

FP = N-TP;      // where number N is the number of class A type productsFN = M-TN;     // where number M is the number of class B type products

我们将看看这个例子,以便更好地理解这些参数。

如果 (+) 表示适合该职位的候选人,以及 (-) 表示不适合这份工作的候选人。

Statistical_Paramenters

为了计算分类器的效率,我们需要计算 敏感性、特异性 精确 .

体贴 测量正确识别为阳性的比例。 也称为 真阳性率 (TPR)。

特异性 测量正确识别的底片比例。 也称为 真阴性率 (TNR)。

精确 测量测试预测TPR和TNR的程度。

Sensitivity = ( TP / (TP+FN) ) * 100;Specificity = ( TN/(TN+FP) ) * 100;Accuracy = ( (TP+TN) / (TP+TN+FP+FN) ) * 100;Efficiency = ( Sensitivity + Specificity + Accuracy ) / 3; 

让我们以上面的例子来计算选择的效率:

假设合适的候选人属于A类,不合适的候选人属于B类。

Before Interview :  N = 4 and M = 4After Interview : TP = 2 TN = 2 FP = N - TP = 2FN = M - TN = 2Sensitivity = 2/(2+2)*100 = 50Specificity = 2/(2+2)*100 = 50Accuracy    = (2+2)/(2+2+2+2)*100 = 50Efficiency  = (50+50+50)/3 = 50So,Efficiency of selection of candidates is 50% accurate.

其他绩效指标:

  • 错误率 =(FP+FN)/(TP+TN+FP+FN)
  • 精确 =TP/(TP+FP)
  • 回忆起 =TP/(TP+FN)
  • BCR(平衡分类率) =1/2*(TP/(TP+FN)+TN/(TN+FP))
  • AUC =ROC曲线下的面积

接收机工作特性曲线:

  • 接收机工作特性(ROC)曲线:由分类算法的一个参数参数化的二维曲线。
  • AUC始终在0和1之间。
  • ROC曲线可以通过绘制y轴上的TPR和x轴上的TNR来获得。
  • AUC给出了所提出模型的准确性。

图片[3]-计算二元分类器的效率-yiteyi-C++库

参考资料:

© 版权声明
THE END
喜欢就支持一下吧
点赞5 分享