(1) 若一个实例属于正类,但被预测为正类,则称为真正类(True Positive, TP)。
(2) 若一个实例属于负类,且被预测为负类,则称为真负类(True Negative, TN)。
(3) 若一个实例属于负类,却被预测为正类,则称为假正类(False Positive, FP)。
(4) 若一个实例属于正类,却被预测为负类,则称为假负类(False Negative, FN)。
准确率(正确率)是指所有预测正确的样本数占总样本数的比例,即 (TP+TN)/总样本数。
准确率也可以表示为将正类预测为正类的样本数占所有预测为正类的样本数的比例,即 TP/(TP+FP)。
召回率是指将正类预测为正类的样本数占所有实际正类样本数的比例,即 TP/(TP+FN)。
F值是准确率和召回率的调和平均值,其计算公式为:2 * (准确率 * 召回率) / (准确率 + 召回率)。
ROC曲线是接收者操作特征曲线(Receiver Operating Characteristic),每个点反映了对同一信号刺激的感受性。
ROC曲线的纵轴表示真正类率(True Positive Rate, TPR),也称为真阳性率,计算公式为 TP/(TP+FN),表示分类器预测为正类中实际为正类的比例。
ROC曲线的横轴表示假正类率(False Positive Rate, FPR),也称为伪阳性率,计算公式为 FP/(FP+TN),表示分类器预测为正类中实际为负类的比例。
关于ROC曲线的绘制,可以参考这篇文章:ROC曲线绘制指南。
希望以上内容能帮助您更好地理解和应用这些概念。