霸榜seo,谷歌优化推广,2022永久免费的看电视软件,衡水seo网站建设优化排名最近在学 logistic regression model#xff0c;又遇见了几个之前的老面孔。 召回率recall, 精确率precision#xff0c;特异性spcificity#xff0c;准确率accuracy#xff0c;True positive rate#xff0c;false positive rate等等名词在学习之初遇到的困难在于#x…最近在学 logistic regression model又遇见了几个之前的老面孔。 召回率recall, 精确率precision特异性spcificity准确率accuracyTrue positive ratefalse positive rate等等名词在学习之初遇到的困难在于理解各自的意思对于评估模型的意义以及将相关名词联系在一起。也是初学者谨希望给大家学习时提供一些思路。
1.召回率recall, 精确率precision特异性spcificity准确率accuracy这些指标分别让我们了解什么通俗版
想象我们有一个样本集其中有我们需要的数据以及我们不需要的数据或者想象一个数据集包括不同的人脸有笑脸哭脸、面无表情脸我们其中需要识别的是笑脸 准确率accuracy:做出正确预测的能力 你能做出正确的预测的概率我们测试的模型识别出是笑脸的数据和不是笑脸的数据其中识别正确的部分 召回率recall 对需要识别的数据是否敏感 另外一个名字是敏感性sensitivity代表给你需要识别的正的样本中你能识别的部分对正确的样本识别能力是否能有效地捕捉我们所需要的样本给你所有的笑脸图像你能识别的部分真实情况中我们并不知道有多少数据是笑脸我们需要知道的是模型能否有效地将尽可能多地笑脸识别出来从茫茫数据海中捞出来带回来召回来因此理解成召回率 精确率precision识别判断准确的能力你选出正确的部分有多少是确实正确的也叫Hit rate你说这些是笑脸图那么我需要知道里面确实是笑脸图的部分精确到小数点后x位证明着x位之前的数字都是对的How many patients predicted as having stroke really has stroke. 特异性specificity 识别非样本的能力specific翻译成中文可以是具体、明确、独特、特定的代表你指出的不属于我要找的样本中有多少确实不属于确实不是笑脸的样本中你能识别出确实不属于笑脸图的部分不要往“你能识别出不是笑脸图的确实不属于笑脸图的部分“或者”不属于笑脸图这个判断正确的概率“去想会导致你对分母及计算方式的误解
通过上面的学习先把中文和英文对应上然后咱们再来区分
1.i精确、具体、敏感之间怎么区分
总结下精确——做出正确判断正确的概率 敏感——对正确集做出正确分类与识别的概率 具体——对错误集进行正确分类与识别的概率 Specificity 与 Sensitivity敏感性也称为 True Positive Rate 或 Recall一起使用可以提供全面的模型性能评估。在某些应用中需要权衡 Specificity 和 Sensitivity以确定模型的最佳工作点具体取决于问题的重要性和应用背景。
1.ii) 引入Confusion Matrix Accuracy TPTN/(TPTNFPFN) %Recall/True Positive Rate/Sensitivity TP/(TPFN)Specificity TN/(TNFP)Precision/Hit Rate (of Event) TP/(TPFP)
1.iii) TP, TN, FP, FN Rate区分及计算方式
这四个指标出现在Confusion Matrix里面因为计算方式与之前认识的四个指标中部分相同所以也同样会用于评价模型的效果 Negative和Positive代表的是模型做出的判断因为列代表的是predicted values即模型的结果所以一个列是N一列是P True 和False 代表的是该判断是错还是对因为行代表的是Actual values一行必定有一个判断正确一个判断错误所以对角线上的T或P值会相同 这四个指标从中文理解比较方便比如FN假阴性做出了阴性的假定但是错了, 实际上它是阳性的Positive的FP做出了阳性的假定但是这个假定是错的实际上它是阴性的
Rate这个理解比较重要规律就是除以实际的T或者P。比如FNR就是对于 True Positive rate 真阳性 TP/Actual YesTP/(TPFN) True Negative rate 真负类 TN/Actual NoTN/(TNFP) False Positive rate 假阳性 FP/Actual NoFP/(FPTN) False Negative rate假阴性 FN/Actual YesFN/(FNTP)
跟之前学习的Recall, precision, accuracy, specificity联动一下 TP rate recall, sensitivity TN rate specificity
对了还记得统计学学过的两类错误吗Type1 某个人怀孕了你测不出来原假设为真时却错误地拒绝了原假设弃真FP rate Type2 某个人没怀孕你说它怀孕了原假设为假时却错误地未能拒绝原假设被坏人骗了 FN Rate
ps: 在某些情况下降低 Type 2 error 的重要性更大特别是当未能检测到某种效应或差异可能具有严重后果时。例如在医学诊断中未能检测到疾病可能导致病人未能获得及时的治疗从而增加了危险。所以FN rate很重要。