外贸网站有哪些推广,软件设计师教程,网站建设杭州公司,wordpress paginate_links分类算法的评价指标
查准率、查全率、准确率、F1分数#xff1a;
查准率#xff08;Precision#xff09;#xff1a; 模型预测为正例的样本中实际未正的比例。它关注的点在#xff1a;预测为正例样本的准确性。
查全率#xff08;recall#xff09;#xff1a; 模型…分类算法的评价指标
查准率、查全率、准确率、F1分数
查准率Precision 模型预测为正例的样本中实际未正的比例。它关注的点在预测为正例样本的准确性。
查全率recall 模型正确预测为正例的样本数占所有实际样本的比例。它关注的点是模型能够正确捕捉到多少正例样本。
准确率Accuracy 模型所有正确预测的样本数占总样本数的比例即模型整体的预测准确性。
F1分数 是一个综合评价指标结合了查准率Precision和查全率Recall用于平衡模型在不同情况下的性能。它是精确率和召回率的调和平均值可以帮助评估模型在不同阈值下的整体表现。
作用
平衡查准率和查全率查准率和查全率之间存在一种平衡关系提高查准率可能会降低查全率反之也是当然模型足够优秀的话他们俩可以同时提高但是做不到二者一直持续提高毕竟数据集中正例样本有限处理**不平衡数据集**数据集的正负样本分布可能不均衡这个时候仅仅依靠准确率可能不足以反应模型性能。F1分数适合这种情况下模型评估因为它考虑了正负样本的不平衡。 不平衡数据集 是指不同类别的样本数量存在了明显差异比如正例900个负例100个这样的情况如果模型不是很差那么美查准率可能高但是因为正例总数较小所以查全率会很小反过来说也是一样所以这个时候需要F1分数来调和。评估模型稳定性D1分数对模型的稳定性有影响如果模型在不同阈值下的预测结果变化比较大可能会影响F1分数所以根据F1分数可以帮助评估模型在不同条件下的鲁棒性。
总结 平衡查准率和查全率
查准率重点在于避免误报即尽量确保模型预测为正例的样本是真的正例查全率重点在于避免漏报即尽量捕捉到所有的正例样本准确率是整体预测的准确性综合考虑了正例和负例的预测情况。
代码实现
from sklearn.metrics import accuracy_score, precision_score, recall_score, f1_score, roc_curve, roc_auc_scoreaccuracy accuracy_score(y_test, y_pred)
precision precision_score(y_test, y_pred, averageweighted)
recall recall_score(y_test, y_pred, averageweighted)
f1 f1_score(y_test, y_pred, averageweighted)详细的功能实现可参考sklearn官网介绍链接https://scikit-learn.org/stable/modules/classes.html#module-sklearn.metrics