模型评估与模型监控——混淆矩阵「建议收藏」

编程小6 (31) 2023-05-14 18:12

Hi，大家好，我是编程小6，很荣幸遇见你，我把这些年在开发过程中遇到的问题或想法写出来，今天说一说模型评估与模型监控——混淆矩阵「建议收藏」,希望能够帮助你!!!。

模型评估指标是对模型的数理性能的评价，不涉及业务参数的调优。

混淆矩阵

在二分类模型预测中，混淆矩阵是评估模型好坏的一种基本方法，其通过模型预测值与实际值的一致性来判断模型的表现。

混淆矩阵示例：

模型评估与模型监控——混淆矩阵「建议收藏」_https://bianchenghao6.com/blog__第1张

混淆矩阵示例

这里，实际值与预测值的一致性有四种情况，对应上表中单元格内容，它们依次为：

TP：命中，实际坏客户与模型预测的坏客户情况一致。
FP：误报，模型预测是坏客户，但实际是好客户。
FN：漏报，模型预测是好客户，但实际是坏客户。
TN：正确否定，实际好客户与模型预测的好客户情况一致。

评价指标

围绕着四个指标，可以衍生出评价模型好坏的一些列指标。这些指标可以分为两类，一类是强调模型的精准情况，另一类强调模型的覆盖情况。

正确性：

正确率（Accurany）：（TP+TN)/(TP+FN+FP+TN)
精准度（Precision）：TP/(TP+FP)
提升度（Lift）：[TP/(TP+FP)]/[(TP+FN)/(TP+FN+FP+TN)]

覆盖率：

召回率（Recall）：TP/(TP+FN)
特异度（Specificity）：TN/(FP+TN)

综合：

F1得分（F1）：2TP/(2TP+FP+FN)

其中，

正确率：模型预测结果与实际结果一致占总数的比例，反应模型预测正确情况。
精准率：模型预测违约正确个数与预测违约个数之比，反应模型预测违约正确的情况。
提升度：精准率与实际违约率之比，反应模型预测效果是随机预测效果提升的多少倍。
召回率：模型预测违约正确个数与实际违约个数之比，反应模型预测违约覆盖实际违约个数情况。

碎片时间，关注收藏。

已是最后文章

已是最新文章

发表回复取消回复

请先登录账户再评论哦

模型评估与模型监控——混淆矩阵「建议收藏」

混淆矩阵

评价指标

发表回复取消回复

相关推荐

VMware vSphere简介

科普：iOS开发如何做外部测试

扩频通信简介

Ubuntu下安装Chrome浏览器的两个方法

最新文章

VMware vSphere简介

科普：iOS开发如何做外部测试

扩频通信简介

Ubuntu下安装Chrome浏览器的两个方法

空指针异常NullPointerException（小结）

x的a次方怎么用计算机求x,x的a次方的导数图像-导数的求导法则-x的a次方求导公式用定义推导...

什么是条件编译

android AES CFB128 加密

springcloud eruka刷新时间配置实战

Java-System.currentTimeMillis() 存在性能问题

模型评估与模型监控——混淆矩阵「建议收藏」

混淆矩阵

评价指标

发表回复 取消回复

相关推荐

VMware vSphere简介

科普：iOS开发如何做外部测试

扩频通信简介

Ubuntu下安装Chrome浏览器的两个方法

最新文章

VMware vSphere简介

科普：iOS开发如何做外部测试

扩频通信简介

Ubuntu下安装Chrome浏览器的两个方法

空指针异常NullPointerException（小结）

x的a次方怎么用计算机求x,x的a次方的导数图像-导数的求导法则-x的a次方求导公式用定义推导...

什么是条件编译

android AES CFB128 加密

springcloud eruka刷新时间配置实战

Java-System.currentTimeMillis() 存在性能问题

发表回复取消回复