一文带你搞懂sklearn.metrics混淆矩阵
admin
2024-02-04 02:35:20
0

一般的二分类任务需要的评价指标有4个

  • accuracy
  • precision
  • recall
  • f1-score

四个指标的计算公式如下

accuracy = \frac{TP+TN}{TP+TN+FP+FN}

precision=\frac{TP}{TP+FP}

recall=\frac{TP}{TP+FN}

 F_1-score=\frac{2*precision*recall}{precision+recall}

计算这些指标要涉及到下面这四个概念,而它们又构成了混淆矩阵

  • TP (True Positive)
  • FP (False Positive)
  • TN (True Negative)
  • FN (False Negative)
混淆矩阵实际值
01
预测值0TNFP
1FNTP

这里我给出的混淆矩阵是按照sklearn-metrics-confusion_matrix的形式绘制的。

Negative中文译作阴性,一般指标签0;Positive中文译作阳性,一般指标签1。

True中文译作预测正确;False中文译作预测错误。

TN 预测正确(True)并且实际为阴性(Negative)即实际值和预测值均为Negative

TP 预测正确(True)并且实际为阳性(Positive)即实际值和预测值均为Positive

FN 预测错误(False)并且实际为阴性(Negative)即实际值为Negative,预测值为Positive

FP 预测错误(False)并且实际为阳性(Positive)即实际值为Positive,预测值为Negative

下面以实际代码为例进行介绍

from sklearn import metrics
print(metrics.confusion_matrix(y_true=[0, 0, 0, 1, 1, 1],y_pred=[1, 1, 1, 0, 1, 0]))

这里的y_true是实际值,y_pred是预测值,可以观察到

TN=0,没有样本实际值和预测值同时为0

TP=1,只有第5个样本实际值和预测值均为1

FN=3,第1,2,3个样本实际值为0且预测值为1

FP=2,第4,6个样本实际值为1且预测值为0

输出结果也和我们观察的一致

[[0 3][2 1]]

编写函数根据混淆矩阵计算 accuracy, precision, recall, f1-score

def cal(array):tp = array[1][1]tn = array[0][0]fp = array[0][1]fn = array[1][0]a = (tp+tn)/(tp+tn+fp+fn)p = tp/(tp+fp)r = tp/(tp+fn)f = 2*p*r/(p+r)print(a,p,r,f)

使用编写的函数cal计算该混淆矩阵的四项指标,并与metric自带的分类报告(classification_report)函数的结果进行比较,这里第三个参数digits=4表示保留4位小数

cal([[0, 3],[2, 1]])
print(metrics.classification_report(y_true=[0, 0, 0, 1, 1, 1], y_pred=[1, 1, 1, 0, 1, 0], digits=4))

运行结果如下,可以发现两者的计算结果一致。

0.16666666666666666 0.25 0.3333333333333333 0.28571428571428575precision    recall  f1-score   support0     0.0000    0.0000    0.0000         31     0.2500    0.3333    0.2857         3accuracy                         0.1667         6macro avg     0.1250    0.1667    0.1429         6
weighted avg     0.1250    0.1667    0.1429         6

这里需要补充说明一下,为什么0那一行和1那一行都有precision, recall, f1-score。

一般来说,我们通常计算的这三项指标均是把1视为阳性,把0视为阴性,以1作为研究对象。所以1那一行的三项指标的值和cal函数计算的结果一致。而0那一行表示把0作为研究对象。

相关内容

热门资讯

【MySQL】锁 锁 文章目录锁全局锁表级锁表锁元数据锁(MDL)意向锁AUTO-INC锁...
【内网安全】 隧道搭建穿透上线... 文章目录内网穿透-Ngrok-入门-上线1、服务端配置:2、客户端连接服务端ÿ...
GCN的几种模型复现笔记 引言 本篇笔记紧接上文,主要是上一篇看写了快2w字,再去接入代码感觉有点...
数据分页展示逻辑 import java.util.Arrays;import java.util.List;impo...
Redis为什么选择单线程?R... 目录专栏导读一、Redis版本迭代二、Redis4.0之前为什么一直采用单线程?三、R...
【已解决】ERROR: Cou... 正确指令: pip install pyyaml
关于测试,我发现了哪些新大陆 关于测试 平常也只是听说过一些关于测试的术语,但并没有使用过测试工具。偶然看到编程老师...
Lock 接口解读 前置知识点Synchronized synchronized 是 Java 中的关键字,...
Win7 专业版安装中文包、汉... 参考资料:http://www.metsky.com/archives/350.htm...
3 ROS1通讯编程提高(1) 3 ROS1通讯编程提高3.1 使用VS Code编译ROS13.1.1 VS Code的安装和配置...
大模型未来趋势 大模型是人工智能领域的重要发展趋势之一,未来有着广阔的应用前景和发展空间。以下是大模型未来的趋势和展...
python实战应用讲解-【n... 目录 如何在Python中计算残余的平方和 方法1:使用其Base公式 方法2:使用statsmod...
学习u-boot 需要了解的m... 一、常用函数 1. origin 函数 origin 函数的返回值就是变量来源。使用格式如下...
常用python爬虫库介绍与简... 通用 urllib -网络库(stdlib)。 requests -网络库。 grab – 网络库&...
药品批准文号查询|药融云-中国... 药品批文是国家食品药品监督管理局(NMPA)对药品的审评和批准的证明文件...
【2023-03-22】SRS... 【2023-03-22】SRS推流搭配FFmpeg实现目标检测 说明: 外侧测试使用SRS播放器测...
有限元三角形单元的等效节点力 文章目录前言一、重新复习一下有限元三角形单元的理论1、三角形单元的形函数(Nÿ...
初级算法-哈希表 主要记录算法和数据结构学习笔记,新的一年更上一层楼! 初级算法-哈希表...
进程间通信【Linux】 1. 进程间通信 1.1 什么是进程间通信 在 Linux 系统中,进程间通信...
【Docker】P3 Dock... Docker数据卷、宿主机与挂载数据卷的概念及作用挂载宿主机配置数据卷挂载操作示例一个容器挂载多个目...