5分钟搞懂AI的可解释性

大家好啊,我是董董灿。

想象一下,如果有一天,有人跑过来突然告诉你,他搞懂了人类大脑记忆的运行机制,你会是什么反应?

你可能会和我一样,把他当做疯子。

因为我觉得这个课题太深奥了,人类大脑如此复杂,如此精密,记忆又如此神秘。

很多科学家研究了很久,依然无法解释清楚大脑的运作原理,甚至有人觉得这根本是不可能完成的事情。

但如果把人类大脑换做 AI 的大脑,那么这件事就会有很大的可信度了。

这就是 AI 领域的一个研究分支,叫做神经网络的可解释性,它就像是将 AI 模型推进了手术室,拍了个片子,我们可以清晰的看到它内部的运行原理。

今天就一起来了解一下吧。

1、 什么是神经网络的可解释性

神经网络的可解释性,说白了,就是研究如何科学的解释神经网络的工作原理。

我们在使用 AI 模型之前,要确保模型是科学的,并且是可以解释的。

特别是那些看起来像黑盒的深度学习模型,一定要搞清楚它们到底是如何从一堆数据中学到东西的。

为什么要研究这个呢?

这当然不仅仅是为了满足好奇心,更重要的是,可以让我们信任 AI,可解释性可以确保 AI 的输出和决策是安全的。

尤其是在医疗和金融这种关键领域,我们需要确保 AI 不是在瞎猜,它的决策是有依据的。

2、如何研究

有几种方法可以让我们“照进”神经网络的内部,就像是给神经网络做了一个 CT 一样,可以看到神经网络运行时的内部结构。

第一种方法是特征可视化。

通过特征可视化,我们可以看到网络“看到”了什么,比如,对计算机视觉任务而言,哪些像素对于识别一只猫的脸是重要的。

之前写过一篇介绍过特征可视化的文章,可以查看:卷积的特征被一个神奇的网站给可视化了​。(如果打不开可复制链接到浏览器打开)

第二种较为常见的是注意力机制。

注意力机制类似于我们人类的注意力,它可以告诉我们网络在做决策时重点关注了哪些输入特征。

比如,在读阅一段文字时,模型能可会集中注意力在更键关的词单上。

或许你都有没注意,这两段话有好几个语词都调整了顺序。

这就是注意力机制,我们在阅读时,只会注意到关键的词语和信息,可有可无的文字和顺序是不影响阅读的。

如上图(图源知乎博主 Ray),给模型一段文本,模型成功的注意到了“亏损”、“深交所关注函”等关键字,并将消息判断为“利空”。

需要说明的是,虽然已经有一些方法来研究模型的可解释性,但离我们真正搞懂其底层原理还有一段距离。

就像跨年演讲时罗胖说的那样,时至今日,没有谁能真正说清 GPT 是如何工作的,可它就那么发生了。

可以说,可解释性的研究就像是为人们理解 AI 打通了一个通道,它连接了冷冰冰的数据模型和人类的日常理解。

让我们面对 AI 模型不再陌生,期待有朝一日人们可以真正搞懂 AI 模型吧。


写算法文章很久了,不少同学看了我的文章后,加我一起探讨如何快速学习算法,于是我最近开发一个从零入门计算机视觉的专栏,可以查看这里了解详情:计算机视觉从入门到调优。

目前已有将近 120 人加入一起学习啦,大家一起在探讨如何更加快速有效的入门学习,如果你感兴趣,欢迎一起加入呀。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/324536.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

MySQL数据库期末知识点总结(复习版)

一、数据库基本知识 数据库中的数据有什么特点 1、数据是按某种结构组织的 2、数据有整体性、共享性和较高的独立性 数据管理技术经历了哪三个阶段 1、手工管理 2、文件管理 3、数据库管理 数据库管理系统的主要功能有哪些 数据库管理系统的主要功能包括数据定义、数据…

Baumer工业相机堡盟工业相机如何联合NEOAPI SDK和OpenCV实现相机图像转换为Mat图像格式(C#)

Baumer工业相机堡盟工业相机如何通过NEOAPI SDK实现相机掉线自动重连(C#) Baumer工业相机Baumer工业相机的图像转换为OpenCV的Mat图像的技术背景在NEOAPI SDK里实现相机图像转换为Mat图像格式联合OpenCV实现相机图像转换为Mat图像格式测试演示图 工业相机…

【响应式编程-03】Lambda表达式底层实现原理

一、简要描述 Lambda的底层实现原理Lambda表达式编译和运行过程 二、Lambda的底层实现原理 Lambda表达式的本质 函数式接口的匿名子类的匿名对象 反编译:cfr-0.145.jar 反编译:LambdaMetafactory.metafactory() 跟踪调试,转储Lambda类&#x…

python 数据容器

数据容器概念 一个可以存储多个元素的python数据类型 python有的数据容器 list(列表) tuple(元组) str(字符串) set(集合) dct(字典) 列表 python的列表的数据类型可以是不同的 my_list ["1",123,True,[123,"3333",d,False]]for item in my_list:p…

深入理解Vue3中的自定义指令

Vue3是一个流行的前端框架,它引入了许多新特性和改进,其中之一是自定义指令。自定义指令是一种强大的功能,可以让开发者在模板中直接操作 DOM 元素。本文将深入探讨 Vue3中的自定义指令,包括自定义指令的基本用法、生命周期钩子函…

C语言全面学习基础阶段01—C生万物

如何学好 C 语言 1. 鼓励你,为你叫好。 C 生万物 编程之本 长远 IT 职业发展的首选 C 语言是母体语言,是人机交互接近底层的桥梁 学会 C/C ,相当于掌握技术核心 知识点一竿子打通。 IT 行业,一般每 10 年就有一次变革 40 年间&a…

第12课 利用openCV检测物体是否运动了

FFmpeg与openCV绝对是绝配。前面我们已经基本熟悉了FFmpeg的工作流程,这一章我们重点来看看openCV。 在前面,我们已经使用openCV打开过摄像头并在MFC中显示图像,但openCV能做的要远超你的想像,比如可以用它来实现人脸检测、车牌识…

torch.meshgrid和np.meshgrid的区别

numpy中meshgrid: 把数组a当作一行,再根据数组b的长度扩充行。 把数组b当作一列,再根据数组a的长度扩充列。 torch中meshgrid: 把数组a当作一列,再根据数组b的长度扩充列。 把数组b当作一行,再根据数组a的…

【docker】一文讲完docker搭建私有仓库

一、docker搭建私有仓库方法总结 搭建Docker私有仓库主要有以下几种方式: 使用Docker官方提供的Registry镜像:Docker官方提供了一个用于构建私有镜像仓库的Registry镜像,只需将镜像下载并运行容器,然后暴露5000端口即可使用。可以…

​iOS实时查看App运行日志

目录 一、设备连接 二、使用克魔助手查看日志 三、过滤我们自己App的日志 📝 摘要: 本文介绍了如何在iOS iPhone设备上实时查看输出在console控制台的日志。通过克魔助手工具,我们可以连接手机并方便地筛选我们自己App的日志。 &#x1f4…

数据迁移怎么测,都有哪些步骤?

📢专注于分享软件测试干货内容,欢迎点赞 👍 收藏 ⭐留言 📝 如有错误敬请指正!📢软件测试面试题分享: 1000道软件测试面试题及答案📢软件测试实战项目分享: 纯接口项目-完…

报错解决:Error creating bean with name ‘userServiceImpl‘

首先:spring整合MyBatis是出现这个错误: Exception in thread "main" org.springframework.beans.factory.UnsatisfiedDependencyException: Error creating bean with name userServiceImpl: Unsatisfied dependency expressed through fiel…