前言

明明是只斑马，AI为什么说它是一条狗？

分类模型在归类图像时有时会错误地判断类别。

(资料图片)

经过学习的AI，还会搞砸一些预测，肯定是在其中的某个环节出现了纰漏。

斯坦福大学的两位博士生和教授James Zou在一篇论文中，带我们探究了分类模型犯错的原因。

随后，论文提出一种方法——反事实的概念性解释（Conceptual Counterfactual Explanations），并评估了它的效果。

通过这种方法，我们就能重新定义模型的分类标准，从而解释AI犯错的原因。

一起来看看吧。

AI为什么会犯错？

想要提高分类模型后续预测的准确性，就先得整明白这个模型在哪里出了岔子。

一般来说，AI搞砸预测是以下原因造成的：

首先是在模型实际预测的过程中，分类标准可能会与预训练时有些偏差，使得训练模型在实际预测的过程中效果不佳，进而降低预测结果的准确性。

比如说，病理学家使用预先训练好的模型来分类组织病理学图像，但效果在他的图像上却不是很好。

这就可能是在他的图像中，色调与原始训练数据中不同导致的。

其次，在模型学习的过程中，可能会学习到一种叫做“伪相关性”的东西，即将一些看似无关的要素与被识别的图像关联起来。

可以看这个例子：

在这个模型训练过程中，样本里所有狗的照片里都有雪，这导致该模型将雪与狗联系在一起，并错误地预测：没有雪的狗不是狗。

这可能是用的数据集，都是在同一场景下收集的，会阻碍模型的泛化。

除此之外，也可能是在训练模型时，人为制造的一些偏差。

例如，某一皮肤科专家利用训练好的AI来分类图像中的皮肤病，但其他同事使用的效果却不尽如人意。

这可能是因为在训练的样本中，皮肤的肤色单一、且年龄段分布窄。

了解了AI“犯错”的原因后，我们要怎样才能准确地判断模型哪里出现了错误呢？

AI犯错，它来解释

James Zou在论文中提出了一种叫反事实的概念性解释（CCE）的方法。

具体来说，就是通过这种方法，来探究输入数据与预测结果之间的联系，最终找到模型的错误之处。

那CCE是怎么来解释的呢？

定义概念库

首先要做的，就是设置并细化一个概念库C，即制作一个分类标准。

具体来说，概念库C中的各个概念可以用来分类图像，如装置c1（街道、雪等）、图片质量c2（清晰、模糊等）······

这样，就能获得一组可解释的概念库C={c1，c2，…}。

然后，需要给其中的每个概念找对应训练数据。

具体的，就是收集与其相符（Pci）和不符（Nci）的例子，一般来说数量上要一样（Pci=Nci=100）。

对于每个概念，CCE都要学习它们的分类方法和“思维方式”。

分别通过两种方法：

一个是通过学习支持向量机（SVM），来寻找可以区分两种事物最优方式的算法（线性分类器）。

另一个是学习相应的概念激活向量（CAV），它可以用来解释图像被错误分类的具体原因。

就像下图，都是斑马的图像，归类错误的原因却不一样。

这一步只需要对每个想要评估的模型做一次，之后CAV便可以用来解释任意数量的错误分类。

给定错误分类标准

我们可以通过改变不同概念在模型中的比重，对其分类标准进行相应的调整，这些调整要满足以下原则：

1、正确性：如果一个分类标准达到了预期的结果，那么它就被认为是正确的。

2、有效性：分类标准不能违反人类的基本认知。

3、稀疏性：最终目标是向用户传达模型的错误之处，太多的变量不利于有效传达信息。

我们的目的是尽可能地使预测结果贴近训练结果，即最小化交叉熵损失。

因此就要不断优化模型预测的标准，通过调整待修改的标准，对其进行加权，最终达到纠正错误分类的效果。

了解之后，我们通过一个实际例子来看看，怎么用CCE“探测”分类模型出错的地方。

在这里，分类模型错误地将斑马图像识别为非洲猎犬。

于是，我们首先生成这个模型将斑马识别成狗的一系列标准。

然后，对这些标准进行评分，如果评分为正，则代表在图像中增加这个概念，将会提高正确分类的概率，反之亦然。

在这个例子中，如果增加stripes（条纹）这个概念，识别出它为斑马的概率就会大一些。

在c）图中，通过CCE分析也可以直观地看到，“Polka Dots”（斑点）和“Dog”（狗）是导致模型预测错误的原因。

CCE效果怎么样？

看到这里，想必大家对CCE的原理都有了初步的认识。

那它判断得到底准不准确，效果究竟如何呢？

CCE的目的，主要是揭示模型在训练过程中学习到的“伪相关性”，用它就可以捕获图像中出现的其他“无关要素”和图像的伪相关性。

测试发现，在大多数情况下，该模型在超过90%的错误分类的测试样本中识别出伪相关。

看看这个表格，相较于其他方法，使用CCE，识别出样本中伪相关的概率最高。

CCE能够精准地识别出样本中的伪相关，可以看这个例子：

改变苹果图片的颜色（使图片变灰），分类模型识别错误的概率增大时（黑线），CCE辨别出“绿色”为伪相关的分数也就越高（绿线）。

除此之外，CCE也有用在医学领域的潜力。

像Abubakar Abid等人就使用CCE，在皮肤病学（皮肤状况分类）、胸片图像中的心脏病学（气胸分类）中都做了相关测试。

CCE使用学习到的偏差和图像质量条件来解释模型犯错，也已被专业的皮肤科医生证实——这些因素，确实很大程度上是导致皮肤图像难以分类的原因。

此外，CCE的速度也很快。

概念库只需要使用简单的支持向量机学习一次，每个测试示例在单个CPU上花费的时间小于0.3s。

重要的是，它可以很简单地应用到任何深度网络，在不需要训练数据的情况下检测到模型犯错的原因。

免责声明

文章来源：量子位

凡资讯来源注明为其他媒体来源的信息，均为转载自其他媒体，并不代表本网赞同其观点，也不代表本网对其真实性负责，转载请联系原出处。您若对该文章内容有任何疑问或质疑，请立即与后台小编联系，平台将迅速给您回应并做处理。注明本公司原创内容，转载请与我们联系

推荐内容

当前速读：斑马识别成狗 AI犯错的原因被斯坦福找到了

2022-07-05
世界视点！网易To B，柔外刚中

2022-07-05
焦点热门:钉钉、企微、飞书学会赚钱了吗？

2022-07-05
天天热讯:【前沿】邬贺铨院士：数字经济更需要成为可信经济

2022-07-05
世界要闻：6G网络架构远景与关键技术展望白皮书

2022-07-04
全球资讯：如何搭建数据指标体系

2022-07-04
全球快看：Soul冲刺港交所：约六成用户每月至少活跃15天，2021年营收同比增长158.3%

2022-07-04
【世界速看料】元宇宙里只有求生欲

2022-07-04
天天短讯！全新一代揽胜上市限量定制艺术数字藏品首发数藏中国

2022-07-04
全球热点评！北京淘宝科技公司更名昊超电商

2022-07-04
【全球报资讯】人民网：虚拟货币终究是黄粱一梦、庞氏骗局

2022-07-04
世界视点！【燃指数】沈阳：元宇宙要虚实和谐，不能脱实向虚

2022-07-02
快播：AI做题家卷疯了！高数考试正确率81%，竞赛题成绩超过计算机博士

2022-07-02
天天时讯：公众号信息流再改版，我们发现了微信的秘密

2022-07-02
世界热讯:突然崩盘！巨头商汤暴跌超2000亿，一场资本泡沫破灭

2022-07-02
全球今热点：阿里打出「瓴羊DaaS」这手好牌

2022-07-02
焦点简讯:商汤科技解禁日跌幅46.77%，管理层承诺短期不出售股份

2022-07-01
全球热头条丨飞书是一款好产品吗？2分钟说清楚

2022-07-01
环球看热讯：打破140字限制，微博在下什么棋？

2022-07-01
世界焦点！字节跳动的“棋子”和“弃子”

2022-07-01
天天速讯：腾讯在云游戏领域放了个大招？

2022-07-01
全球速看：国内数字藏品行业再推自律发展倡议蚂蚁、腾讯、百度、京东等联合发起

2022-07-01
天天新消息丨华新水泥与阿里云合作全球最大环保协同处置水泥窑线全年再减碳6万吨

2022-07-01
世界速递！《中国社区元宇宙发展研究报告》正式发布|含报告全文获取方式

2022-07-01
【热闻】科普 | 比特币是“庞氏骗局”吗？

2022-07-01
天天动态:让人们“用嘴画画”的AI，真的会取代人类画师吗？

2022-07-01
天天新动态：育碧新作《燃烧的巴黎圣母院》正式登陆国内市场

2022-07-01
世界短讯！腾讯还养了多少个扶不起的阿斗？

2022-07-01
全球热议:中国广电号段“靓号”及转网服务！

2022-07-01
米家App崩溃背后智能家居是否可靠

2022-06-30
天天看点：数据中台咋就从“小甜甜”变成了“牛夫人”？

2022-06-30
每日消息!Dfinity上的天胡开局！

2022-06-30
焦点短讯！中国广电才进场，好戏在后头，唱衰没必要！

2022-06-30
环球视讯！四大运营商正式凑齐，通信市场的新竞争会怎么“争”

2022-06-30
世界快报:QQ这个离谱BUG，比被盗号发H图羞耻10倍！

2022-06-30
天天热点评！中广电移动常年法律顾问选聘项目候选人公示

2022-06-30
天天观点：虚拟主播B站直播2小时收入超百万内容“小狗叫”成榜一

2022-06-30
今日快看!拥有“超能力”的宽带，你用过吗？

2022-06-30
当前关注：全国首批！广电5G开网放号试运营省份合集

2022-06-30
天天热消息：时尚 | Meta为何要在元宇宙开设虚拟时装店？

2022-06-30
今日视点：「数字化」转型之风刮向文旅：焕新景区营销，实现业态创新

2022-06-30
热点！观点：我为什么支持 dYdX 离开以太坊自建公链

2022-06-30
每日速看!嘉银金科发布“仓颉”“鲲鹏”两大实时数据平台

2022-06-30
世界微资讯！虎牙“涉黄”被罚2万元背后，陌陌以香艳、露骨的表演“割韭菜”

2022-06-30
天天快看点丨总统亲自带头炒比特币，国库亏损近2亿美元

2022-06-30
最新快讯!收藏欢乐与回忆的中文梗博物馆，会是“元宇宙”基石？

2022-06-29
全球微头条丨专注用户体验优化，是微信的中年危机解药？

2022-06-29
世界要闻：国内基础通信水平“碾压”其他国家，为什么还遭骂？

2022-06-29
全球今头条！初探元宇宙存储，数据存储市场下一个爆点？

2022-06-29
天天热议:SaaS的渠道也要转型

2022-06-29

世界视点！网易To B，柔外刚中

2022-07-05
当前速读：斑马识别成狗 AI犯错的原因被斯坦福找到了

2022-07-05
天天热讯:【前沿】邬贺铨院士：数字经济更需要成为可信经济

2022-07-05
焦点热门:钉钉、企微、飞书学会赚钱了吗？

2022-07-05
每日速看!钉钉、企微、飞书学会赚钱了吗？

2022-07-05
观速讯丨新能源难逃“锂焦虑”

2022-07-05
【天天播资讯】特斯拉开放超1200座超充站；比亚迪6月销量同比超过160%；Cruise无人车导致旧金山堵车数小时 | 每周撩车

2022-07-05
天天观热点：陌生人社交争议不断，二次冲击IPO的Soul还有新故事？

2022-07-05
【环球聚看点】快手、抖音、视频号交战内容付费

2022-07-05
全球快看：Soul冲刺港交所：约六成用户每月至少活跃15天，2021年营收同比增长158.3%

2022-07-04
【世界速看料】元宇宙里只有求生欲

2022-07-04
世界要闻：6G网络架构远景与关键技术展望白皮书

2022-07-04
全球资讯：如何搭建数据指标体系

2022-07-04
每日看点！一夜没了14万元，B站虚拟主播还背上平台的「债」

2022-07-04
全球热点评！北京淘宝科技公司更名昊超电商

2022-07-04
天天短讯！全新一代揽胜上市限量定制艺术数字藏品首发数藏中国

2022-07-04
世界热文：麦趣尔往事

2022-07-04
全球视讯！180天成为市场老大，这家公司要做非洲版「美团」

2022-07-04
环球要闻：元宇宙里只有求生欲

2022-07-04
【全球播资讯】“星巴克之父”如何度过精神危机？

2022-07-04
【全球报资讯】人民网：虚拟货币终究是黄粱一梦、庞氏骗局

2022-07-04
观察：美国FCC委员呼吁苹果、谷歌下架TikTok；袁征出手，投资了印度一家零售公司丨Going Global周报

2022-07-04
短讯！日入百万？“皮套人”的生意可能没那么挣钱

2022-07-04
环球今头条！淘系“出走”海外

2022-07-04
【天天时快讯】梦华录收官在即，“超点”死灰复燃，长视频究竟是不是一门好生意

2022-07-04
热点聚焦：表情包坑惨职场人

2022-07-04
【全球新视野】我们误解了zhang小龙？

2022-07-03
环球今日报丨VUE宣布停运，腾讯5000万美金打了水漂？

2022-07-03
天天观察：我在东北卖塑料袋，一年净赚七千万

2022-07-03
今日要闻!汽车电池也能3D打印？这家新晋独角兽不想活在“宁德时代”

2022-07-03
【时快讯】金矿的死囚，创造力爆发，只因被逼入了绝境

2022-07-03
全球今热点：阿里打出「瓴羊DaaS」这手好牌

2022-07-02
天天时讯：公众号信息流再改版，我们发现了微信的秘密

2022-07-02
世界视点！【燃指数】沈阳：元宇宙要虚实和谐，不能脱实向虚

2022-07-02
世界热讯:突然崩盘！巨头商汤暴跌超2000亿，一场资本泡沫破灭

2022-07-02
快播：AI做题家卷疯了！高数考试正确率81%，竞赛题成绩超过计算机博士

2022-07-02
当前讯息：”秃“如其来的“头顶经济”，大麦植发赴港上市信心满满？

2022-07-02
全球热资讯！老年旺旺凭啥恢复增长？

2022-07-02
天天即时：马云、马化腾、王兴、雷军……他们的高考志愿怎么填的？

2022-07-02
当前报道:返乡置业的年轻人，赚了还是亏了？

2022-07-02
新消息丨我选的热门专业，四年后成了“天坑”

2022-07-02
世界焦点！字节跳动的“棋子”和“弃子”

2022-07-01
全球热头条丨飞书是一款好产品吗？2分钟说清楚

2022-07-01
天天速讯：腾讯在云游戏领域放了个大招？

2022-07-01
环球看热讯：打破140字限制，微博在下什么棋？

2022-07-01
焦点简讯:商汤科技解禁日跌幅46.77%，管理层承诺短期不出售股份

2022-07-01
环球热点！融资丨「恩凯赛药」获逾亿元A轮融资，华盖资本领投

2022-07-01
天天新消息丨华新水泥与阿里云合作全球最大环保协同处置水泥窑线全年再减碳6万吨

2022-07-01
世界速递！《中国社区元宇宙发展研究报告》正式发布|含报告全文获取方式

2022-07-01
全球速看：国内数字藏品行业再推自律发展倡议蚂蚁、腾讯、百度、京东等联合发起

2022-07-01
热推荐：我花上万学带货：3天赚3元，成交靠刷单

2022-07-01
环球热讯:跨界艺术，将普洱茶玩出新花样，ONCHA如何占领90后工位？

2022-07-01
天天观天下！一千元的虚拟主播，小企业的直播希望？

2022-07-01
速看：天价索赔、恶意抢注，出海“版权坑”有多深？

2022-07-01
天天动态:让人们“用嘴画画”的AI，真的会取代人类画师吗？

2022-07-01
【热闻】科普 | 比特币是“庞氏骗局”吗？

2022-07-01
天天新动态：育碧新作《燃烧的巴黎圣母院》正式登陆国内市场

2022-07-01
全球热议:中国广电号段“靓号”及转网服务！

2022-07-01
世界短讯！腾讯还养了多少个扶不起的阿斗？

2022-07-01
当前要闻：做空蔚来的灰熊，以“碰瓷”中概股为生？

2022-07-01
世界快报:一根辣条一年吸金48亿，卫龙上市如何打开资本“味蕾”

2022-07-01
环球即时看！深扒数据，我们找到了中国大学生最满意的专业

2022-07-01
焦点日报：快播创始人，再创业跌了一跤

2022-07-01
全球百事通！融资丨「Magical Mushroom Company」种子轮融资300万英镑，Ecovative Design LLC领投

2022-07-01
工业互联网发展要打好政策“组合拳”

2022-06-30
米家App崩溃背后智能家居是否可靠

2022-06-30
2022大数据十大关键词发布：数据资源化、数据开发应用上榜

2022-06-30
7个好用的大数据分析模型带你养成数据分析思维

2022-06-30
大数据改变医疗保健提高效率开发新疗法

2022-06-30
万物皆可“数藏” 下一个互联网风口来了？

2022-06-30
“618”全平台销量同比增长超160% 小家电产业寻找新战法

2022-06-30
央地促消费政策落地见效下半年消费将迎来回暖

2022-06-30
未按约定发货却让消费者找厂家退款？消保委：不知情

2022-06-30
世界快报:QQ这个离谱BUG，比被盗号发H图羞耻10倍！

2022-06-30
环球视讯！四大运营商正式凑齐，通信市场的新竞争会怎么“争”

2022-06-30
每日消息!Dfinity上的天胡开局！

2022-06-30
焦点短讯！中国广电才进场，好戏在后头，唱衰没必要！

2022-06-30
广浩捷创业板IPO撤单背后：净利润降超四成

2022-06-30
天天看点：数据中台咋就从“小甜甜”变成了“牛夫人”？

2022-06-30
今日快看!拥有“超能力”的宽带，你用过吗？

2022-06-30
天天观点：虚拟主播B站直播2小时收入超百万内容“小狗叫”成榜一

2022-06-30
天天热消息：时尚 | Meta为何要在元宇宙开设虚拟时装店？

2022-06-30
当前关注：全国首批！广电5G开网放号试运营省份合集

2022-06-30
天天热点评！中广电移动常年法律顾问选聘项目候选人公示

2022-06-30
环球热讯:新茶饮“死去活来”，供应商却“盆满钵满”？

2022-06-30
今日报丨爆红半年后开始直播带货，张同学选对时机了吗？

2022-06-30
焦点观察：天然呆被起诉，“店长”关晓彤急撇清，幕后“推手”浮出水面

2022-06-30
每日速看!嘉银金科发布“仓颉”“鲲鹏”两大实时数据平台

2022-06-30
今日视点：「数字化」转型之风刮向文旅：焕新景区营销，实现业态创新

2022-06-30
热点！观点：我为什么支持 dYdX 离开以太坊自建公链

2022-06-30
天天快看点丨总统亲自带头炒比特币，国库亏损近2亿美元

2022-06-30
世界微资讯！虎牙“涉黄”被罚2万元背后，陌陌以香艳、露骨的表演“割韭菜”

2022-06-30
环球观速讯丨融资丨「华益泰康」完成近亿元B+轮融资，海翔药业领投

2022-06-30
全球热门:融资丨「Kaiko」完成5300万美元B轮融资，Eight Roads领投

2022-06-30
天天看热讯：融资丨「Nomad Health」获1.05亿美元融资，Adams Street Partners和Icon Ventures 共同领投

2022-06-30
环球报道:融资丨「BIMFILM」获近千万元天使轮融资，青炬创投投资

2022-06-30
环球热消息：融资丨「Vibrant Planet」种子轮融资1700万美元，以SaaS方式助力森林恢复

2022-06-30
从“快捷通转让”到“去金融” 海尔金控经历了什么？

2022-06-29
从无名之辈到“1076万+”分之一他是如何做到的？

2022-06-29
御供俊元先生出任索尼中国董事长 7月1日起接任董事长

2022-06-29