1 引言

由中科院,腾讯AI实验室以及香港中文大学联合出品的硬核对抗训练的新作LAS-AT发表于CVPR2022。对抗训练被认为是抵御对抗攻击最有效的防御方法,它通常会被描述为求解一个极小极大问题,其性能取决于内部优化生成对抗样本的质量。

目前在对抗训练中主流采用的攻击算法是PGD攻击,该算法需要人为手动指定攻击参数,有研究表明在对抗训练的不同阶段中固定的攻击策略会对提高模型鲁棒性带来限制。

在该论文中,作者通过引入“可学习的攻击策略”(LAS-AT)的概念,并提出了一种新的对抗训练框架,该算法框架利用强化学习机制自动生成攻击策略,从而进一步提高模型的鲁棒性。

论文: https://arxiv.org/abs/2203.06616

代码: https://github.com/jiaxiaojunQAQ/LAS-AT

2 方法概述

如下图所示为该论文的方法示意图,可以发现论文中的模型由一个目标网络和一个策略网络所组成。论文作者使用对抗样本去训练目标网络进而提高它的鲁棒性,同时策略网络生成攻击策略去生成对抗样本,由此可见这两个网络是具有竞争关系的。

目标网络: 目标网络是一个用于图像分类的卷积神经网络,可以表示为

,其中 表示的是估计标签, 是一张输入图像, 是神经网络的参数。

策略网络: 策略网络生成对抗攻击的策略进而去控制对抗样本的生成,其中输入的是一个样本,输出的是一个策略。由于策略网络的参数是逐步被更新的,在不同的训练阶段中,根据目标网络的鲁棒性的情况,给定相同的样本作为输入也会给出不同的策略。令

表示的是一种策略,其中每个元素表示的是一个攻击参数。 表示的是策略值空间,参数 有 个选项,并且被编码成one-hot向量。在不同的攻击参数下每个参数选项的意义是不同的。比如对于PGD攻击来说,它有三个攻击参数,即攻击步长的大小 ,攻击迭代数 ,以及最大的攻击扰动强度 。

每一个参数有

个可选值,比如攻击步长 的取值范围为 ,攻击迭代数 的取值范围为 。对于这些攻击参数的可选值的一个组合可以看作是一个策略。策略网络可以获得给定输入 和参数 的条件概率分布 ,其中 是输入图片, 是策略网络的参数 。

对抗样本生成器: 给定一个干净的样本,对抗样本的生成过程可以被定义为

其中

表示的是一个干净的样本, 表示的是其对应的对抗样本, 是一个攻击策略, 表示的是目标网络的参数, 表示的是PGD攻击。

3 对抗训练公式化表述

标准对抗训练有固定的攻击策略,可以表示为

其中 ,并且 表示的是人为设定的攻击策略。 是训练集, 表示的是交叉熵损失函数,其用于衡量对抗样本 的预测标签与真实标签 之间的距离。在该论文中,作者代替使用人为设定的样本不可知攻击策略,而是使用一个策略网络去自动生成基于策略 的样本。在论文中对抗训练的策略可以公式化表示为 与标准的对抗训练相比,最与众不同的地方在于对抗样本的生成方式。标准对抗训练采用的是人为设定的样本不可知的策略 去求解内部优化问题。然而论文中的作者是使用策略网络根据条件概率分布 去产生一个样本依赖策略,即作者提出的策略是可以学习的,其对抗样本的生成包含策略网络参数 ,这会导致损失函数是两个网络参数的函数。

由该论文提出的对抗训练的公式可知,目标网络和策略网络是有一种相互竞争的关系,即最小化和最大化相同的损失函数。目标网络学习调整参数去抵御对抗攻击策略生成的对抗样本,而策略网络根据给定的攻击目标网络的样本去提高攻击策略。

在一开始的训练阶段,目标网络是非常脆弱的,一个弱的攻击就可以使它分类出错,此时,策略网络可以很容易的生成有效的攻击策略,并且策略是多种多样的,因为弱的攻击策略和强的攻击策略都可以成功攻击目标网络。

随着训练过程的进行,目标网络变得越来越鲁棒,策略网络不得不去学习生成更强对抗样本的攻击策略。因此,这种博弈机制可以随着策略网络的生成策略的提高逐步促进目标网络的对抗鲁棒性。

4 损失函数项

4.1 评估鲁棒性损失

为了引导策略网络的学习,作者提出了一种新的度量方式去评估对抗攻击,主要使用的是目标网络单步更新的鲁棒性。具体地,一个攻击策略

首先被用作去创造一个对抗样本 ,并且该对抗样本通过一阶梯度下降法去单步调整目标网络的参数 。

如果更新后的目标网络能够正确预测由其它攻击策略

生成的对抗样本 的标签,则此时可以说该攻击策略是有效的。比如说对于PGD攻击,最大对抗扰动强度为8,迭代步数为10,步长为2。评估鲁棒性的损失函数可以表述为

其中 是更新目标网络的参数,

是步长。 令 , 是由攻击策略 生成的对抗样本,其主要用于评估带有参数 的目标网络的鲁棒性。 被用作去评估攻击策略,需要注意的是 不是要被优化的参数,由上公式可知, 的值越大,意味着更新后目标模型更鲁棒。

4.1 预测干净样本损失

一个好的攻击策略应该不仅可以提高目标模型的鲁棒性也能够保持预测干净样本的准确率。在该论文中作者也考虑了单步更新目标模型在预测干净样本的性能,评估攻击策略的损失函数可以被定义为

其中

是 的函数, 的数值越大,意味着更新后的目标模型在分类干净样本中有一个更低的损失值。结合以上两个损失函数项,该论文方法的对抗训练总损失函数可以表述为 其中 和 表示为 和 的权衡系数。

5 优化过程

作者提出一个算法交替优化这两个网络的损失函数。给定参数

,优化目标网络的子问题可以表述为 给定一个干净的样本,策略网络生成一个策略分布 ,从该条件分布中随机采样出一个策略,并用该策略去生成对抗样本。利用以下梯度下降法去更新目标模型的参数 其中 表示的是在一个批次中的样本数量, 表示的是学习率。给定 ,优化策略网络的参数的子问题可以描述为 其中 在这个优化问题中,最大的挑战在于对抗样本生成的过程是不可微的,即梯度信息不能通过对抗样本被反向传播到攻击策略的调整中。

另外,还有其它很多不可微的操作,如关系到对抗攻击中迭代次数的选择等,它们很难将梯度信息反向传播到策略网络中。在该论文中作者利用强学学习算法去解决以上不可微的问题,则可以计算目标函数

关于参数 的导数为 其中 ,从策略的条件分布中采样攻击策略生成对抗样本,关于参数 的近似梯度可以表示为 则策略梯度的参数可以通过梯度上升法被更新为

其中

是学习率, 和 被交替更新,其中 更新一次, 更新 次。

6 收敛性分析

假定目标函数

满足关于 和 的梯度Lipshitz条件,并且 在参数空间 中是 -强凹的。如果 是在 约束下 球的 近似解,随机梯度的方差被约束在 内,则 的学习率可以表示为 其中 是 的Lipschitz常数,并且满足如下公式 其中 表示的是最大对抗训练的轮数,并且有 。由上定理可知,内部最大化的过程可以获得对抗样本 的 近似。该论文提出的方法LAS-AT可以以学习率 收敛到一个稳定点。

另外,如果

是足够小的,论文中的方法可以找到一个理想带有参数 的鲁棒性模型,并且有一个好的对抗样本 的近似。

7 实验结果

如下两表所示,分别为不同对抗训练的方法在数据集CIFAR10和CIFAR100的鲁棒性的对比结果。可以直观的发现,在大多数攻击场景下,论文中三种方法对抗训练出的模型的性能都优于其它方法对抗训练出的模型,而且在很多情况下,论文中的方法不仅提高了基础模型的鲁棒性,而且提高了干净样本分类的精度。

作者将论文中方法与其他超参数搜索方法进行了比较,包括经典的超参数搜索方法(随机搜索)和两种自动超参数搜索方法。从下图可以看出,论文中方法实现了在所有攻击场景下对抗训练出的模型都达到了最佳的鲁棒性性能。

为了研究LAS-AT的工作原理,作者分析了策略网络在不同训练阶段的攻击策略分布。最大扰动强度的范围设定为3到15,如下图所示为对抗训练期间最大扰动强度的分布演变情况。

在对抗训练开始时,分布覆盖了最大扰动强度的所有可选值。每个值都有选择的机会,这确保了对抗样本的多样性。随着对抗训练的进行,小扰动强度的百分比降低。在后期,最大扰动强度的分布被几个大值占据。

这一现象表明,策略网络逐渐增加大扰动强度的百分比,以生成更强的对抗扰动,进而目标网络的鲁棒性通过使用强对抗样本进行训练而逐渐增强。

推荐内容

  • CVPR 2022 中科院、腾讯提出LAS-AT,利用“可学习攻击策略”进行“对抗训练”

  • “热钱”洒向数据库,耐力比拼进行时

  • 数实相融 浪潮信息策马扬鞭奔向“绿色未来”

  • 钉钉开始直面商业化

  • 工信部:截至2月底,IPTV总用户数达3.57亿户

  • 四家运营商薪资福利大对比,谁能更胜一筹?

  • 彻底告别“个性化体验”,隐私和体验哪个重要?

  • 清华大学孙茂松:自然语言处理一瞥,知往鉴今瞻未来

  • 网传字节跳动调高 Pico VR 今年销售目标至 180 万台;罗永浩微博发文,澄清《罗永浩“真还传”大结局》多处事实错误

  • “山金云”助推山东省数字经济发展

  • 人工智能、机器学习、深度学习的关系,终于有人讲明白了

  • 美国要切断对俄罗斯的GPS服务?“北斗”可否顶上?

  • 13.4亿个账号被处置,2022年“清朗”行动还将重点整治这些乱象!

  • 天云数据完成数亿元D轮融资,重新定义数据基础设施 | 华映portfolio

  • 诈骗、灰产、荷尔蒙,畸形生态下养活的陌陌、探探和Soul

  • 教你如何摘取区块链中的明珠 - 智能合约

  • 科技活动中的“领域变迁”和“关键变迁”

  • “数字员工”已悄然登场,将带来怎样一场变革?

  • 数字经济的内涵、界定和各国规模测算

  • 大数据“杀熟”?新规出手了!

  • 钉钉总裁叶军:发布酷应用,钉钉只做一件事就是PaaS化

  • 苦“大数据推荐”久矣?现在终于可以关掉它了!

  • 锤子科技撤回全部破产申请,罗永浩或将重回科技行业

  • 工信部:三大运营商发展蜂窝物联网终端用户数达到14.64亿

  • “AI+知识管理”为企业数智升级注入新动力

  • 钉钉发布新logo:从要规模到要价值,品牌新主张让进步发生

  • CRM讲堂 - 不要让CRM沦为监管销售的工具

  • 中国联通倾力打造高算力枢纽节点!

  • NFT|无聊猿(BAYC)的发展潜力(一)

  • 调查:Coinbase 与 Binance 上新币种

  • “东数西算”夯实数字经济绿色底座

  • 再见3G:多运营商关闭UMTS和CDMA2000网络

  • 电信和联通如何抗衡一家独大的中移动?

  • 固若金汤的App Store审核也翻车了吗?

  • “元宇宙”破圈爆红,区块链成为幕后推手

  • 第二人生的创始人菲利普·罗斯戴尔对元宇宙发出了与Meta截然相反的概念

  • 科学家称或存在时间倒流反宇宙

  • 现在是投资中国互联网公司的好时候吗?

  • Figma封不住国产软件崛起的步伐

  • 联邦知识蒸馏概述与思考(续)

  • Marteker 日报:(2022.3.21)

  • 详解ID拉通 | CDP 智库系列文章 ②

  • “AI+知识管理”为企业数智升级注入新动力

  • AI靠语意理解把照片变抽象画,无需相应数据集,只画4笔也保留神韵,有毕加索内味儿了

  • 抢先苹果!罗永浩“真还传”下月完结:即将进军VR行业

  • 深度视觉宣布完成过亿元A轮融资,将用于产品研发和市场拓展等

  • 瑞数信息荣膺CCIA2021年度优秀会员单位

  • 全行业攻坚智能网联汽车安全

  • NFT与元宇宙热度回撤,阵痛之后何去何从?

  • 特斯拉推送四大新功能:空调功能更新、新增语言支持
    特斯拉推送四大新功能:空调功能更新、新增语言支持

  • CVPR 2022 中科院、腾讯提出LAS-AT,利用“可学习攻击策略”进行“对抗训练”

  • “热钱”洒向数据库,耐力比拼进行时

  • 数实相融 浪潮信息策马扬鞭奔向“绿色未来”

  • 四家运营商薪资福利大对比,谁能更胜一筹?

  • 彻底告别“个性化体验”,隐私和体验哪个重要?

  • 工信部:截至2月底,IPTV总用户数达3.57亿户

  • 钉钉开始直面商业化

  • 中概股暴跌后的大厂员工:230万缩水至23万、和家人一起“开源节流”

  • 微博接入TopHolder,数字藏品走向社交化?

  • 首发丨「深视科技」完成千万美元A轮融资,创世伙伴、苏高新集团融享创投领投

  • 降价、降估值,新茶饮「降温」

  • 餐饮探店营销乱象频生,是流量密码还是饮鸩止渴?

  • 一键关闭,再见了,烦人的APP广告

  • 小米的高端化,不能只靠米粉

  • 奶茶卷到美国,卷入TikTok

  • 上海买菜实录:有人在凌晨12点鏖战,有人在早上6点激情下单

  • 内卷的智能投影,奋力抓住年轻人

  • “春天的蔬菜100元一斤,才知道原来我只配吃肉”

  • 一娃一屋,管家伴读,高档酒店「网课房」谁去住?

  • 融资丨「小鸟健康」完成两轮近亿元融资

  • 融资丨「普立蒙」完成近亿元新一轮融资,雅惠投资领投

  • 海外创投丨社交APP「WeAre8」完成1500万美元B轮融资,Channel 4 Ventures、Centerstone Capital联合投资

  • 融资丨「melt season」完成超千万元天使轮融资,Breeze Capital领投

  • 融资丨「天云数据」完成数亿元D轮融资,多家国家队基金共同投资

  • 清华大学孙茂松:自然语言处理一瞥,知往鉴今瞻未来

  • 融资丨「喜屏传媒」完成B轮融资,阿里巴巴独家投资

  • “山金云”助推山东省数字经济发展

  • 美国要切断对俄罗斯的GPS服务?“北斗”可否顶上?

  • 人工智能、机器学习、深度学习的关系,终于有人讲明白了

  • 微软警告:不支持的硬件上安装Windows11
    微软警告:不支持的硬件上安装Windows11

  • 网传字节跳动调高 Pico VR 今年销售目标至 180 万台;罗永浩微博发文,澄清《罗永浩“真还传”大结局》多处事实错误

  • 五年后,元宇宙中的网络安全如何保障?
    五年后,元宇宙中的网络安全如何保障?

  • 315曝光台:美团、去哪儿相继被曝出大数据“杀熟”
    315曝光台:美团、去哪儿相继被曝出大数据“杀熟”

  • 数据的历史与发展
    数据的历史与发展

  • 【数据分析】如何增强客户忠诚度?
    【数据分析】如何增强客户忠诚度?

  • 13.4亿个账号被处置,2022年“清朗”行动还将重点整治这些乱象!

  • 企业使用云计算管理大数据,需要注意哪些漏洞?
    企业使用云计算管理大数据,需要注意哪些漏洞?

  • 大数据时代,如何保护个人信息?
    大数据时代,如何保护个人信息?

  • 万门大学倒闭了,童哲连夜跑路了

  • 价格战来了,乐乐茶“被迫”降价?

  • 科技活动中的“领域变迁”和“关键变迁”

  • 天云数据完成数亿元D轮融资,重新定义数据基础设施 | 华映portfolio

  • 教你如何摘取区块链中的明珠 - 智能合约

  • 诈骗、灰产、荷尔蒙,畸形生态下养活的陌陌、探探和Soul

  • “数字员工”已悄然登场,将带来怎样一场变革?

  • 苦“大数据推荐”久矣?现在终于可以关掉它了!

  • 数字经济的内涵、界定和各国规模测算

  • 钉钉总裁叶军:发布酷应用,钉钉只做一件事就是PaaS化

  • 大数据“杀熟”?新规出手了!

  • 54岁医药老兵三次创业,9年专攻病毒载体,今日收获IPO

  • “AI+知识管理”为企业数智升级注入新动力

  • CRM讲堂 - 不要让CRM沦为监管销售的工具

  • 工信部:三大运营商发展蜂窝物联网终端用户数达到14.64亿

  • 钉钉发布新logo:从要规模到要价值,品牌新主张让进步发生

  • 融资丨「悬镜安全」完成数亿元B轮融资,源码资本领投

  • 锤子科技撤回全部破产申请,罗永浩或将重回科技行业

  • 3月LPR报价公布:1年期3.7%5年期以上4.6%
    3月LPR报价公布:1年期3.7%5年期以上4.6%

  • “东数西算”夯实数字经济绿色底座

  • 调查:Coinbase 与 Binance 上新币种

  • NFT|无聊猿(BAYC)的发展潜力(一)

  • 中国联通倾力打造高算力枢纽节点!

  • “元宇宙”破圈爆红,区块链成为幕后推手

  • 电信和联通如何抗衡一家独大的中移动?

  • 再见3G:多运营商关闭UMTS和CDMA2000网络

  • 第二人生的创始人菲利普·罗斯戴尔对元宇宙发出了与Meta截然相反的概念

  • 新茶饮“下凡” 一点点们“瑟瑟发抖”

  • 固若金汤的App Store审核也翻车了吗?

  • 疯狂涨价,电动车梦碎2022?

  • 2021年全球手机畅销榜单出炉,你看懂了吗?

  • 小镇青年,要对电动车下手了

  • 曹德旺输了,福建人没输

  • 张朝阳好为人师,搜狐视频战术躺平

  • 抖音探店,中间商割韭菜

  • 还记得威马吗?

  • 降价、裁员、关店,新茶饮风向生变?

  • 给食堂“送菜”,年销售百亿,高瓴红杉低调押注丨专访彩食鲜CEO李建波

  • 蝙蝠侠不吃爆米花

  • 融资丨「派学车」完成亿元C2轮融资,达晨财智领投

  • 关于中国企业家网“罗永浩‘真还传’大结局”报道的澄清

  • 现在是投资中国互联网公司的好时候吗?

  • 科学家称或存在时间倒流反宇宙

  • Figma封不住国产软件崛起的步伐

  • 联邦知识蒸馏概述与思考(续)

  • 打造酒类新零售界的“丝芙兰”,酒廷1990想怎么做?

  • 房地产公司抢着送钱,既便宜又不卡脖子,钠电池要火了?

  • AI靠语意理解把照片变抽象画,无需相应数据集,只画4笔也保留神韵,有毕加索内味儿了

  • Marteker 日报:(2022.3.21)

  • 详解ID拉通 | CDP 智库系列文章 ②

  • “AI+知识管理”为企业数智升级注入新动力

  • 郭明錤:iPhone14系列“新瓶旧酒”是一种营销策略
    郭明錤:iPhone14系列“新瓶旧酒”是一种营销策略

  • 年内五连涨!2022款欧拉好猫全系车型价格调整
    年内五连涨!2022款欧拉好猫全系车型价格调整

  • 猝不及防!比亚迪、小鹏等车企宣布涨价
    猝不及防!比亚迪、小鹏等车企宣布涨价

  • 全行业攻坚智能网联汽车安全

  • 特斯拉推送四大新功能:空调功能更新、新增语言支持
    特斯拉推送四大新功能:空调功能更新、新增语言支持

  • NFT与元宇宙热度回撤,阵痛之后何去何从?

  • 特斯拉推送四大新功能:空调功能更新、新增语言支持
    特斯拉推送四大新功能:空调功能更新、新增语言支持

  • 谷歌新操作系统曝光:屏幕底部有任务栏
    谷歌新操作系统曝光:屏幕底部有任务栏

  • 抢先苹果!罗永浩“真还传”下月完结:即将进军VR行业

  • 瑞数信息荣膺CCIA2021年度优秀会员单位

  • 深度视觉宣布完成过亿元A轮融资,将用于产品研发和市场拓展等

中国智能在线