环球焦点！联邦学习前路如何？杨强：已到“合久必分”的状态_中国智能在线

2022年，联邦学习论文数量出现大幅跃升，成为了屡登顶会的香饽饽：

(资料图片)

NeurIPS发布联邦学习论文41篇，较前一年有近30%的增长幅度；ICML则在2022年收录联邦学习论文74篇，几乎成倍于2021年。

这个规律同样存在于顶会AAAI、AISTATS、KDD及CVPR中。

联邦学习论文在顶会频现，相应的，相关产业实践也进行得如火如荼。

这个现象的最好解答者，自然是联邦学习领域的国内最知名大牛：香港科技大学计算机与工程系讲座教授和前系主任、中国人工智能学会（CAAI）荣誉副理事长、微众银行首席人工智能官杨强教授。

不仅因为他是CAAI，AAAI，ACM，IEEE，AAAS等多个国际学会Fellow，能够解惑一二。

更能激起求知欲的是，这些联邦学习论文中，有多篇与他带领的团队有关联。

△ 杨强

今年，他在微众银行带领的AI团队，与上海交通大学、中山大学等机构联合撰写了 3篇联邦学习领域论文。

这3篇论文，以一作身份，被IJCAI 2022、TPAMI 2022、ACM TIST国际人工智能顶级学术期刊和顶级学术会议收录发表。

可信联邦学习，走的是一条怎样的路？

2018年，国内引进了联邦学习（Federated Learning）概念。

为了解决数据割裂、数据孤岛等问题，杨强带领的微众银行AI团队在国内系统性提出联邦学习理论。

能够保证各企业在自有数据不出本地，不违规的情况下进行联合建模，提升机器学习建模效果。

而后，又于2019年开源首个工业级联邦学习技术框架 FATE ，同年6月捐献给Linux基金会。

3年时间，在联邦学习领域探索的公司如雨后春笋。

联邦学习发展空前，已在金融、医疗、互联网等领域落地应用，并延伸出图联邦学习、动态联邦学习、包容性联邦学习等研究分支。

从刚开始的2018年至2019年间，FATE和主攻横向联邦学习的TensorFlow分庭抗礼，到2019年后，众多初创公司或以FATE为内核，或推出新系统。

一路至今，用杨强的话来说，现在的联邦学习已经进入到“合久必分”的状态。

正是在此基础上，联邦学习发展出第二阶段，可信联邦学习。

联邦学习的发展和应用，一直伴随着这样的声音：

存不存在为了提高效率和性能，牺牲安全性的可能？

杨强简明扼要地解释道，绝对安全等于绝对低效，绝对高效意味着绝对不安全：“联合建模要结合安全性和可用性一起看。如果是一个极端安全的模型，安全到不能实际使用，这东西也没用。”

对此，论文《联邦学习中隐私与模型性能没有免费午餐定理》通过研究给出的答案是：隐私保护、模型性能、算法效率三者需要平衡，且可以平衡。

在联邦学习过程中，一个半诚实的攻击者，通过观察和了解参与方的数据信息，可能可以推断用户的隐私数据。这种针对隐私的攻击叫做“贝叶斯推断攻击（Bayesian Inference Attack） ”。

文章从信息论的角度，为联邦学习中隐私泄露和效用损失的分析提供了一个通用框架。

这个理论框架揭示了对于满足“贝叶斯隐私”的多方计算系统而言，都满足“｜安全｜+｜效能｜≤常数”这一“安全-效益恒定定律”。

无免费午餐定理通过量化隐私和效用之间的约束关系，证明信息的相互泄露和模型效能是互相制约的。

之所以叫“无免费的午餐”，是因为研究表明，一般情况下，隐私和效用的权衡中，必须用一定程度的效用降低来交换隐私的保护，将潜在的隐私损失维持在可接受范围内。

那么，能不能发明一种“聪明”的算法，把安全性、模型效能、准确率同时最大化呢？

微众银行AI团队和中山大学合作发表的另一篇论文——《FedCG：利用条件生成对抗网络在联邦学习中保护隐私并保持模型性能》——正面回答了这个问题。

FedCG，文章提出的一种新的联邦学习方法，利用条件生成对抗网络，以实现高水平的隐私保护，同时保持模型的性能。

具体而言，FedCG将每个联邦学习参与者的本地网络分解成一个私有提取器和一个公共分类器，然后保持提取器的本地性来保护隐私。

△ FedCG概述图

它结合条件生成对抗网络和分割学习，不是暴露提取器，而是通过与服务器共享客户端的生成器来聚合客户端的共享知识，从而提高本地网络的性能。

实验表明，与联邦学习基线相比，FedCG 有更好的隐私保护能力，同时在模型性能上也具有竞争力。

另外，考虑到联邦学习不是一次性的训练，它涉及数据的收集、选择，模型的训练、推断甚至交换，整个过程可能面临非法复制、重新分发、滥用的风险。

针对于此，结合对模型知识产权保护的思考，微众银行AI团队进行了一项工作：提出一种联邦深度神经网络（FedDNN）所有权验证方案，称为FedIPR。

《FedIPR：联邦学习模型所属权验证》一文详细介绍道，FedIPR方案允许嵌入和验证私有水印，来申明FedDNN模型的所有权。

有了这个方案，模型由谁做出、有谁用过、谁进行过模型交易，以及模型的危险性、特别性等，都会得到很好的检测。

如此这般，方便了对联邦学习模型进行全生命周期管理，也对模型知识产权起到保护作用。

模型的归属权验证一直是业界致力于解决的难题，微众银行AI团队是首个在联邦学习中融入这项工作的团队。长远来看，这项工作有利于数据和模型市场的建立和规范。

综合看来，此次陆续发表的3篇联邦学习论文，分别从理论、实践、规模化、工程化等不同的角度，对可信联邦学习进行了全面探索。

可信联邦学习的提出，通过提出端到端安全生命周期的管理、FedCG这种防火墙式的安全方法等一系列技术上的提升，再加入许多软件工程的管理，譬如软件治理、模型追踪等，将联邦学习领域的发展推进了一步。

至此，联邦学习为何能够成为顶会们的香饽饽，也就有了清晰的眉目。

而且对于联邦学习的火热，杨强还这样评价道：

联邦学习的第二阶段，也就是可信联邦学习，从全世界范围来看都是刚刚起步，到处都有学者响应。

但正所谓能用起来的技术才是好技术，那么接下来的一个问题便是：

顶会们的“香饽饽”，正如何改变我们的生活？

正如我们刚才提到的，可信联邦学习需要处理的那些数据，一般都具备较强的独立性、隐私性、安全性。

因此，金融、医疗、物流、政务等场景便成为了联邦学习发挥其实力极佳的“试验田”；尤其是在金融场景中，联邦学习涉足较早。

联邦学习现在应用上的发展态势，用 “百花齐放” 来形容不足为过。

例如全球科技巨头谷歌，国内外学术机构如卡内基梅隆大学（CMU）、北京邮电大学等名校也在致力于研究联邦学习；在论文全球高被引方面，国外机构谷歌排名第一，而国内机构则是杨强所在的微众银行。

而且与之相关的开源框架也是陆续被提出，例如OpenMined推出的Pysyft、微众银行的FATE和谷歌的TFF框架等等。

从大方向上来看，现在微众银行所使用的可信联邦学习，不单单是能够完成一个项目那么简单，更是能够对项目做一个分析和认证。

在此能力的背后，微众银行所依托的便是全球首个开源的工业级联邦学习框架——FATE （Federated AI Technology Enabler）。

而自2019年开源以来，这个框架也在不断的提升自己的能力。

像刚才我们提到入围的几篇论文，都已经被涵盖了进来，目前已经步入2.0阶段。

具体到实际案例，可信联邦学习在金融行业反欺诈上便起到了很好的作用。

因为在这个过程中所涉及到的数据着实纷繁复杂，包括银行机构、电商、运营商、政务等等。

各方都需要保障自己数据的安全、隐私以及所有权，但交易过程中相互之间又有所交织。

而可信联邦学习就能在保障这个大前提之下，还能做到挖掘金融行为、消费行为、通信行为、社交行为等众多特征。

以及再针对不同细分金融反欺诈业务场景构建专有模型，从而提升金融行业的整体反欺诈能力。

再如信贷风控，亦是如此。

以往中小微企业在信贷风控上所面临的老大难问题，便是信贷评审数据稀缺、不全面、历史信息沉淀不足等。

但有了可信联邦学习之后，就能在确保数据提供方数据安全以及隐私保护的情况下，让银行融汇企业经营数据、税务数据、工商数据、支付数据等多源信息，丰富建模特征体系，提升模型的有效性。

由此可见，联邦学习能够成为顶会、顶刊们的香饽饽，不仅是因为在科研领域中所具备的前沿性，更是因为它在现实场景中正在发挥着不可替代的作用。

那么对于被顶会、顶刊们pick的联邦学习，以及它玩转数据的这套打法，你怎么看？

推荐内容

环球焦点！联邦学习前路如何？杨强：已到“合久必分”的状态

2022-11-15
全球观速讯丨为什么说“业人一体化”是HR SaaS的新赛点？｜甲子光年

2022-11-15
全球即时：中国工程院院士邬贺铨：物联网是互联网发展新阶段的表现形式

2022-11-15
广电5G业务规模化|这个地区这么做

2022-11-15
基于GIS的生态安全网络格局构建之主成分分析

2022-11-15
全球观察：SaaS服务提供商有赞：亏损较去年减少32.8%，前三季度新增付费商家31591家，门店SaaS的新增付费商家占比约50%

2022-11-15
【全球独家】中国web3容不下幻想

2022-11-14
头条焦点：Web3.0板块迎来分化：榕基软件上演天地板，换手率41.04%！

2022-11-14
交易所挽回信任的 Merkle Tree 储备证明是什么？有什么用？有哪些漏洞？

2022-11-14
当前速读：把Stable Diffusion模型塞进iPhone里，做成APP一分钟出图

2022-11-14
环球今头条！服务至上的时代，生态才是ToB软件厂商发展加速的油门

2022-11-14
改革遇阻，马斯克被当头棒喝，推特假账号激增

2022-11-14
数字之光点亮产业未来——从2022年世界互联网大会乌镇峰会看数字经济发展信心

2022-11-14
2022金鸡奖之后，重新认识VR × 电影

2022-11-14
三费居高不下、连年亏损的奇安信，规模效应拐点何时显现？

2022-11-14
【环球新要闻】PICO频频杀入电影节，VR拥抱电影不是一个伪命题

2022-11-14
热议：离大谱！乔布斯凉鞋拍卖：成交价预计超过43万元

2022-11-11
技术驱动+场景赋能，新华三“双高”增长的秘密

2022-11-11
当前速递！寒气席卷全球，学子梦碎硅谷！扎克伯格一夜裁掉1.1万员工

2022-11-11
iBUILDING数字孪生——延伸世间的美好

2022-11-11
即时焦点：中国元宇宙Pico的烦恼：销量卖不动，派系还内斗

2022-11-11
每日视点！奇点云在全域数据融合场景的图计算实践 | 云栖回顾

2022-11-11
2022年三季度中国软件开发行业A股上市企业归属母公司净利润排行榜：同花顺夺冠，营收最高的上海钢联净利润未排进前十（附热榜TOP100详单）

2022-11-11
焦点观察：比特币将跌至13000美元？小摩称FTX危机将导致去杠杆化延续数周

2022-11-11
【热闻】售价299美元起，小派发布Pimax Portal，集VR、游戏掌机、移动PC于一体

2022-11-11
产业互联网加速赋能钢铁行业EPD平台标签发布

2022-11-11
退潮之后的NFT与电竞

2022-11-11
热消息：仲量联行推出“碳中和”数字化解决方案

2022-11-11
每日播报!央视《朝闻天下》栏目：企业微信助力中小企业转型

2022-11-10
律师详解：如果币安退出收购 FTX 会否寻求破产清算？

2022-11-10
焦点关注：云安全之路 | 当我们谈云网络安全的时候我们在谈什么

2022-11-10
全球速讯：币安赢下币圈闪电战，链游会否迎来新生？

2022-11-10
今头条！AIGC是冲击还是机会？

2022-11-10
从互联网大厂，看互联网近30年的历程

2022-11-10
【新要闻】网易云音乐或在“音乐社交”外寻找新底牌

2022-11-10
天天速讯：推进APP个人信息保护合规治理互联网平台当好“守门人”

2022-11-09
【天天快播报】遵义链获批国家网信办境内区块链信息服务备案

2022-11-09
热点聚焦：下一代互联网，到底是Web3还是元宇宙？

2022-11-09
字节跳动又一个梦要碎了

2022-11-09
焦点短讯！淘丁集团：现代企业必备的9种网络安全能力

2022-11-09
全球今日报丨硅谷“灭霸”，血洗推特

2022-11-09
全球短讯！联想以科技推动数字化和智能化，杨元庆的四个展望

2022-11-09
【全球热闻】从腾讯离职创业6年，为何再度选择VR游戏赛道？| 专访诸葛瓜游戏CEO郑德权

2022-11-09
腾讯最大的对手，不是阿里巴巴，竟然是中国移动

2022-11-09
天天速看：用天涯BBS模式赋能户外媒体等产业互联网，是草根创业的机会！

2022-11-09
【报告解读】2022数字经济+乡村振兴发展指数报告

2022-11-09
【报资讯】AIGC火了，但它能替代红人们吗？

2022-11-09
全球热讯:Meta正在经历公司历史上最大规模裁员；荷兰AR创企Augmedit获超100万欧元融资

2022-11-09
天天热议:1400多员工纯线上办公，撑起一个SaaS巨头，火遍全球

2022-11-08
世界微资讯！2022年人工智能数据标注产业现状分析

2022-11-08

环球焦点！联邦学习前路如何？杨强：已到“合久必分”的状态

2022-11-15
全球观速讯丨为什么说“业人一体化”是HR SaaS的新赛点？｜甲子光年

2022-11-15
【全球报资讯】2000台“汽车机器人”被抢光，集度要做汽车界的“苹果”

2022-11-15
快递只剩涨价一条路

2022-11-15
环球微速讯：预制菜来了，厨师失业不远了？

2022-11-15
世界最资讯丨“数字·进化”丨2022数字化发展峰会重磅启动

2022-11-15
天天热消息：红杉下注，碳足迹计量平台Joro完成1000万美元A轮融资丨海外邦

2022-11-15
基于GIS的生态安全网络格局构建之主成分分析

2022-11-15
全球观察：SaaS服务提供商有赞：亏损较去年减少32.8%，前三季度新增付费商家31591家，门店SaaS的新增付费商家占比约50%

2022-11-15
广电5G业务规模化|这个地区这么做

2022-11-15
全球即时：中国工程院院士邬贺铨：物联网是互联网发展新阶段的表现形式

2022-11-15
环球热消息：AI种田，靠不靠谱？

2022-11-15
得物隐私博弈，用户永处下风

2022-11-15
锂价暴涨点燃全球能源战

2022-11-15
当前动态:中国首富的咖啡新生意，与奶茶有关

2022-11-15
世界杯，中国企业的场外战事

2022-11-15
焦点日报：拼多多出海第一刀，“砍”向Shein

2022-11-15
热文：中国没有“潮牌”

2022-11-15
羽绒服狂卷高端：大鹅失人心，国货硬碰硬

2022-11-14
天天观点：快时尚巨头SHEIN要变“慢”

2022-11-14
天天热议:融资丨「邦耀生物」完成逾2亿元人民币B轮融资，上海自贸区基金领投

2022-11-14
【全球独家】中国web3容不下幻想

2022-11-14
全球聚焦：融资丨「孔辉科技」完成5.1亿元B轮股权融资

2022-11-14
【独家】“消失”的唯品会与被遗忘的沈亚

2022-11-14
头条焦点：Web3.0板块迎来分化：榕基软件上演天地板，换手率41.04%！

2022-11-14
Twitter姓“马”之后

2022-11-14
通讯！融资丨「优家民生」完成1000万元天使轮融资，思采实业投资

2022-11-14
直播的风口，微信和京东却没有大主播

2022-11-14
改革遇阻，马斯克被当头棒喝，推特假账号激增

2022-11-14
当前速读：把Stable Diffusion模型塞进iPhone里，做成APP一分钟出图

2022-11-14
数字之光点亮产业未来——从2022年世界互联网大会乌镇峰会看数字经济发展信心

2022-11-14
环球今头条！服务至上的时代，生态才是ToB软件厂商发展加速的油门

2022-11-14
交易所挽回信任的 Merkle Tree 储备证明是什么？有什么用？有哪些漏洞？

2022-11-14
中国跑鞋江湖大洗牌

2022-11-14
每日看点！融资丨「踏歌智行」完成亿元级C1轮融资，金沙基金领投

2022-11-14
为什么"痛车"文化又回潮了？

2022-11-14
全球快看点丨疯狂小杨哥，遍地假分身

2022-11-14
喜茶“卷死”喜小茶

2022-11-14
2022金鸡奖之后，重新认识VR × 电影

2022-11-14
三费居高不下、连年亏损的奇安信，规模效应拐点何时显现？

2022-11-14
【环球新要闻】PICO频频杀入电影节，VR拥抱电影不是一个伪命题

2022-11-14
西班牙球星投资，素食创业公司Heura完成2000万欧元Pre-B轮融资丨海外邦

2022-11-14
抖快B，剧集上市公司未来的金主？

2022-11-14
抵制外卖满减，开放加盟，喜茶们卷不动了

2022-11-14
天天微动态丨降薪跳槽的打工人：钱少了，快乐回来了

2022-11-14
这届双十一，理智的铲屎官没那么好糊弄了？

2022-11-14
看热讯：双11，中小主播日子难过

2022-11-13
我，前练习生，在游乐园做NPC，日薪5000

2022-11-13
天天热头条丨晚上卖包子，会更赚钱吗？

2022-11-13
中国SaaS第一股，活成了可选消费

2022-11-13
马斯克血洗硅谷

2022-11-13
热点！年轻人还需要「代言人」吗？

2022-11-13
世界杯叠加购物节日，预计用户消费和品牌营销将迎来大幅增长

2022-11-13
【播资讯】再谈硅谷生态

2022-11-13
苹果砍单，歌尔祭天？

2022-11-13
世界速讯：快时尚鼻祖Gap撤出中国，幕后操盘手浮出水面，缘何逆势接盘？

2022-11-12
天天新动态：大润发入局会员店

2022-11-12
上门做饭火了：四菜一汤68元，90后排队“上岗”

2022-11-12
【全球速看料】双十一，电商战报去哪了？

2022-11-12
环球热门:一个持续多年的疑问：为什么中国没有电商独立站的土壤？

2022-11-12
环球关注：歌尔闪崩：没议价权的日子，一天都没法过

2022-11-12
环球最新：扎克伯格，何以至此？

2022-11-12
每日资讯：TikTok美国小店正式上线，巴西、西班牙、爱尔兰也不远了？

2022-11-11
热议：离大谱！乔布斯凉鞋拍卖：成交价预计超过43万元

2022-11-11
技术驱动+场景赋能，新华三“双高”增长的秘密

2022-11-11
这届双十一，商家变了：不再亏本博流量，保利润是头等大事

2022-11-11
2022年三季度中国软件开发行业A股上市企业归属母公司净利润排行榜：同花顺夺冠，营收最高的上海钢联净利润未排进前十（附热榜TOP100详单）

2022-11-11
iBUILDING数字孪生——延伸世间的美好

2022-11-11
即时焦点：中国元宇宙Pico的烦恼：销量卖不动，派系还内斗

2022-11-11
当前速递！寒气席卷全球，学子梦碎硅谷！扎克伯格一夜裁掉1.1万员工

2022-11-11
每日视点！奇点云在全域数据融合场景的图计算实践 | 云栖回顾

2022-11-11
新动态：融资丨「摇橹船科技」完成亿元级A+轮融资，联通创投、洋丰集团投资

2022-11-11
融资丨「新康养研究院」完成数百万元天使轮融资，庆昱资本独家投资

2022-11-11
当前热讯：融资丨「四象科技」完成数千万元新一轮融资，北航投资领投

2022-11-11
融资丨「大毛牛」完成B轮超1亿元人民币融资，毅达资本等机构投资

2022-11-11
今日热闻!Keep需要的新故事，在元宇宙？

2022-11-11
焦点观察：比特币将跌至13000美元？小摩称FTX危机将导致去杠杆化延续数周

2022-11-11
产业互联网加速赋能钢铁行业EPD平台标签发布

2022-11-11
【热闻】售价299美元起，小派发布Pimax Portal，集VR、游戏掌机、移动PC于一体

2022-11-11
退潮之后的NFT与电竞

2022-11-11
热消息：仲量联行推出“碳中和”数字化解决方案

2022-11-11
每日视讯：喜茶做加盟，小老板们心动了

2022-11-11
当前最新：字节社交心不死

2022-11-11
环球观察：包馔夜包子融资千万元，传统的包子生意还有多大想象空间？

2022-11-11
每日消息!网约车之王？超越特斯拉？千亿估值的埃安离高端还有多远

2022-11-11
天天精选！资产、资源、杠杆、职场形象和机会成本

2022-11-11
【全球速看料】一种暴利的「水下」短剧

2022-11-11
60后退伍兵，靠卖鸡汤开店千家，儿子接班坐拥50亿身家

2022-11-10
环球今亮点！用20万启动资金跑出「中国好SaaS」，酷家乐“三剑客”到底做对了什么？

2022-11-10
当前滚动:疯狂小杨哥粉丝刚过亿，就直接买下一栋大楼

2022-11-10
每日播报!央视《朝闻天下》栏目：企业微信助力中小企业转型

2022-11-10
律师详解：如果币安退出收购 FTX 会否寻求破产清算？

2022-11-10
焦点关注：云安全之路 | 当我们谈云网络安全的时候我们在谈什么

2022-11-10
从互联网大厂，看互联网近30年的历程

2022-11-10
今头条！AIGC是冲击还是机会？

2022-11-10
全球速讯：币安赢下币圈闪电战，链游会否迎来新生？

2022-11-10
天天观天下！烧烤救不活味千拉面

2022-11-10
全球微资讯！线下商场卷起来，就没李佳琦什么事了

2022-11-10
环球微动态丨融资丨「阳铭智能」完成Pre A轮数千万元融资，宁波华桐创投领投

2022-11-10
天天热讯:“果链”龙头歌尔失去的，远超“33亿”

2022-11-10