“我个人也喜欢看西部片,但现在机器学习的发展就像西部大开发一样‘野’。”美国加州大学伯克利分校理论计算所主任莎菲·戈德瓦瑟(Shafi Goldwasser)在世界顶尖科学家论坛(上海·滴水湖)上发表题为《密码学和机器学习》的演讲,提醒大数据时代的隐私安全问题。
这位最年轻的图灵奖得主观察到,机器学习和大数据促成了世界范围内的权力转移。“看看2001年市值最高的公司,都是通用电气和埃克森美孚之类的能源企业;2016年都是大数据公司。难怪他们说现在数据就是石油,数据就是货币。” 那么,普通人在大数据时代会面临什么样的安全威胁呢?“我觉得什么都是威胁。”戈德瓦瑟在10月31日接受澎湃新闻专访时笑道。“不过我觉得最大的一点还是如何在保护数据隐私的情况下计算数据。” 女性的“完美学科” 这位1959年出生于美国纽约的计算机科学家戴着一副绿色支架的无框眼镜,深褐色头发随意地垂到肩膀。1979年,戈德瓦瑟从卡内基梅隆大学应用数学系毕业。卡内基梅隆的计算机科学在当时已经很强势,进入伯克利继续攻读硕士和博士学位时,她毫不犹豫地选择了计算机科学:“我觉得这对具有数学天赋的人来说是一种很自然的选择。” 莎菲·戈德瓦瑟(Shafi Goldwasser)澎湃新闻记者 孙懿赟 图 1983年,戈德瓦瑟进入麻省理工学院(MIT)工作,并在1993年获得教授职位。她的研究领域为计算复杂性理论、密码学和计算数论。她和MIT同事Silvio Micali共同发明的概率加密为在线交易安全制订了黄金标准。 他们凭此成就共同获得了2012年的图灵奖。这是计算机学术领域的最高奖项,而戈德瓦瑟是历史上第三名女性得主。 “我觉得对数学好的女性来说,计算机是个绝妙的学科!这个领域相对年轻,十分开放,并无成规限制。绝大多数高校的计算机系都有很强的女性,正如我在卡内基梅隆、MIT和伯克利遇见了一些密码学领域的顶尖女性科学家。”她说道。 戈德瓦瑟吐字清晰但语速极快,回答问题时显出十足的自信与理性。她经常会在叙说到一半时切换到另一种表述方式更佳的语法,中间不作停顿,暗示着思维甚至比语速还快。 在戈德瓦瑟看来,无论是在学术界还是产业界,计算机科学都是“完美的领域”,只要具备强有力的分析和技术能力,编程经验并非必需:“关键还是数学。女性也许编程起步要晚一些,但数学一点都不比男性差。” 量子计算威胁不到密码学 一些人会担心量子计算机会挑战现有的密码体系。戈德瓦瑟对这一科技热点持有相当谨慎的态度。 她认为量子计算机是一种很美妙的理论,然而,人们尚不知道怎么去制造一台成规模、纠错强的量子计算机,量子算法也无从在量子计算机上跑起来。 就现在主流的公开密钥密码体制RSA而言,破解密码的难度取决于对极大整数做因数分解的能力。“据我所知,目前量子计算机最大能对143进行因数分解,即11乘以13。所以距离量子计算机真的能跑因数分解算法还很遥远,不清楚有生之年能否亲见。”她说道。 正因如此,在前一天的论坛环节,当中国科学技术大学常务副校长、世界首颗量子通信试验卫星“墨子号”之父潘建伟院士提到理论上所有密码都可以被经典计算机甚至量子计算机破解,戈德瓦瑟提出了疑问。 “谢谢您精彩的演讲。您开头提到没有计算机解决不了的计算问题,我觉得不对。”她站起来说道。 戈德瓦瑟对澎湃新闻记者解释道:“如果理论上你能获得世界上所有的计算时间,那理论上它们都会被破解。但事实上是有计算时间的限制的。如果用渐进语句产生足够的密码数,目前尚无有效的经典算法可以破解。还有四种基于几何学和格问题的新加密系统,即使是量子计算机也没有相对应的破解算法。 总的来说,就目前所知的量子计算机而言,我们有安全的加密系统。” 针对另一大科技热点人工智能,戈德瓦瑟从个人经历过的美国顶级高校出发,为中国高校的发展提出了建议。卡内基梅隆一向被誉为“全球AI大本营”,是李开复、沈向洋、洪小文、陆奇等众多华人AI专家的母校;MIT则早在1959年就建立了世界上第一个人工智能实验室。 戈德瓦瑟认为很重要的一点是:大学不仅要有强大的人工智能团队,也需兼顾理论科学和硬件系统。“人工智能现在是很重要、很成功,但人工智能需要用硬件、需要保护数据、需要验证算法安全可行、需要聪明的算法和系统。方方面面都专业,才能做出好科学。我想这是中国的高校可以学习的一点经验。” “我亦不能免俗” 像计算机领域的许多“鼎鼎大名”一样,戈德瓦瑟也涉足产业界,联合创始了初创企业二元技术(Duality Technology),提供协同计算服务。这是一种针对隐私数据的分布式计算,能在不同机构间分享信息而又不泄漏信息,避免本文开头提到的隐患。 她举了两个例子,一是把数据上传到云端时,如何确保云既计算正确又没泄漏数据。二是如果某人在医院里留下电子病历,在基因测序公司留下基因数据,如何让这两个数据库在不互相交出数据的情况下实现融合。 她从密码学领域出发,为数据的多个来源方之间建立一种安全的协同计算服务。这样的计算可以在各个国家不互相知晓卫星的情况下避免卫星相互碰撞;可以在公司不透露个人工资的情况下了解薪酬结构是否实现了性别平等;也可以在不暴露患者隐私的情况下收集大量DNA样本寻找与精神分裂有关的基因。 当最后被问及普通互联网用户该如何最大化地维护自己的数据隐私,戈德瓦瑟认为这是一个很重要的问题:“普通个体目前得不到很好的建议。每天大家都在面对账号密码、隐私协议,只要你想用某个软件,你就得同意那个跳出来的用户隐私协议。” 戈德瓦瑟认为个体应该尽力争取多样化的系统,选择那些无需获取用户隐私的软件。“我知道这不容易,权力现在不在个体手里,而在企业手里。他们拿出一个服务,你爱要不要。” “使用新技术的诱惑太大了,大家都顾不上去想实际会损失什么。”她说道,“我亦不能免俗。”

—版权声明—

来源:澎湃新闻

仅用于学术分享,版权属于原作者。

若有侵权,请联系删除或修改!

推荐内容