磐创AI分享

转自 |新智元

编辑 | 袁榭、拉燕

【导读】 虽然DeepFake能令人置信地换脸,但没法同样换好头发。现在浙大与瑞典研究者都扩宽思路,用GAN或CNN来另外生成逼真的虚拟发丝。

DeepFake技术面世的2010年间末叶,正好赶上了川普时代。

无数搓手打算用DeepFake来好好恶搞大总统一下的玩梗人,在实操中遇到了一个不大不小的障碍:

各家DeepFake类软件,可以给图像换上金毛闯王的橙脸,但那头不羁的金发实在让AI都生成不出令人置信的替代品。

看,是不是那头毛就让DeepFake产品露馅了。

DeepFake搞得定换脸,也搞不定换头发

其实这是老问题遇到了新挑战。如何栩栩如生地复现人像模特的头发,这是一个自希腊-罗马时代的雕像师开始就很觉棘手的难题。

人脑袋平均有大概100000根头发丝,并且因为颜色和折射率的不同,在超过一定的长度后,即使在计算机时代也只能用复杂物理模型进行模拟,来进行图像移动和重组。

目前,只有自20世纪末以来的传统CGI技术可以做到这一点。

2017年的CGI头发模型处理结果

当下的DeepFake技术还是不太能解决这个问题。数年来,DeepFaceLab也只发布一个仅仅能捕捉短发的「头部全体毛发」模型,发部还是僵硬的。这还是一款在业内领先的软件包。

最近,DFL的合作伙伴FaceSwap做出了BiseNet语义分割模型,能使用户在deepfake输出图像中包括到耳部和头发的图形细节呈现。

这两套软件包都来自2017年Deepfakes的源代码,在当时颇受争议。

就算现在DeepFake模型要呈现的头发图像非常短,输出结果的质量往往也很差,头像好像是叠加上去的一样,不像是浑然一体的图像一部分。

用GAN来生成毛发

目前,业界用来模拟人像使用最多的两种办法,一个是神经辐射场技术(Neural Radiance Fields)。NeRF可以从多个视角捕捉画面,之后可以将这些视角的3D成像封装在可探索的神经网络AI里。

另一种办法则是生成对抗网络(GAN),GAN在人类图像合成方面比NeRF更加先进,即使是NeRF在2020年才出现。

NeRF对3D几何图形的推测性理解,将使其能够以较高的保真度和一致性,对图案场景进行复制。哪怕当前没有施加物理模型的空间、或者准确来说和摄像头视角无关的变化,所收集的数据导致的变形都是一样的。

不过就目前来看,NeRF模拟人类发丝运动模拟的能力并不出色。

与NeRF不同,GAN天然就有个几乎致命的劣势。GAN的潜在空间并不会自然包含对3D信息的理解。

因此,3D可感知的GAN所生成的人脸合成图像,在近几年成了图像生成研究的热点问题。而2019年的InterFaceGAN是最主要的突破之一。

然而,即使是在InterFaceGAN展示上的精心挑选的图像结果,也都表明:在时间的一致性的表现上,神经网络AI生成发丝图像达到令人满意的一致性依然是一项艰巨的挑战,应用在VFX图像工作流程中仍然性能不可靠。

用InterFaceGAN换脸后,头像上的发丝出现蒸腾效果

越来越明显的是,通过操控神经网络AI潜在空间进行的连贯视图生成,可能是一种类似炼金术的技术。

越来越多的论文中不得不另辟蹊径,将基于CGI的3D信息作为稳定的和规范化的约束,纳入GAN的工作流程。

CGI元素可以由3D形式的中间图形元表示,比方说「蒙皮多人线性模型」(SMPL,Skinned Multi-Person Linear Model)。

又或是应用和NeRF模式相近的3D推断技术得出,在这种技术中,图像的几何元素是从源图像和源视频中评估出来的。

就在本周,悉尼科技大学的ReLER实验室、AAII研究所、阿里达摩院以及浙江大学的研究者合作发布了一项论文,描述了用于3D可感知图像合成的「多视角连贯性生成性对抗网络」(MVCGAN)。

MVCGAN生成的头像

MVCGAN包含了一个「生成辐射场网络」(GRAF)AI,它可以在GAN中提供几何限制。理论上来讲,这个组合可以说实现了任何基于GAN的方法的最逼真虚拟头发输出结果。

MVCGAN生成的带发丝头像与其他模型生成头像的对比

从上图可以看出,在极端发丝参数下,除MVCGAN外,其他模型的图像结果都产生不可置信的扭曲

不过,在CGI工作流程中,以时间为基础的虚拟发丝重建依然是一项挑战。

因此业界尚无理由相信,传统的、基于几何图形的办法,能够在可预见将来能把具有时间一致性的发丝图形合成带入AI的潜在空间中。

用CNN生成稳定的虚拟头发数据

不过,瑞典查尔默斯理工学院三位研究人员即将发表的论文,或许还可以为「用神经网络生成人发图像」的研究提供新进展。

这篇题为《用卷积神经网络实时进行毛发滤镜》的论文即将在2022年5月份的重要学术会议「交互式3D图形和游戏盛会」上发表。

该系统由一个基于自动编码器的神经网络AI作为基础,该神经网络AI能够实时评估生成的虚拟发丝图案分辨率,包括发丝在虚拟空间中自动产生的阴影和头发厚度呈现。此自动编码器的随机数种子来自于由OpenGL几何体生成的有限随机数样本。

由这种方法途径,就可以只渲染有限数量的、具有随机透明度的样本,然后训练U-net来重建原始图像。

该神经网络在PyTorch上进行训练,可以在6-12小时内完成训练达到收敛,具体市场取决于神经网络体量和输入特征值的数量。然后将训练的参数(权重)用于图像系统的实时实现。

训练数据集,则是通过以随机距离、姿势以及不同的照明条件,来渲染数百张直发和波浪发型的实际图片而生成的。

样本中的发丝半透明度数值,是从在超采样分辨率条件下、以随机透明度渲染的图像平均求得的。

原始的高分辨率数据,先被降采样,以适应网络和硬件限制;然后在典型的自动编码器工作流程中进行上采样,以提高清晰度。

利用从训练模型派生的算法的「实时」软件,作为此AI模型的实时推理应用程序,采用了NVIDIA CUDA、cuDNN和OpenGL的混合。

初始输入特征值被转储到OpenGL的多重采样颜色缓冲区中,其处理结果在CNN中继续处理前会分流到cuDNN张量,然后这些张量将会被复制回「实时」OpenGL纹理中,以施加到最终图像中。

这个AI的实时运行硬件是一张NVIDIA RTX 2080显卡,产生的图像分辨率是1024x1024像素。

由于头发颜色的数据值与神经网络AI处理的最终值是完全分离的,因此改变头发颜色是一项容易的任务,尽管虚拟发丝的渐变和条纹等效果仍然将在未来构成挑战。

结论

探索自动编码器或GAN的潜在空间,仍然更类似于靠直觉的驾帆船,而非精确驾驶。只有在最近的时段,业界才开始看到在NeRF、GAN和非deepfake(2017)自动编码器框架等方法中生成「更简单」的几何形状(如人脸)的可靠结果。

人类头发显著的结构复杂性,加上需要结合当前物理模型和图像合成方法无法提供的其他特征,表明头发合成不太可能仍然只是一般面部合成模型中的一个集成组件。此任务需要复杂的、专用的和独立的神经网络AI来完成,即使这些神经网络最终可能会被纳入更广泛、更复杂的面部合成框架中。

推荐内容

  • DeepFake换头术升级:浙大新模型,GAN出一头秀发

  • 数据中心碳中和之路,新华三如何全栈赋能?

  • 波场DAO新物种下场,USDD如何破局稳定币市场?

  • 小扎真扎心,Meta要开始收“元宇宙税”了

  • 《2022年第一批山东省信创优秀解决方案》:超越科技、海尔、瀚高、华云、浪潮、麒麟、兆芯、中孚等19家公司,31个方案入围

  • K时评知乎理性乐观的依据是什么?

  • 豆瓣“渡劫”:小红书、知乎、虎扑……谁能赢下内容社区之战?

  • 周公观娱 | 在元宇宙里,可以跟偶像谈恋爱吗?

  • AI律师,在线诈骗

  • 【永生】在元宇宙里复活?病魔夺走父亲5年,小哥独创挚爱「永生」版本

  • 超越数字化,塑造未来的七大战略要务!

  • 国内首家元宇宙门户正式上线,芝麻财经专注数字藏品第三方服务

  • 百度虚拟数字人凭借综合实力夺冠,两年内有望实现“数字人自由”

  • 联通李氏三兄妹,都是牛人!

  • 看齐QQ!微信iOS内测版推出重磅升级:朋友圈也可以直接转发

  • 5G实时云渲染+“云选车”,新兴技术推动疫情之下的行业变轨

  • 顶天立地,扎稳根基,AI落地助力讯飞逆势高速增长

  • 视频号必须赚钱

  • 中央5部联合:实施智慧广电乡村工程,使用低频5G网络覆盖

  • “内鬼”获取公民个人信息搞电诈

  • 历史沿革:NFTs在以太坊上的发展之路

  • 元宇宙房地产:又一个疯狂的加密市场吗?

  • 有人翻小红书种草,有人却翻到了最新AI技术趋势

  • 日本教授发明咸味放大筷子,少盐食物也能有滋味了!此前还搞出舔屏尝味电视

  • 为什么 AI 驱动的分析对于数据驱动的决策至关重要

  • 阿里云 VMware 服务正式上市

  • 测试版微信可以定向清理缓存,小容量手机有救了?

  • 【机器视觉】从传感器到算法原理,机器人视觉避障原来是这样的

  • 宇宙人(1015期)俄“萨尔马特”洲际导弹试射;中国航天日海报发布;传阿里达摩院裁员30% ;

  • 互联网凉了?

  • 一座2500人的意大利小城 正在实验“比特币挖矿”

  • 科大讯飞 2021 年营收 183 亿元,同比增长 40.6%

  • 中国联通:2022年第一季度净利润46.34亿元

  • “东数西算”如何解决能耗难题?新华三早已深度布局

  • 微信朋友圈10周年,App膨胀了10年,512GB存储都不够用了!

  • 机器学习三个时代的计算趋势

  • 用友商旅云:重构商旅服务,助力企业数智化创新

  • 为企业出海“搭桥”,汇量科技靠什么出圈?

  • 与「看不见的手」掷骰子的人

  • 无代码AI营销平台Mutiny完成5000万美元融资,老虎全球基金、Insight Partners领投

  • 上海联通等一等,兄弟公司爱心物资运来啦!克服物流受阻困难!

  • 5G分流比,这里率先突破40%!

  • 联通被判侵权!排超联赛IPTV侵权“第一案”!

  • 安华金和&OceanBase打造数据库安全联合解决方案

  • 60岁华裔数学家将在美接受审判,被指控7项重罪,可能面临最高20年监禁

  • 中国移动:一季度净利256亿元 同比增长6.5%

  • 创维将推出超短焦VR一体机、AR眼镜Viture开启众筹、HTC推特流出新产品......

  • 安吉星手机应用APP迎来10.0重磅升级

  • 美国窃密全球的主战装备被我国曝光!国产化和自主可控是应对王道

  • Oracle数据库机:让数据价值回归用户“第一性原理”

  • DeepFake换头术升级:浙大新模型,GAN出一头秀发

  • 数据中心碳中和之路,新华三如何全栈赋能?

  • 波场DAO新物种下场,USDD如何破局稳定币市场?

  • 小扎真扎心,Meta要开始收“元宇宙税”了

  • 《2022年第一批山东省信创优秀解决方案》:超越科技、海尔、瀚高、华云、浪潮、麒麟、兆芯、中孚等19家公司,31个方案入围

  • 周公观娱 | 在元宇宙里,可以跟偶像谈恋爱吗?

  • 豆瓣“渡劫”:小红书、知乎、虎扑……谁能赢下内容社区之战?

  • K时评知乎理性乐观的依据是什么?

  • 超越数字化,塑造未来的七大战略要务!

  • AI律师,在线诈骗

  • 【永生】在元宇宙里复活?病魔夺走父亲5年,小哥独创挚爱「永生」版本

  • 体验经济时代,长虹引领电视产业新发展
    体验经济时代,长虹引领电视产业新发展

  • 百度虚拟数字人凭借综合实力夺冠,两年内有望实现“数字人自由”

  • 历史沿革:NFTs在以太坊上的发展之路

  • 为什么 AI 驱动的分析对于数据驱动的决策至关重要

  • 视频号必须赚钱

  • 全球第一!宁德时代2021年净利润159.31亿元
    全球第一!宁德时代2021年净利润159.31亿元

  • 辛巴被曝卖假货,而我在直播间卖水果,日销3000斤

  • 锐龙55600G评测:台积电7nm工艺,6核心12线程
    锐龙55600G评测:台积电7nm工艺,6核心12线程

  • “内鬼”获取公民个人信息搞电诈

  • 联通李氏三兄妹,都是牛人!

  • 1.55亿TB出货量打破2019年纪录,磁带存储再创新高
    1.55亿TB出货量打破2019年纪录,磁带存储再创新高

  • 办公自由后,我逃离了大城市

  • 有人翻小红书种草,有人却翻到了最新AI技术趋势

  • 360业绩公告公布   完成5.47亿元城市安全订单
    360业绩公告公布 完成5.47亿元城市安全订单

  • 十年投入700亿,雷军要造五菱宏光还是兰博基尼?

  • 元宇宙房地产:又一个疯狂的加密市场吗?

  • 完美日记失重,逸仙电商危矣

  • 看齐QQ!微信iOS内测版推出重磅升级:朋友圈也可以直接转发

  • 利拉德做鞋垫生意,第一年就要卖100万美元货

  • 中央5部联合:实施智慧广电乡村工程,使用低频5G网络覆盖

  • 日本教授发明咸味放大筷子,少盐食物也能有滋味了!此前还搞出舔屏尝味电视

  • 网红书店VS场景阅读,谁是全民阅读更优解?

  • 谁在抄底猪肉股?

  • 13mini不受欢迎  苹果将停产5.4英寸iPhone14mini
    13mini不受欢迎 苹果将停产5.4英寸iPhone14mini

  • 5G实时云渲染+“云选车”,新兴技术推动疫情之下的行业变轨

  • 顶天立地,扎稳根基,AI落地助力讯飞逆势高速增长

  • 从激进、落幕再到追逐:美俄中的载人登月战争

  • 张庭是如何忽悠二胎宝妈,建立300亿传销帝国的?

  • 国内首家元宇宙门户正式上线,芝麻财经专注数字藏品第三方服务

  • 名创优品的潮玩店,为何潮不起来?

  • 全民阅读时代,书店不靠卖书挣钱了

  • 自助餐:倒闭2万家,可我还在数钱

  • 被“副业焦虑”支配的年轻人

  • 【机器视觉】从传感器到算法原理,机器人视觉避障原来是这样的

  • 疫情反复两年多,你会如何回答这四个问题?

  • 阿里云 VMware 服务正式上市

  • 测试版微信可以定向清理缓存,小容量手机有救了?

  • 趣头条确认将调整业务,停止自媒体平台
    趣头条确认将调整业务,停止自媒体平台

  • 联想承诺2025年全线计算机产品100%含再生塑料
    联想承诺2025年全线计算机产品100%含再生塑料

  • 为环保不再标配充电器,苹果被巴西法院罚款
    为环保不再标配充电器,苹果被巴西法院罚款

  • 东微半导体2021年净利润1.47亿元,同比增430.66%
    东微半导体2021年净利润1.47亿元,同比增430.66%

  • 互联网凉了?

  • 宇宙人(1015期)俄“萨尔马特”洲际导弹试射;中国航天日海报发布;传阿里达摩院裁员30% ;

  • 一座2500人的意大利小城 正在实验“比特币挖矿”

  • 科大讯飞 2021 年营收 183 亿元,同比增长 40.6%

  • “东数西算”如何解决能耗难题?新华三早已深度布局

  • 机器学习三个时代的计算趋势

  • 中国联通:2022年第一季度净利润46.34亿元

  • 新中产钱包缩水,谁来圆蕉下的lulu梦?

  • 微信朋友圈10周年,App膨胀了10年,512GB存储都不够用了!

  • 融资丨「数派跨境」完成近千万元天使轮融资,领星集团独家投资

  • 融资丨「寓科未来」完成D+轮融资,清华x-lab创业DNA基金、启恒产业投资基金加持

  • 英国石油巨头与澳大利亚电动汽车充电桩签订多年期合同
    英国石油巨头与澳大利亚电动汽车充电桩签订多年期合同

  • 融资丨「小森日禾」完成数百万元天使轮融资,睿鼎资本独家投资

  • 与「看不见的手」掷骰子的人

  • 为企业出海“搭桥”,汇量科技靠什么出圈?

  • 用友商旅云:重构商旅服务,助力企业数智化创新

  • 无代码AI营销平台Mutiny完成5000万美元融资,老虎全球基金、Insight Partners领投

  • 第一波“刘畊宏女孩”已经受伤了

  • 60岁华裔数学家将在美接受审判,被指控7项重罪,可能面临最高20年监禁

  • 超算云如何登上“东数西算”的快车

  • 中国移动:一季度净利256亿元 同比增长6.5%

  • 安吉星手机应用APP迎来10.0重磅升级

  • 阻止“TA们”监听你,AI能做到吗?

  • Omdia观察:沃达丰推出基于区块链的平台来推动物联网经济

  • 丰田再次宣布停产,5月全球销量将为75万辆
    丰田再次宣布停产,5月全球销量将为75万辆

  • 安华金和&OceanBase打造数据库安全联合解决方案

  • ​对于现阶段GameFi发展而言,兼容EVM重要吗?

  • Oracle数据库机:让数据价值回归用户“第一性原理”

  • 5G分流比,这里率先突破40%!

  • 上海联通等一等,兄弟公司爱心物资运来啦!克服物流受阻困难!

  • 创维将推出超短焦VR一体机、AR眼镜Viture开启众筹、HTC推特流出新产品......

  • 美国窃密全球的主战装备被我国曝光!国产化和自主可控是应对王道

  • 联通被判侵权!排超联赛IPTV侵权“第一案”!

  • 多家平台宣布,将上线显示用户IP属地功能

  • 当下自动驾驶商业化落地过程中的五大难点
    当下自动驾驶商业化落地过程中的五大难点

  • 请别神化「私域」:六大陷阱,招招毙命

  • 获国家级认可,畅捷通入选2021年“中小企业数字化转型典型案例”!

  • 为了保护隐私?谷歌安卓商店颁布新规定:通话录音软件全凉了

  • 知乎回应裁员40人:视频业务上没有裁员计划
    知乎回应裁员40人:视频业务上没有裁员计划

  • “携号转网”两年多,你后悔了吗?

  • 收购拍乐云,布局音视频,钉钉上演迷踪拳还是组合拳?

  • Meta VR游戏展再临,多人VR游戏春天要来了?

  • 合其家物物地图走进社区,林昕杨提出的“两圈融合”首站落地福州

  • 百度再战社交,语音比元宇宙有机会?

  • 石头科技披露2021年年报及2022年一季报   净利润14.02亿元
    石头科技披露2021年年报及2022年一季报 净利润14.02亿元

  • 三家运营商一季度业务喜提“开门红”

  • 融资丨「华翊量子」完成过亿元天使轮融资,高榕资本领投

  • 又闯红线?中国联通某分公司因违法行为被警告