当前视讯！英伟达超快StyleGAN回归，比Stable Diffusion快30多倍，网友：GAN好像只剩下快了_中国智能在线

萧箫发自凹非寺量子位 | 公众号 QbitAI

扩散模型的图像生成统治地位，终于要被GAN夺回了？

【资料图】

就在大伙儿喜迎新年之际，英伟达一群科学家悄悄给StyleGAN系列做了个升级，变出个PLUS版的 StyleGAN-T ，一下子在网上火了。

无论是在星云爆炸中生成一只柯基：

还是基于虚幻引擎风格渲染的森林：

都只需要接近0.1秒就能生成！

同等算力下，扩散模型中的Stable Diffusion生成一张图片需要 3秒钟，Imagen甚至需要接近10秒。

不少网友的第一反应是：

GAN，一个我太久没听到的名字了。

很快谷歌大脑研究科学家、DreamFusion第一作者Ben Poole赶来围观，并将StyleGAN-T与扩散模型做了个对比：

在低质量图像（64×64）生成方面，StyleGAN-T要比扩散模型做得更好。

但他同时也表示，在256×256图像生成上，还是扩散模型的天下。

所以，新版StyleGAN生成质量究竟如何，它又究竟是在哪些领域重新具备竞争力的？

StyleGAN-T长啥样？

相比扩散模型和自回归模型多次迭代生成样本，GAN最大的优势是速度。

因此，StyleGAN-T这次也将重心放在了大规模文本图像合成上，即如何在短时间内由文本生成大量图像。

StyleGAN-T基于StyleGAN-XL改进而来。

StyleGAN-XL的参数量是StyleGAN3的3倍，基于ImageNet训练，能生成1024×1024高分辨率的图像，并借鉴了StyleGAN2和StyleGAN3的部分架构设计。

它的整体架构如下：

具体到细节上，作者们对生成器、判别器和文本对齐权衡机制进行了重新设计，用FID对样本质量进行量化评估，并采用CLIP来对文本进行对齐。

在生成器上，作者们放弃了StyleGAN3中能实现平移同变性（equivariance）的架构，转而采用了StyleGAN2的部分设计，包括输入空间噪声以及跳层连接等，以提升细节随机变化的多样性。

在判别器上，作者们也重新进行了设计，采用自监督学习对ViT-S进行训练。

随后，作者采用了一种特殊的截断（truncation）方法来控制图像生成的效果，同时权衡生成内容的多样性。

只需要控制参数ψ，就能在确保CLIP分数（用于评估图像生成效果）变动不大的情况下，改善生成图像的风格多样性。

随后，作者们用64个英伟达A100训练了4周，最终得到了这版StyleGAN-T。

那么它的生成效果如何呢？

超快生成低分辨率图像

作者们对当前最好的几种GAN、扩散模型和自回归模型进行了评估。

在微软的MS COCO数据集上，StyleGAN-T实现了64×64分辨率下最高的FID。

（其中，FID是计算真实图像和生成图像特征向量距离的评估用值，数值越低，表示生成的效果越接近真实图像）

但在更高的256×256分辨率生成上，StyleGAN-T还是没有比过扩散模型，只是在生成效果上比同样用GAN的LAFITE要好上不少：

如果进一步将生成时间和FID分别作为纵轴和横轴，放到同一张图上来对比，还能更直观地对比生成质量和速度。

可见StyleGAN-T能保持在 10FPS 的速度下生成256×256分辨率图像，同时FID值逼近LDM和GLIDE等扩散模型：

而在文本生成图像功能上，作者们也从文本特征、风格控制等方面对模型进行了测试。

在增加或改变特定的形容词后，生成的图像确实符合描述：

即便是快速生成的图像，也能迅速控制风格，如“梵高风格的画”or“动画”等：

当然，偶尔也有失败案例，最典型的就是生成带字母要求的图像时，显示不出正常字母来：

作者们正在努力整理代码，表示不久之后就会开源。

作者介绍

作者们均来自图宾根大学和英伟达。

一作Axel Sauer，图宾根大学博士生，此前在卡尔斯鲁厄理工学院（KIT）获得本硕学位。目前感兴趣的研究方向是深度生成模型、神经网络架构和实证研究。

二作Tero Karras，英伟达杰出研究科学家，对英伟达RTX技术有重要贡献，也是StyleGAN系列的主要作者，主要研究方向是计算机图形学和实时渲染。

不过在这波GAN掀起的“文艺复兴”浪潮下，也出现了“StyleGAN时代迎来终结”的声音。

有网友感慨：

在这之前，最新StyleGAN生成的图像总能让我们大吃一惊，然而现在它给我们的印象只剩下“快”了。

你认为GAN还能撼动扩散模型的统治地位吗？

推荐内容

当前视讯！英伟达超快StyleGAN回归，比Stable Diffusion快30多倍，网友：GAN好像只剩下快了

2023-01-31
焦点报道:随幻科技洪煦：降低XR场景门槛，人人都能创造3D内容 | 镁客·请讲

2023-01-31
每日速看!Juniper：5G物联网迎来三年激增 2026年连接数将达1.16亿

2023-01-31
每日速看!VR被机构看好带动游戏市场？这几份报告带你了解行业现状

2023-01-31
蔚来车名侵权奥迪被德国判罚180万；《流浪地球2》周边众筹破亿……

2023-01-30
环球快资讯丨雷军发布内部信：宣布新成立两个委员会，雷军亲自任委员会主任

2023-01-30
每日速递：一位年轻Crypto VC的寒冬展望：22的起伏与23的晨光

2023-01-30
每日速看!科大讯飞发布发布2022年度业绩预告，营收、毛利小幅增长

2023-01-30
每日播报!微信公布春节数据：红包发送超40亿次，线下商业支付交易量同比增23%

2023-01-30
全球要闻：61岁程序员被迫线上求职，谷歌解雇高职位员工，开源专家也被炒

2023-01-30
【天天热闻】XR迈向10亿级必须解决的3个问题

2023-01-30
每日看点!科普 | 常听说以太坊Layer2很重要，Layer0、Layer1、Layer3又是什么？

2023-01-30
每日快看：Google：我能把文本变成音乐，但这个 AI 模型不能对外发布！

2023-01-30
RPA是否已过时？“RPA+什么”才能变得更强？

2023-01-30
环球新消息丨请回答2023，容联云能否反弹？

2023-01-30
全球时讯：雄安新区产业互联网平台如何助力企业发展？

2023-01-30
世界热议:云游戏的证道之路，还在继续？

2023-01-30
天天快看点丨广电“搅局”，专属APP会不会成运营商争夺的下一块“蛋糕”

2023-01-30
浅谈NFT项目和公链生态的关系

2023-01-30
天天快播：Hashrate Index：介绍瑞典比特币挖矿业

2023-01-30
【全球新要闻】云盘在云端，互相摸着对方过河，运营看资源！

2023-01-30
动态焦点:腾讯最大股东Naspers宣布将裁员30%

2023-01-30
技术洞察 | 今天你被“算法”了吗？

2023-01-30
当前最新：《蛋仔派对》爆火之后，我看到了国内游戏社区的更高阶形态

2023-01-29
环球新消息丨观潮周报：春节档总票房近68亿；抖音超市上线加码全域兴趣电商

2023-01-29
Cobo 神鱼：2023 寻找新的叙事逻辑

2023-01-29
焦点消息！脑机接口技术又有突破性进展马斯克合伙人研制大脑“第七层”

2023-01-29
世界即时看！3天裁员4万，微软、亚马逊、谷歌全球性消肿，苹果呢？

2023-01-29
每日视点！企业需为网络安全做哪些准备？

2023-01-29
消息！微软CTO Kevin Scott：人工智能的未来之路

2023-01-29
天天速讯：中国元宇宙四大独角兽，都是什么来头？

2023-01-29
喜事成双，群硕再度捧杯公益节

2023-01-29
当前快看：未来五年，人类和数字化劳动力混合的员工队伍将变得非常普遍

2023-01-29
金山云拟赴港双重上市第三季度净亏损超8亿元

2023-01-29
小红书里的年轻人，不想再被骗了

2023-01-29
春节特辑 | 隐私计算：为数字经济进入下一程构建基石

2023-01-29
太真了！3D打印肉来了，来一块尝尝？

2023-01-29
焦点日报：优质资产被盘活，知乎未来可期

2023-01-29
今日观点!“腾讯学不会电商”的魔咒，视频号恐也恐难打破

2023-01-29
每日讯息!ChatGPT会将社会推向大规模失业吗？一文详解这款AI技术是福是祸

2023-01-28
每日精选：私域动态：抖音推出撮合交易平台精选联盟;微信新增拒绝通话并发送消息入口;58同城推出短期保姆方案…

2023-01-28
世界观热点：阿里辟谣总部搬迁新加坡，马云仍“神隐”

2023-01-28
两大运营商合并已经进入实操阶段！

2023-01-28
【独家焦点】小红书已集成Conflux，允许用户在R-Space展示基于Cfx的NFT

2023-01-28
焦点讯息：阿里将在新加坡建全球总部？回应：总部始终在杭州

2023-01-28
环球快讯:2022生成模型进展有多快？新论文盘点9类生成模型代表作

2023-01-28
今日快看!美版头条ChatGPT上岗写稿消息一出，股价暴涨119%，此前刚裁员12%

2023-01-28
每日聚焦：DeepMind关闭首个海外实验室：设立仅五年！受硅谷大裁员影响！

2023-01-28
天天观速讯丨科普 | NFT是如何存储的？链上、链下和去中心化存储（抗审查）

2023-01-28
观天下！私域动态：德邦与京东签署服务协议;小米回应汽车设计文件泄密;有赞计划授出1445万份购股权…

2023-01-28

当前视讯！英伟达超快StyleGAN回归，比Stable Diffusion快30多倍，网友：GAN好像只剩下快了

2023-01-31
焦点报道:随幻科技洪煦：降低XR场景门槛，人人都能创造3D内容 | 镁客·请讲

2023-01-31
环球速读：故宫开年大展呈现“国子文脉”

2023-01-31
【焦点热闻】“精致抠们”一年掏千亿元，钱被“缺德舅”赚了

2023-01-31
融资丨「仙微视觉」完成近5000万天使轮融资，深圳鼎心资本领投

2023-01-31
三年赔两百万元后，餐饮老板绝地逢生

2023-01-31
今日播报!这三年创业的人，现在怎么样了？

2023-01-31
每日速看!Juniper：5G物联网迎来三年激增 2026年连接数将达1.16亿

2023-01-31
每日速看!VR被机构看好带动游戏市场？这几份报告带你了解行业现状

2023-01-31
热点！在元气森林，是如何开会的？

2023-01-31
手握300亿票房的吴京，能带火这款国民老汽水吗？

2023-01-31
春节档最花钱的，不是电影票

2023-01-31
速看：“春节不长胖”，成了一门生意

2023-01-31
即时：白酒终端销售回暖行业长期向好趋势不变

2023-01-31
世界微速讯：粤海置地预期2022年归母溢利不多于4.5亿按年减少9.5亿元

2023-01-30
蔚来车名侵权奥迪被德国判罚180万；《流浪地球2》周边众筹破亿……

2023-01-30
【独家】SheIn的“矛”能否戳穿优衣库的“盾”？

2023-01-30
焦点观察：“黑马”上位，这个西南省份终于等到了

2023-01-30
每日热门：安徽科技学院一年学费多少钱附各专业的收费标准_2023年参考

2023-01-30
环球快讯:为啥小企业做不好短视频营销？

2023-01-30
天天信息:昂贵的围炉煮茶，是咖啡店的终极对手？

2023-01-30
每日时讯!产业链迎IPO热潮：新能源汽车的供应商们冲刺上市，谁最赚钱？

2023-01-30
天天热讯:融资丨「考拉悠然」完成近亿元A轮融资，四川发展、蜀杉资本、策源资本共同投资

2023-01-30
【全球新要闻】“精致抠们”一年掏千亿元，钱被“缺德舅”赚了？

2023-01-30
环球快资讯丨雷军发布内部信：宣布新成立两个委员会，雷军亲自任委员会主任

2023-01-30
融资丨「图漾科技」完成C轮融资，国开制造业转型升级基金领投

2023-01-30
环球即时：【撸起袖子加油干风雨无阻向前行】河北：项目动起来，冰雪热起来，早春抢出来！

2023-01-30
每日速递：一位年轻Crypto VC的寒冬展望：22的起伏与23的晨光

2023-01-30
每日播报!微信公布春节数据：红包发送超40亿次，线下商业支付交易量同比增23%

2023-01-30
【天天热闻】XR迈向10亿级必须解决的3个问题

2023-01-30
每日速看!科大讯飞发布发布2022年度业绩预告，营收、毛利小幅增长

2023-01-30
全球要闻：61岁程序员被迫线上求职，谷歌解雇高职位员工，开源专家也被炒

2023-01-30
每日看点!科普 | 常听说以太坊Layer2很重要，Layer0、Layer1、Layer3又是什么？

2023-01-30
天天热消息：融资丨「可可满分」完成数千万元A+轮融资，嘉美包装独家投资

2023-01-30
世界看热讯：融资丨「IM-BODY」完成新一轮1500万元融资，三碁电气、易建联及老股东共同投资

2023-01-30
焦点信息:融资丨「订阅蜂」完成近千万天使轮融资，红树叶资本领投

2023-01-30
每日快看：Google：我能把文本变成音乐，但这个 AI 模型不能对外发布！

2023-01-30
天天报道:何为夫妻宫伏吟八字夫妻宫伏吟看婚姻

2023-01-30
RPA是否已过时？“RPA+什么”才能变得更强？

2023-01-30
上瘾：让用户养成使用习惯的四大产品逻辑

2023-01-30
环球今头条！融资丨「赣锋锂电」完成新一轮融资，国投招商等投资

2023-01-30
环球新消息丨请回答2023，容联云能否反弹？

2023-01-30
全球时讯：雄安新区产业互联网平台如何助力企业发展？

2023-01-30
电脑上的临时文件在哪里找？手机的临时文件在哪个文件夹？

2023-01-30
电脑时间同步怎么设置？电脑在哪设置时间同步？

2023-01-30
电脑找不到网络路径是什么原因？如何更改共享网络路径？

2023-01-30
字体安装详细步骤是什么？cad钢筋字体怎么替换？

2023-01-30
文件修复不了怎么处理？文件存取错误怎么解决？

2023-01-30
appdata文件夹可以删不？appdata文件夹占用空间太多怎么办？

2023-01-30
win8磁盘占用率100什么原因？win8磁盘占用率100%解决方法是什么？

2023-01-30
世界滚动:融资丨「上海碳际」完成数千万元A轮融资，武岳峰资本独家投资

2023-01-30
win7怎么安装蓝牙驱动？如何安装笔记本摄像头驱动？

2023-01-30
【全球时快讯】融资丨「庭宇科技」完成A1及A2轮近亿元融资，基石创投领投

2023-01-30
无法定位程序输入点修复？无法定位于动态链接库的原因是什么？

2023-01-30
融资丨「华鹊景医疗」完成数千万元A轮融资，深创投独家投资

2023-01-30
天天快看点丨广电“搅局”，专属APP会不会成运营商争夺的下一块“蛋糕”

2023-01-30
浅谈NFT项目和公链生态的关系

2023-01-30
天天快播：Hashrate Index：介绍瑞典比特币挖矿业

2023-01-30
世界热议:云游戏的证道之路，还在继续？

2023-01-30
今日精选：6企业入选高耗能行业能效“领跑者”

2023-01-30
【全球新要闻】云盘在云端，互相摸着对方过河，运营看资源！

2023-01-30
微信表情怎么批量加？微信如何给表情加小辫子？

2023-01-30
全球播报:融资丨「雅客云」完成超千万元Pre-A轮融资，奇绩创坛、盈富泰克投资

2023-01-30
世界新资讯：融资丨「左旋星生物」完成Pre-A轮融资，经纬创投独家投资

2023-01-30
动态焦点:腾讯最大股东Naspers宣布将裁员30%

2023-01-30
技术洞察 | 今天你被“算法”了吗？

2023-01-30
天天日报丨春节中的富士康城中村，被20多盏灯光点亮

2023-01-30
世界快资讯：席梦思被投资者当球踢

2023-01-30
东北版“深夜食堂”，多少明星抢着来

2023-01-30
【世界播资讯】抖音超市，打了个哑炮

2023-01-30
热推荐：“春节不长胖”，掏空谁钱包？

2023-01-30
残酷春节档：68 亿、「屠龙少年」与互黑大战

2023-01-30
每日看点！微软押注、亚马逊翻牌，ChatGPT却要被“黑客”玩坏了？

2023-01-30
环球速读：这届年轻人，在焦虑中过春节

2023-01-30
中信建投：春季行情下半场估计以多线索轮动为主要特征

2023-01-30
当前最新：《蛋仔派对》爆火之后，我看到了国内游戏社区的更高阶形态

2023-01-29
快看：6款比肉还香的炸丸子,建议列入年夜饭菜单,外酥里嫩鲜香味美

2023-01-29
环球视点！美国将有960万移动企业家！边旅行边创业，要做好这五个准备

2023-01-29
天天简讯:别瞎忙了，经营餐厅必须关注这9个重要数据

2023-01-29
等号4000桌，排队到凌晨，苦熬3年，餐饮人终迎“肥年”

2023-01-29
融资丨「礼多多盲盒」完成5700万美元融资，FOXZZ INVESTMENT和多家风投机构投资

2023-01-29
世界视讯！上市公司年收68亿，保龄球触底反弹？

2023-01-29
环球新消息丨观潮周报：春节档总票房近68亿；抖音超市上线加码全域兴趣电商

2023-01-29
Cobo 神鱼：2023 寻找新的叙事逻辑

2023-01-29
每日速读!奥园美谷：预计2022年全年扣除后营业收入:140,000万元至170,000万元

2023-01-29
焦点消息！脑机接口技术又有突破性进展马斯克合伙人研制大脑“第七层”

2023-01-29
世界即时看！3天裁员4万，微软、亚马逊、谷歌全球性消肿，苹果呢？

2023-01-29
消息！微软CTO Kevin Scott：人工智能的未来之路

2023-01-29
每日视点！企业需为网络安全做哪些准备？

2023-01-29
天天速讯：中国元宇宙四大独角兽，都是什么来头？

2023-01-29
党建联盟聚合力，共绘暖‘新’同心圆——苏宿工业园区开展新春走基层活动

2023-01-29
如何查看win10主板？如何查看电脑主板型号？

2023-01-29
什么浏览器最好用速度最快？电脑用什么浏览器最好？

2023-01-29
金山云拟赴港双重上市第三季度净亏损超8亿元

2023-01-29
怎么打开隔空投送？隔空投送文件存哪里？

2023-01-29
当前快看：未来五年，人类和数字化劳动力混合的员工队伍将变得非常普遍

2023-01-29
cad标注全部快捷键命令？cad圆心标注快捷键？

2023-01-29
电脑麦克风没声音怎么办？台式电脑麦克风声音小怎么办？

2023-01-29
小红书里的年轻人，不想再被骗了

2023-01-29
地下城可以申请转区吗？dnf在哪申请转区？

2023-01-29