每日视讯：谷歌AI生成视频两连发：720p高清+长镜头，网友：对短视频行业冲击太大_中国智能在线

内容生成AI进入视频时代！

Meta发布「用嘴做视频」仅一周，谷歌CEO劈柴哥接连派出两名选手上场竞争。

第一位 Imagen Video 与Meta的Make-A-Video相比突出一个高清，能生成1280*768分辨率、每秒24帧的视频片段。

(资料图片)

另一位选手 Phenaki ，则能根据200个词左右的提示语生成 2分钟以上的长镜头，讲述一个完整的故事。

网友看过后表示，这一切进展实在太快了。

也有网友认为，这种技术一旦成熟，会冲击短视频行业。

那么，两个AI具体有什么能力和特点，我们分别来看。

Imagen Video：理解艺术风格与3D结构

Imagen Video同样基于最近大火的扩散模型，直接继承自5月份的图像生成SOTA模型Imagen。

除了分辨率高以外，还展示出三种特别能力。

首先它能理解并生成不同艺术风格的作品，如“水彩画”或者“像素画”，或者直接“梵高风格”。

它还能理解物体的3D结构，在旋转展示中不会变形。

最后它还继承了Imagen准确描绘文字的能力，在此基础上仅靠简单描述产生各种创意动画，

这效果，直接当成一个视频的片头不过分吧？

除了应用效果出色以外，研究人员表示其中用到的一些优化技巧不光对视频生成有效，可以泛化至一般扩散模型。

具体来说，Imagen Video是一系列模型的集合。

语言模型部分是谷歌自家的 T5-XXL ，训练好后冻结住文本编码器部分。

与负责从文本特征映射到图像特征的CLIP相比，有一个关键不同：

语言模型只负责编码文本特征，把文本到图像转换的工作丢给了后面的视频扩散模型。

基础模型，在生成图像的基础上以自回归方式不断预测下一帧，首先生成一个48*24、每秒3帧的视频。

接下来，一系列空间超分辨率（Spatial Super-Resolution）与时间超分辨率（Temporal Super-Resolution）模型接连对视频做扩展处理。

所有7种扩散模型都使用了 v-prediction parameterization 方法，与传统方法相比在视频场景中可以避免颜色偏移。

这种方法扩展到一般扩散模型，还使样本质量指标的收敛速度更快。

此外还有渐进式蒸馏（Progressive Distillation），将每次迭代所需的采样步骤减半，大大节省显存消耗。

这些优化技巧加起来，终于使生成高清视频成为可能。

Phenaki：人人都能是“导演”

Phenaki的论文投了ICLR 2023会议，在一周前Meta发布Make-a-video的时候还是匿名双盲评审状态。

如今信息公开，原来研究团队同样来自谷歌。

在公开的信息中，Phenaki展示了它交互生成视频的能力，可以任意切换视频的整体风格：高清视频/卡通，还能够切换任意场景。

还可以向Phenaki输入一个初始帧以及一个提示，便能生成一段视频。

这都还是开胃小菜，Phenaki真正的大招是：讲故事，它能够生成2分钟以上的长视频，通过输入长达200多个字符的系列提示来得到。

（那有了这个模型，岂不是人人都能当导演了？手动狗头）

从文本提示到视频，计算成本高、高质量文本视频数据数量有限以及视频长度可变一直以来都是此类模型发展的难题。

以往的大多数AI模型都是通过单一的提示来生成视频，但若要生成一个长时间并且连贯的视频这远远不够。

而Phenaki则能生成2分钟以上的视频，并且还具备故事情节，这主要归功于它能够根据一系列的提示来生成视频的能力。

具体来说，研究人员引入了一个新的因果模型来学习表示视频：将视频视作图像的一个时间序列。

这个模型基于transformer，可以将视频分解成离散的小表示，而分解视频则是按照时间的因果顺序来进行的。

再讲通俗一点，就是通过空间transformer将单个提示进行编码，随后再用因果transformer将多个编码好的提示串联起来。

一个提示生成一段视频，这样一来，视频序列便可以沿着提示中描述的时间序列将整个“故事”串在一起。

因为将视频压缩为离散的图像序列，这样也大大减少了AI处理标记视频的数量，在一定程度上降低了模型的训练成本。

提到模型训练，和大型图像系统一样，Phenaki也主要使用文本-图像数据进行训练，此外，研究人员还用1.4秒，帧率8FPS的短视频文本对Phenaki进行训练。

仅仅通过对大量图像文本对以及少量视频文本例子进行联合训练，便能达到突破视频数据集的效果。

Imagen Video和Phenaki，谷歌接连放出大招，从文本到视频的AI发展势头迅猛。

值得一提的是，Imagen Video一作表示，两个团队将合作进行下一步研究。

嗯，有的网友已经等不及了。

One More Thing

出于安全和伦理的考虑，谷歌暂时不会发布两个视频生成模型的代码或Demo。

不过既然发了论文，出现开源复刻版本也只是时间问题。

毕竟当初Imagen论文出来没几个月，GitHub上就出现了Pytorch版本。

另外Stable Diffusion背后的StabilityAI创始人兼CEO也说过，将发布比Meta的Make-A-Video更好的模型，而且是大家都能用上的那种。

当然，每次AI有了新进展后都会不可避免地碰到那个话题——AI会不会取代人类。

目前来说，一位影视行业的工作者表示还不到时候：

老实说，作为一个在电影行业工作了十年的人，这个话题令人沮丧。

在他看来，当前的视频生成AI在外行看起来已经足够惊艳，不过业内人士会认为AI还缺乏对每一个镜头的精细控制。

对于这个话题，StabilityAI新任首席信息官Daniel Jeffries此前撰文表示，AI最终会带来更多的工作岗位。

如相机的发明虽然取代了大部分肖像画家，但也创造了摄影师，还开辟了电影和电视这样的全新产业。

5年后再回看的话，反对AI就像现在反对Photoshop一样奇怪，AI只不过是另一个工具。

Jeffries称未来是环境人工智能（Ambient AI）的时代，各个行业、各个领域都会在人工智能的加持下进行发展。

不过现在我们需要的是一个更开放的人工智能环境，也就是说：开源！

最后，如果你现在就想玩一下AI生成视频的话，可以先到HuggingFace上试试清华与智源实验室的Cogvideo。

推荐内容

每日视讯：谷歌AI生成视频两连发：720p高清+长镜头，网友：对短视频行业冲击太大

2022-10-08
世界新消息丨绿软女，打开05后的隐秘世界

2022-10-08
世界热门:硬刚Meta，字节开辟“第二战场”

2022-09-30
速递！飞天云动港股IPO：“打新”元宇宙第一股的时机到了

2022-09-30
当前热议!中国城市人工智能创新指数2022：东部城市领跑，一超多强格局凸显

2022-09-30
环球新动态：实体企业-数字化转型【中弘美谷】赋能陪跑计划正式启动

2022-09-30
【全球热闻】陌生社交“博弈论”

2022-09-30
今日视点：完整录音·科创人数智思维私董会第6期：历久弥新的系统论、控制论与信息论| 活动回顾

2022-09-30
当前看点!接棒智能手机，VR行业还差几步？

2022-09-30
全球微资讯！上海广电：年前完成大规模广电700MHz基站建设

2022-09-30
当前时讯：省网内卷？各地广电5G套餐资费一览

2022-09-30
天天实时：互联网大厂：现金越多越焦虑

2022-09-30
环球精选！NFT 版税争议之我见：该不该付？付给谁?

2022-09-30
每日播报!干掉「标题党」，清华团队又一开源力作！

2022-09-30
全球观察：蔚领时代再获4000万美元投资，从云游戏到云渲染

2022-09-30
全球热点！PICO 4新品亮相，VR设备在内容生态上走了多远？

2022-09-30
全球要闻：当下企业数字化转型，PaaS是基础解

2022-09-29
环球百事通！数智领航，百融云创携手金融机构打造行业“天幕”

2022-09-29
【焦点热闻】你的密码体系合规吗？用这些方法检查下吧

2022-09-29
天天观点：字节跳动又做了一个独立站，这次能抢到SHEIN蛋糕吗？

2022-09-29
要闻速递：门户三剑客，搜狐的24年精彩发展史

2022-09-29
天天观点：小红书的上市“迷途”

2022-09-29
当前热点-AmazeVR获1700万美元B轮融资、Nreal Air在美国上市，售价379美元

2022-09-29
每日关注!全国唯一以“时空大数据”命名研究机构，与联通战略合作！

2022-09-29
当前快看：一块GPU，每秒20个模型！英伟达新玩具用GET3D造元宇宙

2022-09-29
每日热讯!Web3 过冬，有哪些能超越周期的落地产品？

2022-09-29
环球热头条丨你被字节跳动的PICO刷屏了吗？

2022-09-29
每日时讯!刘春雄：互联网下半场，非b莫属

2022-09-28
焦点报道:数字原生重构云的“进化论”

2022-09-28
【世界播资讯】联通云：不止步于云端

2022-09-28
今日热搜：5G标准最新演进综述

2022-09-28
环球热点！以简驭繁 | 医疗SaaS企业解决门店收款的秘诀

2022-09-28
【环球聚看点】央视播出 | 十年通信巨变，筑牢数字经济底座！

2022-09-28
焦点速看：5G种地，也是满满黑科技！

2022-09-28
环球快报:数字藏品，是下一个风口？

2022-09-28
世界滚动:95后为何钟情数藏？

2022-09-28
关注：3.6万家“同行”一网互联！瓯海纸包装产业构建“产业互联网+云工厂”新生态

2022-09-28
世界新动态：“总有神助”贾跃亭

2022-09-28
天天微动态丨专家PPT请查收！2022密码应用与创新论坛重磅干货第七弹

2022-09-27
当前时讯：专家PPT请查收！2022密码应用与创新论坛重磅干货第八弹

2022-09-27
全球今日报丨专家PPT请查收！2022密码应用与创新论坛重磅干货第九弹

2022-09-27
焦点精选！光线光缆迎双重利好：运营商采购量价齐升海风招标更有望超预期

2022-09-27
每日动态!付费图库集体封禁AI生成图片，网友躺赚版权费梦碎

2022-09-27
全球短讯！如何看电信运营商竞争中常引入军事化术语？

2022-09-27
今日要闻!中国广电5G全新192号段今日正式商用｜全国31省市全面开通

2022-09-27
环球微资讯！360发布美国国安局网络攻击后续报告为全球提供借鉴范本

2022-09-27
天天热头条丨热度比肩以太坊的Cosmos生态现在发展得怎么样了？（上）

2022-09-27
每日观点：科普| DApp这么火，是手机App的升级版吗？

2022-09-27
当前快报:第四大运营商的APP来了~

2022-09-27
环球热门:神经形态视觉系统发明者Prophesee完成5000万欧元C轮融资，Prosperity7 Ventures、创新工场、小米投资

2022-09-27

世界新消息丨绿软女，打开05后的隐秘世界

2022-10-08
每日视讯：谷歌AI生成视频两连发：720p高清+长镜头，网友：对短视频行业冲击太大

2022-10-08
【天天新视野】特斯拉交付不及预期，蔚小理抓紧驶入「弯道」

2022-10-04
天天即时：羊了个羊火了，抖音的游戏梦近了

2022-10-03
环球微速讯：宠物智能硬件的胜利，是个伪命题？

2022-10-03
世界看点：中国女篮获世界杯亚军，商业价值能跟上吗？

2022-10-03
当前关注：蜜雪冰城“万店天花板”：靠加盟风险外包，37万开店竟不赚钱？

2022-10-03
天天速讯：“新势力”用上劳斯莱斯的高端配置，还把它卷成白菜价

2022-10-03
世界速读：浮沉25年，燕之屋不止困于IPO

2022-10-02
焦点速讯：特斯拉整活，马斯克称Cybertruck能当船用：进水不保修

2022-10-02
【全球时快讯】东方甄选究竟是不是泡沫？

2022-10-02
世界快消息！网易严选入局宠物赛道，但还缺代工厂这块拼图

2022-10-02
滚动：专注电商退货管理，ReturnLogic完成A轮850万美元融资丨海外邦

2022-10-01
全球快播：门店月入30万，不推销、也不办卡的男士理发馆凭什么赚钱？

2022-10-01
最新资讯：中国海鲜第一大省，有多生猛？

2022-10-01
世界热议:蜜雪冰城显形记

2022-10-01
环球速看：谷歌关停Stadia服务，不代表云游戏“此路不通”

2022-10-01
报道：喜剧「难得」，笑果「难为」

2022-10-01
世界热门:硬刚Meta，字节开辟“第二战场”

2022-09-30
速递！飞天云动港股IPO：“打新”元宇宙第一股的时机到了

2022-09-30
【全球热闻】陌生社交“博弈论”

2022-09-30
今日视点：完整录音·科创人数智思维私董会第6期：历久弥新的系统论、控制论与信息论| 活动回顾

2022-09-30
当前看点!接棒智能手机，VR行业还差几步？

2022-09-30
当前热议!中国城市人工智能创新指数2022：东部城市领跑，一超多强格局凸显

2022-09-30
环球新动态：实体企业-数字化转型【中弘美谷】赋能陪跑计划正式启动

2022-09-30
当前快看：融资丨「奇点能源」完成A+轮融资，晨道资本等机构领投

2022-09-30
全球信息:不会做内容，不是好投资人

2022-09-30
世界快消息！五菱宏光，不再为人民造车

2022-09-30
世界速看：融资丨「纽维尔」完成3000万A轮融资，国微集团领投

2022-09-30
苹果股价开盘下跌任泽平9天6篇苹果博文细数苹果问题

2022-09-30
每日播报!干掉「标题党」，清华团队又一开源力作！

2022-09-30
全球微资讯！上海广电：年前完成大规模广电700MHz基站建设

2022-09-30
当前时讯：省网内卷？各地广电5G套餐资费一览

2022-09-30
环球精选！NFT 版税争议之我见：该不该付？付给谁?

2022-09-30
天天实时：互联网大厂：现金越多越焦虑

2022-09-30
世界资讯：旧电动车的二手电池卖疯了：都是房车热、露营热的锅？

2022-09-30
全球观察：蔚领时代再获4000万美元投资，从云游戏到云渲染

2022-09-30
全球热点！PICO 4新品亮相，VR设备在内容生态上走了多远？

2022-09-30
全球热点评！蜜雪冰城逆袭背后：失败和苦难的馈赠

2022-09-30
【世界聚看点】极兔“跳墙”

2022-09-30
环球热资讯！在美国，拼多多对SHEIN希音“砍了一刀”

2022-09-30
世界快讯:市场竞争日益激烈，Netflix的“好日子”到头了吗？

2022-09-30
当前通讯！为什么即使处于下坡路，企业仍需要做股权激励？

2022-09-30
热门：除了瑞幸，这家公司也想跟星巴克一战

2022-09-29
全球要闻：当下企业数字化转型，PaaS是基础解

2022-09-29
微动态丨融资丨「顺友物流」完成数千万元A轮融资，国家服贸基金领投

2022-09-29
热点评！融资丨「MOON GROUND」完成数百万元种子轮融资

2022-09-29
天天观点：字节跳动又做了一个独立站，这次能抢到SHEIN蛋糕吗？

2022-09-29
【焦点热闻】你的密码体系合规吗？用这些方法检查下吧

2022-09-29
环球百事通！数智领航，百融云创携手金融机构打造行业“天幕”

2022-09-29
天天观点：小红书的上市“迷途”

2022-09-29
要闻速递：门户三剑客，搜狐的24年精彩发展史

2022-09-29
每日速讯：“躺赢”的张朝阳手里还剩什么牌

2022-09-29
全球观察：融资丨「你好橙子」完成数百万元天使轮投资，金石资本领投

2022-09-29
天天热文：蕉下应该成为中国版lululemon吗？

2022-09-29
天天关注：万物云漏夜赶考场

2022-09-29
每日快报!字节跳动又做了一个独立站，这次能抢到SHEIN蛋糕吗？

2022-09-29
背靠智驾科技广汽传祺深化L2++量产项目

2022-09-29
测试7500万种分子美用虚拟药物库筛出潜在抗抑郁药

2022-09-29
每日热讯!Web3 过冬，有哪些能超越周期的落地产品？

2022-09-29
每日关注!全国唯一以“时空大数据”命名研究机构，与联通战略合作！

2022-09-29
当前热点-AmazeVR获1700万美元B轮融资、Nreal Air在美国上市，售价379美元

2022-09-29
当前快看：一块GPU，每秒20个模型！英伟达新玩具用GET3D造元宇宙

2022-09-29
环球热头条丨你被字节跳动的PICO刷屏了吗？

2022-09-29
【全球报资讯】蜜雪冰城与杨国福们的「加盟生意」：是蜜糖，也是砒霜

2022-09-29
环球热议:董宇辉之外，更多英语教培老师们如今在干啥？

2022-09-29
【天天播资讯】贾跃亭的“金主们”

2022-09-29
全球观速讯丨咖啡与茶饮的椰子故事，还能讲多久？

2022-09-29
天天通讯！毕业生抢着去银行当“码农”

2022-09-28
环球即时：VR产业需要一台“iPhone 4”

2022-09-28
当前消息！800元击穿DR钻戒的真爱防线

2022-09-28
世界热议:何小鹏、李想的“心病”

2022-09-28
每日时讯!刘春雄：互联网下半场，非b莫属

2022-09-28
今日热搜：5G标准最新演进综述

2022-09-28
焦点报道:数字原生重构云的“进化论”

2022-09-28
【世界播资讯】联通云：不止步于云端

2022-09-28
环球热点！以简驭繁 | 医疗SaaS企业解决门店收款的秘诀

2022-09-28
每日头条!融资丨「开云集致」完成千万元Pre-A轮融资，盈动资本领投

2022-09-28
当前关注：融资丨「亚荣新材」完成数亿元Pre-IPO轮融资，洪泰基金领投

2022-09-28
每日观察!融资丨「桦冠生物」完成亿元以上B轮融资，中关村科学城领投

2022-09-28
焦点速讯：融资丨「Two Sense Coffee」完成百万人民币天使轮融资

2022-09-28
全球速看：融资丨「标新生物」完成Pre-A+轮融资，磐谷创投领投

2022-09-28
取暖费用翻倍欧洲今年冬天格外冷

2022-09-28
永辉新零售模式要盈利模式终于要上岸

2022-09-28
环球快报:数字藏品，是下一个风口？

2022-09-28
关注：3.6万家“同行”一网互联！瓯海纸包装产业构建“产业互联网+云工厂”新生态

2022-09-28
世界滚动:95后为何钟情数藏？

2022-09-28
【环球聚看点】央视播出 | 十年通信巨变，筑牢数字经济底座！

2022-09-28
焦点速看：5G种地，也是满满黑科技！

2022-09-28
世界新动态：“总有神助”贾跃亭

2022-09-28
世界实时：珠宝骗子里，人造钻石还是太年轻了

2022-09-28
全球关注：“雪王”年赚103亿，不靠卖奶茶

2022-09-27
环球头条：融资丨「KPay」完成1000万美元天使轮融资

2022-09-27
天天动态:《东八区》的“黑红”狂欢之后

2022-09-27
【环球热闻】融资丨「凌阳科技」完成A轮数千万人民币融资，海宁纺织领投

2022-09-27
当前简讯:融资丨「全和诚」完成2800万A+轮融资，滨海创投等机构领投

2022-09-27
天天讯息：融资丨「迷诺科技」完成2000万元A轮融资，希达资本领投

2022-09-27
全球短讯！融资丨「楚动科技」完成超千万preA轮融资，脉尊资本领投

2022-09-27
全球今日报丨专家PPT请查收！2022密码应用与创新论坛重磅干货第九弹

2022-09-27
当前时讯：专家PPT请查收！2022密码应用与创新论坛重磅干货第八弹

2022-09-27