2022超超超级火的AIGC是什么？将成Web3.0和元宇宙的内容生产力工具！

AIGC

*什么是AIGC？

(相关资料图)

*科技巨头都在布局

*将成Web3生产力工具

*AIGC为创作领域带来的新的可能性

*AIGC发展所面临的挑战

*来源：嗡嗡设计学院
*版权归原作者所有
*转载内容仅作为学习交流，不作为投资建议

科技新赛道AIGC开始火了。

Contents:

什么是AIGC？ AIGC为创作领域带来的新的可能性 AIGC发展面临的挑战

今年8月份，美国科罗拉多州举办的新兴数字艺术家竞赛中，没有绘画基础的参赛者提交AIGC绘画作品《太空歌剧院》，

结果却获得了比赛“数字艺术/数字修饰照片”类别一等奖，引起业内风波。

AI画作《太空歌剧院》

AIGC领域融资规模快速扩张，甚至已经跑出几家估值超10亿美元的独角兽公司。

10月19日，主打文字生成的AIGC公司Jasper.ai宣布完成1.25亿美元的A轮融资，估值达到15亿美元。

前一日Stability AI宣布获得1.01亿美元，公司宣布会继续研发用于生成图片、语言、音频、视频和3D的AI生成模型，投后估值达10亿美元。

11月15日，百度数字人在快手账号发布一条入驻快手短视频，据悉，百度数字人家族自带“创造力”，通过AIGC智能创作的能力，可作画、作诗、写小说、写歌词等。

什么是AIGC？

AIGC全称为AI-Generated Content，指基于人工智能技术，通过数据寻找规律和适当的泛化能力从而生成内容的技术，内容通常为AI生成的文字、图像、音频等。通俗角度来讲，AIGC其实就是通过AI的智能生成技术将其赋能于各大内容相关行业，从而创造出更多的可能性和创新性作品。被认为是继专业生产内容（PGC）、用户生产内容（UGC）之后的新型内容创作方式。目前主要用在文字、图像、视频、音频、游戏以及虚拟人上等，具体来看：

1）文字创作。

AIGC生成文字目前主要被应用于新闻的撰写、给定格式的撰写以及风格改写。比如用户可以通过输入一段对于目标文章的描述或者要求，系统会自动抓取数据，根据我们描述的指令进行创作。

2）图像创作。

技术平台降低了艺术绘画创作的门槛，用户只需要通过输入文字描述，计算机将会自动生成一张作品。

3）视频创作。

例如Google推出了AI视频生成模型Phenaki能够根据文本内容生成可变时长视频的技术，在公布的DEMO中，Phenaki基于几百个单词组成一段前后逻辑连贯的视频只需两分钟。

4）音频剪辑。

AIGC生成音频早被应用于我们的日常生活当中，比如常用的手机导航中的声音。更深层次的应用将会是虚拟人领域，AIGC不仅可以生成虚拟人的声音，并可以创造出说的内容。

5）游戏开发。

AIGC在游戏当中的应用可分为两方面，一方面用于场景和故事的搭建，另一方面玩家可以通过AIGC的平台工具来创建自己的虚拟人，可以用于游戏中的打金等活动。

6）代码生成。

资料显示，2022年AIGC发展速度惊人，迭代速度更是呈现指数级爆发，其中深度学习模型不断完善、开源模式的推动、大模型探索商业化的可能，成为AIGC发展的“加速度”。

市场空间方面，Gartner预计到2025年，生成式人工智能将占所有生成数据的10%。根据《Generative AI：A Creative New World》的分析，AIGC有潜力产生数万亿美元的经济价值。

科技巨头都在布局

资料显示，国内大厂百度、腾讯优图、阿里巴巴、快手、字节跳动、网易、商汤、美图等都在AIGC领域有所投入。

11月9日，百度创始人兼首席执行官李彦宏表示，过去一年无论是在技术层面还是商业应用层面，人工智能都有了巨大的进展，有些甚至是方向性的改变。其中人工智能技术方向性改变体现就是AIGC。

李彦宏判断AIGC将迎来三个发展阶段： “助手阶段”，AIGC辅助人类进行内容生产；“协作阶段”，AIGC以虚实并存的虚拟人形态出现，形成人机共生的局面；“原创阶段”，AIGC将独立完成内容创作。

其他国内公司中，腾讯打造的写稿机器人“梦幻写手”；阿里巴巴旗下的AI在线设计平台Lubanner，帮助营销人员生产Banner；字节跳动旗下的剪映以及快手云剪都能提供AI生成视频；网易推出的一站式AI音乐创作平台“网易天音”等等。

国外在AIGC领域更是神仙打架。

既有科技巨头谷歌、Meta、微软等，也不乏AIGC的新晋独角兽Stability AI、Jasper、OpenAI等，并且科技公司很快又将AI作画的热度延续到了AI生成视频。从Meta宣布由文本到视频的系统Make-A-Video，到谷歌宣布的可以从简单的文本提示中生成高清视频的Imagen Video和Phenaki，AIGC在海外迅速发展。

将成Web3.0和元宇宙的生产力工具

AIGC将是Web3时代的生产力工具。

其指出，从Web 1.0的单向信息传递的“只读”模式到Web 2.0的人与人通过网络双向沟通交流的“交互”模式，内容的需求在不断增加。为满足这一需求，内容的生成从单一的PGC演变到了现在的UGC并占据了主要市场。Youtube、Instagram、抖音、快手、B站上有大量的内容来自于UGC创作者。

而当我们迈入Web3.0时代，人工智能、关联数据和语义网络构建，形成人与网络的全新链接，内容消费需求飞速增长，UGCPGC这样的内容生成方式将难以匹配扩张的需求。

而 AIGC将是新的元宇宙内容生成解决方案，AIGC的生成利用人工智能学习知识图谱、自动生成，在内容的创作为人类提供协助或是完全由AI产生内容，不仅能帮助提高内容生成的效率，还能提高内容的多样性。

随着NLP（Natural Language Processing，自然语言处理）技术和扩散模型（Diffusion Model）的发展，AI不再仅作为内容创造的辅助工具，创造生成内容成为了可能。由此，将来文字生成、图片绘制、视频剪辑、游戏内容生成皆可由AI替代。

AIGC为创作领域带来的新的可能性

（一） AIGC工具属性有助于效率提升

在捕捉灵感方面，AIGC可以帮助有经验的创作者捕捉灵感，创新互动形式。例如在游戏行业，制作人灵感往往难以准确表达，与美术工作人员经常由于沟通产生理解误差。通过AIGC系统可以在设计初期，生成大量草图，在此基础上制作人与美术人员可以更好的理解并确认彼此的需求。同时，创作灵感难以琢磨，可以提前通过AIGC来寻找“感觉”，进一步降低美术创作者大量前期工作和项目成本。例如，制作人先构建完整的背景故事后，由AIGC生成系列画作，之后再由专业的美术人员进行筛选、处理、整合，并将整个故事和画面进一步完善提升。

在提升效率方面，AIGC的出现将会让创作者拥有一个更加高效的智能创作工具，在内容创作环节进行优化，而非成为竞争对手。例如在极短的项目筹备时间内，AIGC可以大幅提升效率，验证了AI投入到工业化使用的可行性。尤其是对于艺术、影视、广告、游戏、编程等创意行业的从业者来说，可以辅助从业者进行日常工作，并有望创造出更多惊艳的作品。同时，还可以进一步降低成本和效率，为规模化生产构建市场增量。

（二） AIGC构建创意与实现的分离

在创意构思方面，AIGC构建了新的创意完善通路，传统的创作过程中消化、理解以及重复性工作将有望交由AIGC来完成，最终创意过程将变为“创意-AI-创意”的模式。

在创意实现方面，创作者和AIGC的关系类似于摄影师和照相机。摄影师构建拍摄思路并进行规划，对相机进行参数配置，但是不用了解相机的工作机制，一键生成高质量的内容。同样的，创作者构思并进行规划，对AI模型进行参数配置，不需要了解模型的原理，直接点击输出内容即可。创意和实现呈现出分离状态，实现过程变为一种可重复劳动，可以由AIGC来完成，并逐步将成本推向趋近于0。

（三） AIGC给创作者获得更多收益带来思路创新

创作者的成果是AIGC学习的对象，但创作者的创意才是关键，创意本身比AIGC生成的绘画更有价值，因此如何将创作者的“创意”进行量化，甚至定价，将有助于打造AIGC的商业模式。这其中“注意力机制”将成为AIGC潜在的量化载体。例如国内有机构专家提出，可以通过计算输入文本中关键词影响的绘画面积和强度，我们就可以量化各个关键词的贡献度。之后根据一次生成费用与艺术家贡献比例，就可以得到创作者生成的价值。最后在与平台按比例分成，就是创作者理论上因贡献创意产生的收益。

例如某AIGC平台一周内生成数十万张作品，涉及这位创作者关键词的作品有30000张，平均每张贡献度为0.3，每张AIGC绘画成本为0.5元，平台分成30%，那么这位创作者本周在该平台的收益为：30000*0.3*0.5*（1-30%）=3150元的收益，未来参与建立AI数据集将有望成为艺术家的新增收益。

（四）从“大模型”到“大应用”，探索可行商业模式

基于深度学习算法数据越多，模型鲁棒性越强的特点，当前的大模型规模只增不减，比拼规模已经成为标配。例如，Open AI推出的GPT-3参数已经超过1750亿个。但“数据投喂”并非一种技术路径上的创新，更多的是在工程领域的微调。需要指出的是，模型规模越大，其实越难以在现实场景中落地部署。同时“海量数据”并不等同于“海量高质量数据”，有可能会导致反向效果产生。

AIGC的发展离不开预训练大模型的不断精进。大模型虽然在很多领域都表现出良好的使用效果，但是这些效果作为展示甚至噱头之后，很难形成良性的商业价值，与大模型的训练成本、基础设施投入更是相差甚远。如何推动“大模型”向“大应用”来转变，正在成为关键的考验。AIGC的破圈以及引发的关注，可以看到大模型商业化的潜力正在清晰化：一方面大模型企业可以根据C端用户实际“按需提供服务”和商业转化；另一方面带动对云计算、云存储的使用量上升。将AIGC从“尝鲜试试看”变成大众频繁使用的需求，再到与具体行业和领域深度结合，依托我国丰富的产业需求和应用场景，有望为大模型商业化和长期价值探索一条新路径。

AIGC发展所面临的挑战

Gartner预计，到2025年，生成式人工智能将占所有生成数据的10%。根据《Generative AI ：A Creative New World》的分析，AIGC有潜力产生数万亿美元的经济价值。AIGC在引发全球关注的同时，知识产权、技术伦理将面临诸多挑战和风险。同时AIGC距离通用人工智能还有较大的差距。

（一） AIGC引发“创造力”归属争论

传统印象中，人工智能在创造性工作领域与人类还无法进行竞争，主要擅长的是计算、挖掘，聚焦在海量数据分析领域。人类更擅长的是创新，例如诗词、设计、编程等需要创造性的事物上。与AI下棋相比，AI进行绘画创作给大众带来的冲击更为明显：棋类游戏具有明确的规则和定义，不需要AI具备创造性，但AIGC尤其是输入文字就能进行绘画、视频，让没有相关专业能力的人也可以制作出以假乱真的专业级别作品，则引发人们对自身引以为傲的“创造力”担忧。AI不会替代创作者，但是可能会替代不会AI工具的创作者。

（二）知识产权引发创作者担忧

由于算法模型的进一步完善和成本快速下降，AIGC大规模商业化成为现实，过去遥不可及的专业能力已经具备从实验室飞入寻常百姓家的可能。与此同时，AIGC的飞速发展和商业化应用，除了对创作者造成冲击外，也对大量依靠版权为主要营收的企业带来冲击。具体来看：

一方面，AIGC难以被称为“作者”。根据我国《著作权法》的规定，作者只能是自然人、法人或非法人组织，很显然AIGC不是被法律所认可的权利主体，因此不能成为著作权的主体。但AIGC应用对生成的图片版权问题持有不同观点，图片属于平台、完全开源还是生成者，目前尚未形成统一意见。

另一方面，AIGC产生的“作品”尚存争议。根据我国《著作权法》和《著作权法实施条例》的规定，作品是指文学、艺术和科学领域内具有独创性并能以某种有形形式复制的智力成果。AIGC的作品具有较强的随机性和算法主导性，能够准确证明AIGC作品侵权的可能性较低。同时，AIGC是否具有独创性目前难以一概而论，个案差异较大。

由于创作者每次新的创作都在无形中对AIGC进行免费培训，这让众多版权机构产生巨大担忧。目前已经有大量艺术家和创作者宣布禁止AI学习自己的作品，从而保护自身知识产权。Getty Images、Newgrounds等网站也纷纷宣布禁止上传和销售AIGC作品。

（三）距离通用人工智能还有较大差距

当前热门的AIGC系统虽然能够快速生成图像，但是这些系统是否能够真正理解绘画的含义，从而能够根据这些含义进行推力并决策，仍是未知数。

一方面，AIGC系统对输入的文本和产生的图像不能完全关联起来。例如，用户对AIGC系统进行测试，输入“骑着马的宇航员”和“骑着宇航员的马”内容时，相关AIGC系统难以准确生成对应的图像。因此，当前的AIGC系统还并没有深刻理解输入文本和输出图像之间的关系。另一方面，AIGC系统难以了解生成图像背后的世界。了解图像背后的世界，是判断AIGC是否具备通用人工智能的关键。目前来看，AIGC系统还难以达到相关的要求。比如，在Stable Diffusion 输入“画一个人，并把拿东西的部分变成紫色”，在接下来的九次测试过程中，只有一次成功完成，但准确性还不高。显然，Stable Diffusion 并不理解人的双手是什么。

知名AI专家发出的调查也印证了同样的观点，有86.1%的人认为当前的AIGC系统对世界理解的并不多。持相同观点的人还包括Stable Diffusion的首席执行官。

（四）创作伦理问题尚未有效解决

部分开源的AIGC项目，对生成的图像监管程度较低。一方面，部分数据集系统利用私人用户照片进行AI训练，侵权人像图片进行训练的现象屡禁不止。这些数据集正式AIGC等图片生成模型的训练集之一。例如，部分数据集在网络上抓取了大量病人就医照片进行训练，且没有做任何打码模糊处理，对用户隐私保护堪忧。另一方面，一些用户利用AIGC生成虚假名人照片等违禁图片，甚至会制作出暴力和性有关的画作，LAION-5B数据库包含色情、种族、恶意等内容，目前海外已经出现基于Stable Diffusion模型的色情图片生成网站。

由于AI本身还不具备价值判断能力，为此一些平台已经开始进行伦理方面的限制和干预。例如DALL·E2已经开始加强干预，减少性别偏见的产生、防止训练模型生成逼真的个人面孔等。但相关法律法规的空白和AIGC应用研发者本身的不重视将引发对AI创作伦理的担忧。