百度智能云即将推出超写实实数字人直播平台 “曦灵”。


(资料图)

这个数字人平台究竟如何?又能够给直播行业带来怎样的变化?近日,这个话题在直播带货、营销、娱乐、游戏等领域引发了人们的热议。

一、需求日益增长的数字人

据百度方面透露的信息,即将面世的AI数字人,准确地说应该称为“直播平台内置超高精数字人”。这是一款能够对真人说话时肌肉动态、甚至口型表情进行逼真模拟的数字人。它不但能够支持用户指定的任意妆容、发型、服装和场景,而且还能以“真情实感”进行24小时不间断的直播,为直播行业带来了梦寐以求的“无人值守、全年无休、超清写实”业务能力。

直播行业对此的高度关注,源于日益庞大的市场需求。根据IDC近期 发布的《中国 AI 数字人市场现状与机会分析,2022》报告(以下简称“报告”)显示,我国经济社会各层面对智能数字人的应用需求,都在呈现出快速增长的趋势。

在产业界,为了高质量完成日益繁重的客户服务工作,越来越多企业正在转向AI数字人平台,来提升生产力和创造力,并未用户带来更好的体验;在品牌营销领域,连续工作、“任劳任怨”,同时又不会因为私人生活导致风险的数字人,正在成为最佳的虚拟形象代言人;在银行、公共事业、以及公益服务领域里,AI数字人创造的价值越来越高;而各种娱乐、游戏、带货直播行业里,AI数字人更是不断开辟新玩法,成为业务增长的关键驱动力之一。按照IDC的分析预测,在日益成熟的技术、政策面的激励、以及资本支出的支撑下,我国AI 数字人市场规模正在加速扩张,到2026年极有可能突破百亿。

庞大的市场需求,也反过来促使更多科技企业,不断加大对AI数字人相关技术的研发投入以及产品迭代更新。当前,各大平台都在推出自家版本的AI数字人,积极布局抢占先机。按照IDC的调查研究,我国各行业对AI数字人的应用水平,正在逐步提高。数字人在具体业务应用中,按照自主决策能力和操作精细度,可以划分为L1到L5等5各等级。而多数行业正在使用的数字人,虽然已经可以执行简单决策、并进行较为精准的操作,但在肢体运动、身体姿态、说话口型、表情表达等重要方面,依然存在对算法的过度依赖,难以进行自主决策的问题,因此多数都只能达到L1到L3水准,距离L4-5级别要求的智能化交互能力,还存在一定差距。

而百度推出的AI数字人,却在语音识别、口型、形体、情绪表达等方面均已远远超过行业平均水平。例如,百度智能云的曦灵数字人平台,就在AI 的全栈能力的支撑下,不但具备了高度模拟真人的面部表情、形体表达、语音表述、回答内容、肢体反应、情绪反馈能力,而且由于搭载了百度先进的搭载 SMLTA 语音大模型,使得其语音识别能力做到了98%的准确率。更加引起行业关注的是,该平台在百亿参数对话模型PLATO、以及AIGC 系统的帮助下,还能够与用户进行有情感、趣味的对话,甚至还能作画、作诗、写小说等高智能的创作,成为与用户进行模拟真人交互的不可或缺的平台。

显然,百度智能云在AI数字人相关技术上,已经取得了用户体验、AI能力两大维度上的超前。IDC在报告中将百度智能云评价为,有能力率先推出L4-L5级水平AI数字人的“第一梯队”厂商。

二、快速发展的数字人,已在多个领域大放异彩

事实上,虚拟数字人概念在我国的引入,早在上世纪80年代就已开始。然而由于AI数字技术水平尚不高、以及市场需求和应用规模不足等因素的限制,一直没有得到充足的发展。进入新世纪后,尤其是在2017年至今的近5年里,其应用在技术和市场需求两方面快速发展的趋势下,正在呈现出井喷式的上升势头。一方面,我国科技产业界在大数据、云计算、AI技术等方面的水平,随着互联网技术的发展快速提升,尤其是在深度学习等方面的研发成果支撑下,各企业推出的数字人平台已经能够逐渐满足业务需求;另一方面,随着数字经济的发展,我国已经拥有了4亿以上的“二次元”、“泛二次元”用户,消费者普遍对由虚拟AI数字人提供的交互以及客服业务,具备了极高的接受程度。在此背景下,AI数字人的发展开始步入正轨。

当前,随着关键的深度学习技术水平进一步提升,数字人正朝着智能化、便捷化、精细化、多样化发展。首先,当前动画制作、建模的精细化程度与数年前相比,已经有了质的飞跃,这就为数字人形象、发型、表情甚至姿态方面的精细化创造了条件;同时,随着动作捕捉、网络通信等技术的不断进步,数字人还将以更多元化的角色设定、交互方式与用户见面;更重要的是,随着虚拟技术、AI人工智能技术研发的深入,数字人的业务能力正在变得更加多样化,已经能够担负起为人们提供各种对外连接、沟通、交互功能,成为普通用户与外界沟通的大众技术。以百度智能云为代表的各大科技平台,也在不断加大投入,引领数字人领域及其相关技术进入快速成长期。

近年来数字人大发展带来的成果,就是以虚拟主播、虚拟员工等为代表的数字人成功进入了大众视野。这方面最令普通民众印象深刻的,就是今年北京冬奥会期间,以知名运动员谷爱凌仿真面貌出现在演播室里的数字人Meet GU了。事实上,大众熟悉的本届冬奥会气象主播冯小殊、以及冬奥AI手语数智人聆语等,也与Meet GU一样,都是由AI技术生成的数字人!显然,数字人已经在以多元的姿态,出现在了众多领域,用生动的形象、智能化的交互与服务能力大放异彩。

除了这些万众瞩目的焦点“人物”外,数字人也已经进入了与普通大众息息相关的企业和服务行业中。例如,在金融、运营商、数字展厅,以及影视、游戏、传媒、文旅等领域,人们已经能够越来越多地看到银行数字员工、虚拟偶像、虚拟主播等承担服务型角色的数字人。这其中一个典型范例,就是浦发银行联手百度智能云打造的首个银行“数字员工”小浦。这位数字人“员工”,每个月都在以充满感情和智能的方式,为46万人提供更有温度的金融服务;而在演艺和体育直播领域,百度智能云曦灵打造的 AI 手语主播,已经为2700万听障用户提供直播及赛事的手语服务,帮助特殊人群享受普惠 AI 的科技红利。实践证明,AI数字人的应用,已经成为各个领域里企业的重要的布局措施,也是品牌营销和客户服务不容忽视的技术方向。

三、百度智能云数字人凭什么领跑中国AI数字人?

从市场的反应来看,百度智能云即将推出的超写实实数字人直播平台 “曦灵”,已经被多个行业用户视作行业标杆和高水平应用的保障。曦灵是百度智能云于2021年底推出的智能数字人平台,具备即插即用、24小时不间断服务、AI智能化水平高、交互自然等优点。它是一套集数字人生产、内容创作、业务配置服务为一体的平台级产品,为广电、互娱、金融、政务、运营商、零售等行业提供一站式的虚拟主持人、虚拟员工、虚拟偶像、品牌代言人的创建与运营服务。

以曦灵去年就已经推出的“曦灵-AI手语平台”数字人为例,它能够实现线上小时级部署。而且包括了V3全离线一体机和P3端云结合一体机,在线下环境也可插电即用。在百度SMLTA语音识别算法模型的加持下,该平台能够准确识别语音数据,手语翻译识别准确率达到98%。它通过数字人驱动引擎,将人像渲染、动作引擎、口型驱动、表情驱动联动运行,还为手语表现专门设计动作融合算法,带来更接近真人手语表达的连贯表现。真正做到了听得清、翻得准、产出快、线上线下环境适应性好、用户互动自然高效。而曦灵即将推出的“顶配级”数字人,已经将应用场景定位在直播带货,企业营销,以及娱乐主播方向上,将以更拟真的交互体验,为行业带来更高的新客户转化、和留存率等,极受期待。

事实上,百度智能云在AI数字人领域,不但以强大的AI能力让用户放心,更以领先的市场与生态能力赢得了各行业的信任。百度智能云自身已打造20余位数字人,在各个领域里落地,并发挥着沟通用户、智能交互的重要作用。例如,今年全国高考语文考试结束后,百度智能云打造的AI数字人度晓晓,就化身高考数字人助理,直播写作全国新高考Ⅰ卷题为《本手、妙手、俗手》的议论文,仅用1秒即完成了普通学生50分钟才能写出的作文,而且词汇量广博、知识结构和组词造句能力令人印象深刻,作文紧扣主题,中心突出,引发网络热议。

除此以外,根据官方信息显示,目前百度智能云曦灵已经拥有几十家客户,包括今年冬奥会央视总台的实时播报手语主播,与国家航天局合作的火星车数字人祝融号,以及国内首个文博虚拟宣推官“文夭夭”等,都基于该平台进行设计、研发、集成和应用。展现出了强大的商业化应用、以及市场与生态能力。

推荐内容