继ChatGPT横空出世后,市场上关于大模型的讨论只增不减

编者按:本文来自微信公众号连线Insight(ID:lxinsight),作者王慧莹,编辑子夜,创业邦经授权转载。


(资料图片)

如果为4月份的互联网行业取一个关键词,那一定非大模型莫属。

继ChatGPT横空出世后,市场上关于大模型的讨论只增不减。大家都在期待根植于中国市场,更理解中文语义语境的产品长什么样,商业化前景如何。

百度率先给出了答案。3月16日,百度的文心一言如约而至,百度创始人李彦宏亲自演示、解说,展示了文心一言从文学创作、商业文案创作、数理逻辑推算,到中文理解、多模态生成等方面的综合能力。

百度文心一言,图源百度智能云微信公众号

短短一个月,国内加入大模型赛道的巨头如雨后春笋般冒出来,百度、阿里、360、小米……谁都不想错过这一行业变革性的机会。

如今,百度是目前国内最先探索将产品落地的巨头,文心一言已经成了百度的“头号任务”。

4月25日,百度智能云在上海召开文心一言技术交流会,公布了文心一言的“满月”成绩单。

据连线Insight了解,文心一言开启内测一个月以来,已完成4次技术版本升级,大模型推理成本降为原来的十分之一。同时,百度智能云六大产品系列将基于文心一言进行升级。

面对入场费高昂的大模型赛道,做出入局的决定对任何一家企业来说并非易事。百度能第一个站出来,并不断迭代升级,背后靠的是其在AI领域长期的投入和积累。而其他包括阿里在内的玩家,入局和技术提升的速度也不慢。

整个赛道目前呈现出拼速度的局势,不只是拼技术提升的速度,也比拼场景化落地和客户获取的速度。

例如,智能办公市场,阿里、百度等已经开始落地场景的探索,WPS、印象笔记、百度“如流”、钉钉纷纷宣布,要接入AI大模型。

此外,电商、金融,这些目前能让大模型落地的场景已经出现实力强劲的玩家。一直以来,场景化落地是技术行业的永恒命题。繁荣的市场能持续多久,依然要取决于有多少落地应用,亦或是赋能多少企业。

目前来看,各行各业对大模型的需求很强烈,能越早满足客户需求的玩家,能抢到更多蛋糕。当然,这并不只是速度的比拼,而是对入局者整体综合实力的考验。

大模型混战,从拼速度、技术,到拼场景化落地

过去一个月,是国内大模型的混战时刻。

继百度“文心一言”大语言模型率先推出后,阿里推出“通义千问”;腾讯发布面向大模型训练的新一代HCC高性能计算集群;京东、华为、小米的大模型产品也都陆陆续续出现;包括内容平台知乎也推出了中文大模型“知海图AI”;商汤、昆仑万维等科技公司也跑步进场。

另一边,大模型也成为互联网大佬创业第二次创业的热门赛道。

搜狗前CEO王小川成立AI大模型公司“百川智能”、美团联合创始人王慧文的 “光年之外”在A 轮融资后估值已达到10亿美元。

国内大模型赛道越来越热闹,抢到入场券的玩家,已经不满足于推出对话类的大模型产品,而开始加速探索各种落地场景。

百度依然跑在前列。

上个月,推出国内第一款对标ChatGPT的生成式对话产品文心一言后,经过内部不断的测试和升级,在文心一言技术交流会上,基于百度智能云大模型平台,百度开始了多场景化的探索。

一个可以想象、非常适合大模型落地场景是智能办公。

在智能办公领域,百度智能云AI与大数据平台总经理忻舟在客户技术交流会上演示了文心一言制作PPT的内测功能,只需简单提出需求,文心一言就能自动生成内容,设计排版,并可根据要求持续调整优化。未来仅需3分钟就可以做出来一份格式精美、内容丰富的PPT。

忻舟现场演示文心一言制作PPT内测功能

更早之前,阿里的钉钉率先探索了大模型之下的智能办公场景演示。在钉钉2023春季钉峰会上,钉钉宣布正式接入阿里云语言大模型“通义千问”,通过一根“魔法棒”,钉钉提供10余项AI能力,覆盖群聊、文档、视频会议和低代码应用开发等。

字节跳动旗下的飞书则即将上线AI助手“My AI”,可以通过对话形式,帮助用户自动创建日程、搜索公司内部知识库等功能;印象笔记和金山办公,也都描述了AI加持下的办公场景。

一时间,协同办公领域极为热闹,这是最适合大模型落地的场景之一,但并不是大厂们押注的唯一场景。

例如,百度近期还展示了文心一言+电商的场景。

一句话就能生成主播直播带货文案,并通过AI主播+直播的方式丰富直播的新场景。

现在,人类只需要把商品的信息告诉AI,让AI自动生成多种风格的商品带货脚本和风格,再配个数字人主播,就可以帮企业把货给卖出去。据百度介绍,相比真人直播,数字直播可实现7*24小时不间断直播,转化率为无人直播间的2倍。

忻舟向连线Insight表示,“目前来看,办公场景、数字人的对话场景、文档内容生成、问答场景这种需求量比较大的,是百度会优先去做的场景,但不仅限于这些,百度会在更长尾当中去探索。”

可以预见的是,当下大模型技术对于各行各业的发展至关重要,寻找不同产业的落地场景,帮产业的从业者解决具体问题,让大模型成为“产业专家”,将是大模型入局者共同的追求。

客户需求强烈,谁能快速抓住商机?

一个好的应用,最终的评判标准是具有多少商业价值,这样的道理在大模型赛道同样适用。

和ChatGPT面向C端不同,文心一言等国内大模型的定位更偏向B端。

李彦宏称,文心一言的定位是一个通用的赋能平台,金融、能源、媒体、政务等千行百业,都可以基于这个平台来实现智能化变革,创造商业价值。

目前来看,各行各业对大模型的需求很强烈,大家都想借助大模型的AI能力,助力企业的数智化转型。

作为第一个吃螃蟹的人,文心一言因为先发优势受到关注,这既是机会也是考验。

需要明白的是,支撑文心一言大模型能力的是百度智能云大模型平台。在此次客户技术交流会上,百度智能云大模型也做出了相应的升级。

据连线Insight了解,过去一个月,有超过600家合作伙伴宣布加入文心一言生态。在企业服务方面,3月底开始,百度智能云大模型平台启动首批企业内测,未来将针对不同客户和开发者的需求,提供公有云服务、私有化部署两种服务模式。

据介绍,百度智能云大模型目前已经与不同领域客户联合研发,在智能办公、旅行服务、电商直播、政务服务、金融服务五大领域打造行业样板间。

忻舟表示,百度智能云大模型平台是全球首个一站式的企业级大模型平台。之所以称为全球首个一站式平台,是因为它不但提供包括文心一言在内的大模型服务,还提供大模型开发和应用的整套工具链。此外,该平台不仅提供文心一言大模型服务,还支持各类第三方大模型,未来将成为大模型生产和分发的集散地。

以石墨文档为例,在接入文心一言内测后,石墨文档研发出多个快速创作功能,辅助用户高效办公。AI助手“石小墨”能够快速生成简历、合同、故事等各种内容。比如起草合同,用户只需给出简单诉求,1分钟就能完成一份条款清晰的合同初稿,这在未来经过安全评估后将上线。

谈及与石墨文档的商业合作模式,忻舟向连线Insight表示,“百度要做一个通用的、可规模的技术和服务,收费是肯定的,但是不会专门对石墨收技术服务费。满足客户的长期需求、提升产品价值,这是我们的思路。”

不只百度智能云大模型平台,场上大模型玩家为了争抢客户,都使出了浑身解数。

作为AI大模型的基础设施,云厂商已经开始有动作,有大模型能力的云厂商,已经开始抢客户,以便未来给它们销售模型能力。

4月26日,阿里云在生态大会上发布一系列计划——包括一次"史上最大规模降价",核心产品价格全线下调15%至50%,其中存储产品降价最大规模可达50%。

除此之外,阿里云对伙伴的支持分销伙伴的专属市场规模将扩大5倍,从原来的20亿提升到100亿,同时大幅提升伙伴佣金率。

这一消息,在阿里发布大模型产品“通义千问”之后,在此之际趁热打铁,阿里云希望借此获得更多的客户。

回顾阿里进军大模型领域的动作,也十分迅速。

一个月内,阿里云先接入阿里“通义千问“大模型,又推出钉钉魔法棒功能,目前阿里云敲定了一系列生态伙伴——昆仑数智、中金财富、用友网络、亚信科技等七家数字化服务商成为首批伙伴,覆盖油气、电力、交通、金融、酒旅、企服、通信行业。

大模型行业,依然是拼速度的时期,不管是技术升级、场景落地还是客户获取,快,依然重要武器。

正如忻舟在客户技术交流会上表示,“越早推出,哪怕比别人快一天,其实也能够得到更多的反馈,通过反馈来驱动更多的创新,跑得比别人更快、比别人更努力很重要。”

头部玩家的动作在向市场表明,迅速抓住商机意味着更多机会,当然除了快,这还是一场技术的硬实力比拼。

要抢客户,更拼技术

当各家的大模型应用涌向市场,技术是打动客户的硬实力。

如今,无论是百度文心一言,还是阿里通义千问,各家都陆续进入了不同产业接洽客户的阶段,同一个客户同时对接几个不同的大模型玩家的情况也会出现。

这时候,客户自然要“货比三家”。要赢得客户,不仅考验对商业的敏感度,更考验的是技术实力。

以百度为例,从2月7日立下“军令状”,到文心一言亮相,再到此次技术交流会,基于百度智能云大模型平台,文心一言大模型在不断迭代升级。此次客户技术交流会上,文心一言公布了“满月”成绩单。

据连线Insight了解,文心一言已完成4次技术版本升级,大模型推理成本降为原来的十分之一;大模型推理性能提升50%;模型算力利用率提升1倍。

众所周知,大模型发展的背后除了百亿级的参数规模、海量数据外,还需要庞大的智能算力支撑。而智能算力的水平又与算力芯片、算力规模息息相关。

以核心指标算力为例,算力是支撑大模型运转起来的原动力。强大的算力,意味着更快的数据处理速度、更强的大模型服务能力。

这背后,离不开云厂商的技术支持。

以前云厂商提供的,是以CPU为主的通用算力。但到了自动驾驶、AI大模型等领域,计算更为复杂,其主要来源就是GPU。为了应对高密度的计算需求,云厂商原来的固有三层架构(IaaS、PaaS、SaaS)变为了从端到端的四层模型。

忻舟在技术交流会上向连线Insight解释,“从芯片到框架,到上层的大模型,再到应用,每一层都是互相影响的,不管从效果,还是性能、稳定性上,都会对这四个架构提出更高的要求。如果能做到端到端的闭环优化,将达到更好的效果。”

“文心一言将根本性地改变云计算行业的游戏规则,未来MaaS将成为云计算的主流商业模式,每个企业都将拥有一个智能底座。因此,企业要尽快行动起来,重新思考自己的优势是什么、如何用AI放大这个优势。”百度集团副总裁袁佛玉提到。

阿里云的架构也有这样的趋势——PaaS和SaaS会被MaaS取代,AI+MaaS将成为新架构。

在未来,阿里云的大模型顶层会是为MaaS模型即服务,阿里云向生态开放大模型能力和训练底座;而中间层为三个PaaS被集成,钉钉和瓴羊进入产品矩阵,与阿里云平台产品构成三大PaaS被集成;底座则是IaaS云基础设施产品被集成。

这也意味着,大模型对技术的高要求,决定了大模型的研发不是容易的事,短时间内技术升级和迭代的背后,其实是大厂们此前的技术积累。

以百度为例,在芯片层,百度拥有自研的AI芯片“百度昆仑”,自2018年发布以来,百度已在多场景实际部署几万片,为公司的AI系统提供了算力方面的支持。

在框架层,百度拥有国内规模最大的深度学习框架“百度飞桨”,截至2022年底,飞桨平台上已凝聚535万开发者、创建67万个AI模型,服务20万家企事业单位。

值得一提的是,商业化角度来看,目前大模型玩家们都选择了从内至外的路径,即先从自身应用层切入。

像阿里的钉钉、天猫精灵率先接入“通义千问”,并表示阿里所有应用都将接入大模型;此外,百度从搜索到小度音响到自动驾驶,再到百度健康,几乎所用百度系产品,都在使用文心一言提升各自的产品效果。

透过这样的试验路径,大模型玩家们一方面可以通过在内部业务的不断尝试找到场景落地的难点,方便训练大模型;另一方面,也可以提升自身应用在行业中的地位。

从大厂的角度来看,其实各家都已具备大模型能力,并顺利接入自家业务。未来大厂模型商业竞争决胜点,除了“人无我有”技术储备能力外,或许还在于依靠大模型完成技术能力外溢,赋能其他合作伙伴。

自ChatGPT打开市场空间后,大模型浪潮风起云涌。拿到入场券是第一步,接下来考验的是市场玩家们探索商业化和技术升级的能力,想要跑到最后,每一步都不能落下。

本文(含图片)为合作媒体授权创业邦转载,不代表创业邦立场,转载请联系原作者。如有任何疑问,请联系editor@cyzone.cn。

推荐内容