(本文系紫金财经原创稿件,作者:钰熙,转载请注明来源)

AI终端产品“遍地开花”的科大讯飞,终于拿出大模型这个“水壶”,向AI花园浇灌,用大模型的技术赋能旗下AI终端产品。

5月6日,科大讯飞发布了大模型星火,从大模型具备的能力来看,和此前其他大厂的大模型相差无异。同样具备文本生成、语言理解,知识问答、逻辑推理等方面的技术能力。但值得一提的是,星火并不具备文生图能力,无法通过语言转换为图片。


(相关资料图)

科大讯飞将星火定义为认知大模型,和目前“大模型混战”的主力军语言大模型有所差异。

为了明确认知和语言的具体区别,紫金财经向星火提问,星火表示“认知模型更关注人类语言的理解和生成过程,而语言模型更关注语言中词汇、语法和语义等方面的规律。”

简单来说,其他大厂发布的语言大模型,更偏重于语言本身的规律,而讯飞的星火则侧重于人类语言的理解,俗称更懂人说话的逻辑。

科大讯飞将大模型的研究方向定为认知的原因,也不难理解。毕竟,2022年教育业务、开放平台及消费者业务,合计为科大讯飞贡献了超过50%的营业收入。这两项业务的产品使用场景,也都导向了人类自然语言与AI的交互。

认知大模型更符合科大讯飞的“调性”,毕竟在AI终端产品上深耕多年,科大讯飞具备一定的技术底色和用户数据,来支持大模型的研发,同时产品亦能为大模型提供商业落地场景,让技术不再飘在空中。

虽然内部将大模型和产品融合,呈现良性驱动,但外部的竞争,不容小觑。

从宏观的视角来看,此次科大讯飞加入的大模型混战,可谓是移动互联网技术底色最浓的一次战争。海外有Chat GPT立标杆,国内各互联网大厂投身热潮,同属于AI赛道的老对手商汤科技,已经抢先一步发布大模型。

对于科大讯飞而言,这将是一场比拼韧劲的艰难战争。为了研发星火,科大讯飞投入的资金,使得今年Q1扣非归母净利润大跌331.82%,这让本就离不开补贴和融资的企业,又增添了几分现金流的危机感。

参战大模型,不知道科大讯飞准备了多少弹药?

星火的“前世今生”

“今年10月24日,通用模型对标ChatGPT(中文超越,英文相当)。”科大讯飞董事长刘庆峰豪言。

科大讯飞给自己定下的目标,可以说放在国内所有大模型厂商中,都是很高的水准了。百度创始人李彦宏曾在文心一言发布之际表示,距离ChatGPT还有两个月的差距,而这两个月的差距具体需要多久才能赶上是个未知数。

虽然距离科大讯飞兑现诺言的时候还有几个月时间,但我们仍可以从过往和当下,来还原科大讯飞所具备的技术积累,而这也是科大讯飞参战大模型的基础弹药。

从大模型自身来看,厂商需要具备数据积累、核心算法、算法创新、算力支撑等方面能力。而这些能力代入到科大讯飞中,就离不开星火诞生之前,科大讯飞的努力。

这些技术沉淀,也可以看作是星火的“前世”。

2011年科大讯飞,承建了语音及语言信息处理国家工程实验室,当时科大讯飞提出了让机器像人一样能听会说。从如今的视角来看,这也是当下认知大模型语音和语言的核心能力的基础条件。

在核心算法层面,GPT的核心算法支撑为Transformer(深度神经网络算法),这个算法起初是聚焦在自然语言处理领域,随后发展至各个领域,也是目前AI主流的算法模型。

科大讯飞的星火模型,同样是基于Transformer的,拥有超过1000亿个参数,是目前世界上最大的中文预训练语言模型。经过多年的技术沉淀,目前科大讯飞已经将Transformer深度神经网络算法应用于,语音识别、图文识别、机器翻译中。科大讯飞已开源6大类、超过40个通用领域系列的中文预训练语言模型,相关模型库月均调用量超1000万。

除了Transformer之外,在核心算法层面上,科大讯飞还创新性地提出了知识与大模型融合的统一理解框架X-Reasoner,有望弥补大模型的模糊记忆技术短板。X-Reasoner的基本技术是科大讯飞研发并应用十几年的DNN,早在2011年科大讯飞就上线了中文语音识别DNN系统。

X-Reasoner于2017年发布,是一款基于语义理解和推理的知识图谱查询系统。可以应用在智能客服、智能问答系统等领域。在2022年科学常识推理挑战赛OpenBookQA中,以准确率94.2%的优势夺冠,常识推理单模型首超人类平均水平。

由此可见,科大讯飞多年来在AI领域的探索,已具备一定的算法能力,这也是如今星火大模型的技术底座。经过十余年的发展,这些技术积累早已形成规模化的研发,所以在算法创新和算力支撑层面都已十分成熟。

2017年,科大讯飞承建了中国首个认知智能领域国家级重点实验室,设计了通用认知大模型评测体系,评测体系利于科大讯飞推动认知大模型的发展,也为日后创新夯实基础。技术底座中的最后一环,算力支撑是所有大模型厂商最棘手的问题之一。这方面,科大讯飞此前曾建立了AI数据中心,这也是大模型训练的硬件基石。

可以说,多年来在AI领域的“厚积”,才让科大讯飞迎来星火这个“薄发”的机会。

但目前,科大讯飞的星火还存在很多不足之处,刘庆峰表示,目前讯飞星火认知大模型技术还存在很多可改进之处,比如新知识难以及时更新,事实类问答容易“张冠李戴”等。

紫金财经在和星火进行多轮对话时也发现了部分不足,例如在提问“以人工智能赋能各行各业为题,写一篇市场报告”时,星火引用的资料出现了“根据相关报告显示,全球智能物流市场规模将在XXXX年突破2000亿美元”。这部分回答,星火给出了模糊的年份,暴露了模型对资料处理能力的欠缺。在提问“我本周找了十个客户,没有成交,请帮我写一份周报”时,星火给出的回答出现了“找到了十个潜在客户,其中七个被成功转化为进一步联系机会。”这部分回答出现了回答和提问事实不符的状况。

所以能看出,星火具备一定的技术实力,但随机应变的能力还需进一步加强。

星火诞生,燎原终端

在科大讯飞的总部园区中心,立着一块巨石,石头上刻着“顶天立地”四个大字。

刘庆峰解释道,“顶天”是指技术顶天,掌握源头核心技术并处于全球领先地位;“立地”是指应用落地,让技术转化为大众切实可感受的产品。

应用落地是科大讯飞自1999年成立以来,一直未变的战略目标。这或许也将是科大讯飞在大模型之战中,差异化的竞争力。此前紫金财经曾在《大厂集体抢滩ChatGPT:谁真的有实力,谁在试点商业化?》一文中阐述观点,没有商业落地场景,那技术只能是空中楼阁。

科大讯飞在大模型商业落地环节先行一步,目前科大讯飞AI终端产品包括AI学习机、智能办公本、翻译机、语音转换APP等,涵盖了学习、办公等多个使用场景。这些终端产品承接了星火大模型的落地,星火亦能带动产品向更智能化的方向发展。

在星火发布当天,科大讯飞推出了搭载星火大模型的AI学习机T20系列。从使用环节来看,星火率先在语数英主学科上落地,首批上线了中英文作文类人批改(学习机端)和生成(家长端)、数学个性化精准学类人互动辅学、英语类人口语陪练等功能。

所谓类人批改,指的是通过基础批改、高阶批改、提升建议三个层次辅助,完成作文批改后,家长可在手机端APP上,查看完整批改报告。此外T20系列还上线了口语陪练的功能,通过陪伴式对话练习,提升口语表达能力。

从科大讯飞的商业化进程来看,首推AI学习机作为星火的落地应用产品,是最能减少试错成本的一次实验。

首先,科大讯飞在大教育领域早已从B端、C端两方面进行布局。以语音识别起家的科大讯飞,早在2015年,就联合教育部门运营了普通话机考、中英文作文评分等智慧教育解决方案。2022年,已经覆盖了到全国超31个省级行政区。

2016年智慧教育在科大讯飞的营收中占比27.44%,2022年已经上升到29.19%,贡献了23.28亿的收入,成为科大讯飞商业化中不可或缺的一环。

多年来在教育B端领域的沉淀,是科大讯飞将星火融合到学习机中的最佳技术底气。此外,C端的教育硬件布局,也能帮助科大讯飞减少用户教育成本,能在最短的时间内,触达更多C端用户。

2022年,科大讯飞AI学习机授权专卖店预计新增到3000家左右;全品类官方直营店当前累计布局70家。2022年上半年科大讯飞AI学习机销售额增长超101%,去年的618购物节中,科大讯飞学习机稳居淘宝、京东等平台同品类第一名。

这些数据表明,科大讯飞在AI学习机品类上有一批种子用户,同时也会有更多潜在用户等待撬动。去年券商调研中,科大讯飞表示,在调研的上千个城市中,80%的城市已经明确家长可以付费,意愿在600-1000元一学期不等。

由此可见,教育硬件可以让科大讯飞星火“软着陆”。

另一个关键点是,星火主要赋能的是数语外三大主科,这三个科目所涉及到的基本逻辑,也正是一个认知模型的基础。通过和用户的使用交互,亦能为大模型迭代提供数据资产。

科大讯飞表示,1就是大模型底座,N指的是将认知智能大模型技术应用在教育、医疗、人机交互、办公、翻译等多个行业领域。这些领域中,科大讯飞早有C端产品布局,如今也迎来转折之时。

在办公领域,讯飞办公本借助大模型能力,根据手写要点自动生成会议纪要,将会议语音转化成书面化文稿。“讯飞听见”通过AI分析文字内容,自动生成摘要、待办、文案等。

办公场景所涉及到的功能,其自然语言处理的基因,天然适合大模型应用。这也是科大讯飞在大模型商业化上更迅速的原因之一。

目前,科大讯飞的翻译机、语音转换APP等产品虽然在细分赛道上都已交出不错的答卷,但始终未完成破圈,尚未形成在大众范围里的影响力。何况这个领域中,还有网易等大厂也有产品与其竞争。如果未来将星火集成在C端产品中,有望助力科大讯飞在智能硬件市场的突破。

科大讯飞在终端硬件的产品线虽广而全,但一直没有网红级产品,难以释放太多商业价值。遍布AI草地的科大讯飞,或许比谁都需要AI这把火。

科大讯飞:往前看,别回头

AI领域向来是一个长坡厚雪的赛道,赛道的特殊性表明,拔得头筹并不是一朝一夕的事情。

尤其是在大模型领域,“贵”已经成为所有参战厂商头顶上的“达摩克利斯之剑”。Open AI在推出GPT3的API之前,就已“烧”掉了数亿美金,后在拿到了微软百亿美元的投资下,才使得GPT3面世。

所以想要对标甚至赶超GPT,资金是必不可少的一环。

而这也是科大讯飞在持久战层面,面临的最棘手的问题。根据2022年财报显示,科大讯飞营收188.20亿元,同比微增2.77%;净利润5.61亿元,同比下滑63.94%;扣非后归母净利润4.18亿元,同比下滑57.31%。

去年,科大讯飞已经出现了营收微涨,但净利润腰斩的状况。

对此科大讯飞解释称,一方面是由于社会经济的特殊环境,相关项目进度有所延期;尤其在第四季度,公司有超过 20 个项目、超过 30 亿元的合同延期。

除了客观不可抗力因素影响外,自 2019 年科大讯飞被列入美国实体清单后,2022年10月7日,再次被极限施压。强压之下,对于科大讯飞整体的供应链,也是一个不可忽视的挑战。

资金层面更棘手的是,如今科大讯飞依赖政府补助的老问题依旧存在。2019年-2021年,计入当期损益的政府补助分别为4.12亿、4.26亿和4.39亿,占总利润比例分别为50.24%、31.23%、28.21%。2022年,科大讯飞计入当期损益的政府补助金额上升到了10亿元。

简单来说,在星火面世之前,科大讯飞已经面临来自供应链、订单等多维度的压力。而这些压力的最终也将体现在公司的现金流层面。

今年科大讯飞更是迎来动荡时刻,2023年一季度,科大讯飞实现营业收入28.88亿元,同比下降17.64%;归母净利润-5.8亿元,同比下降152.26%;扣非净利润-3.38亿元,同比大跌331.82%。

对此科大讯飞表示,净利润受新增项目研发投入影响。这里指的新增项目就是星火,为了研发星火,2023年一季度,研发投入为7.16亿元,去年同期的研发费用为6.77亿元。

营收、净利润双重下降,势必对现有账面产生冲击。截至2023年Q1季度,科大讯飞现金及现金等价物额为30.37亿,环比2022年Q4的41.72亿元,下降了11%。同比下降5.6%。

在财报电话会上,科大讯飞表示不会像OpenAI那样需要耗费百亿美金,不会需要那么多人力资金。但并未具体透露研发成本。

只有取得高质量营收增长,解决研发投入对公司利润产生的冲击,才能让科大讯飞在大模型之战中,找到长期支柱。已经伸进来了一只脚,只能往前看,别回头!

总结:

今年以来,市面上涌现了太多的大模型,无论是互联网大厂还是AI企业,亦或是初创公司,都纷纷投入到这场浪潮中。

诚然,大模型所带来的将是产业级的重塑,对于相关产业的玩家而言,是一个不容忽视的机遇,甚至可以说成败在此一举。

但水能载舟、亦能覆舟。

大模型为企业带来具备想象力的商业空间时,其所需的巨大投入,也将会拖累企业的长久发展脚步。新技术固然值得期待,但这条路不仅需要入局者仰望星空,更需要具备身子下沉、眼睛向下,脚踏实地一往无前的韧劲。

推荐内容