人工智能发展如火如荼,大模型的诞生风起云涌,不过虽然看到了很多大模型的发布,但还是很少能看到大模型的进步,让人不由得怀疑大部分企业是不是只在跟风。
不过,刚刚发布一个月的讯飞星火大模型却紧锣密鼓地又召开了一次升级发布会,可以看出讯飞是真正在大模型时代发力狂奔,而这次发布的“讯飞星火认知大模型”V1.5甚至超越了上次发布会所承诺的更新速度,不仅在多种交互能力上实现了突破,在教育医疗等多个垂直领域也获得了巨大进步。
(资料图)
高考题上见真章
这两天恰逢高考,关于AI和高考的话题自然也就热了起来。搜狐科技使用五款AI大模型对2023高考上海数学试卷的10道填空题进行了测试,结果科大讯飞星火认知大模型答对了5题,正确率50%。ChatGPT和百度文心一言都答对了4题,正确率40%。而阿里通义千问和360智脑则10道题全错,正确率0%。
从这个结果上来看,上次讯飞发布会所说的讯飞星火大模型文本生成、数学能力已超过ChatGPT并非是吹牛。而在6月9号的发布会上,“讯飞星火认知大模型”V1.5重点呈现大模型在知识问答、数学能力、多轮交互中的升级,可以说AI能力又进一步,相信在领先幅度上又有加大。
所以无论从那个角度来看,讯飞都是在大模型领域做的最认真也是迭代速度更快的。我觉得大模型的竞争是一个分秒必争的竞争,大家不仅各自在模型学习上永无止境,在算法和功能的落地体验上,也要不断的适配。大模型最终不会是一个聊天软件,而是真正要形成生产力的AI发动机,从这个角度来说,在针对场景化的落地上,比如教育、医疗、应用适配方面,讯飞星火大模型确实还是走在前面的。
要知道,大模型最终的分界点还是要看谁能够先实现“智慧涌现”,也就是一下子形成一个质的飞跃和变化。这种跨越式的升级会一下子拉开各家之间的差距,就好像高中生高考进入大学一样。并不是所有的大模型最终都能实现“智慧涌现”的,这可能也是最终判断大模型是否能够成功的关键。
能力升级,应用落地
在大模型的能力判断上,行业其实还没有统一标准,大部分测试也都相对局限,在这一点上,作为人工智能“国家队”之一,科大讯飞被授予人工智能关键技术和应用评测工业和信息化部重点实验室大模型工作组的副组长单位,参编中国信通院大模型标准体系2.0的建设,正在用我们自己的能力去构建行业的标准。
而在后者的应用落地上,显然这是讯飞最大的优势所在,无论是软件还是硬件,现在都已经有了成熟的产品应用,而在大模型产品的加持下,讯飞硬件产品在这次618大促上的表现也异常出色,大促开场不久就完成了去年全天的销售额,讯飞AI学习机系列激活同比增长214%,讯飞智能办公本系列激活同比增长176%,讯飞听见网站新增用户同比增长205%。
6月9日,是科大讯飞的24周年庆,而在这次的发布会上,讯飞星火认知大模型V1.5主要的升级核心有两点,一个是讯飞星火大模型在能力上的升级,一个则是讯飞星火大模型在应用上的落地。讯飞星火认知大模型V1.5除了大模型本身能力的整体提升外,还在综合能力上实现三大升级,包括:开放式知识问答取得突破,多轮对话、逻辑和数学能力再升级。
在现场,科大讯飞总裁吴晓如、研究院院长刘聪针对性的进行了测试,提出了诸如“2023年全国高考甲卷的作文题是什么,并分析一下它传递的意义。“ “高考刚刚结束,孩子即将开启新的起点,请给你的孩子写一封暖心的信。”这样更为开放性的问题,以及“一条船上有三个人,但是有两个父亲,两个儿子,请问是怎么回事?” “1个鱼缸里有很多条鱼,共有5个品种,至少要捞出多少条鱼,才能保证其中有4条相同品种的鱼?”这样逻辑性和数学性兼顾的问题,都获得了很好的回答。现场甚至还演示了拍照识别数学试卷,大模型准确答卷的测试,充分体现出了讯飞星火大模型V1.5的能力增强。
为了更好的服务用户,在现场星火APP同步大模型发布,成为大模型的具体载体,而面向生活、工作等用户高频使用场景上线200+小助手,把AI落地做到了实处。科大讯飞还表示将进一步推动星火认知大模型在教育、医疗、工业、办公等领域落地应用,赋能星火语伴APP、医疗诊后康复管理平台、羚羊工业互联网平台、讯飞听见智慧屏等产品,并开放了讯飞星火开发接口,携手开发者共建“星火”生态。
如果说五月份科大讯飞董事长刘庆峰表示“星火大模型距离ChatGPT差距不远,有些地方甚至有所超越”还让人觉得有点吹牛的成分,那么这次的展示显然凸显出了科大讯飞的底气。刘庆峰表示,“今天我们再次如期发布星火大模型的最新成果,是因为我们所有的技术平台都是完全自主研发的,我们对每一个阶段的技术都是可控的,也非常有信心。讯飞不仅要致敬和追赶OpenAI,更要在源头上做自主创新,在类脑智能、神经网络大模型、博弈智能等方面探索通用人工智能的更多潜在路径和前沿交叉研究机会。”
自国内大模型批量上市之后,很多人都会发现一个问题,就是感觉各大通用大模型似乎没有太大差距,基本都能做到有问有答,但好玩之余似乎没有什么地方能够用到。即便是在海外,同样的问题依旧存在,不少领域真正实用的大模型实际上并非通用大模型,而ChatGPT的各种产品落地,也并没有带来更为惊艳的用户体验,依旧还是一个加强版的搜索引擎。
所以,从这里我们可以看出,大模型的发展方向有两个关键点,一个是“智慧涌现”的关键节点,一个是具体场景的落地应用。前者似乎有些不可预测,但后者则是完全可以尝试领先一步的。毕竟,我国的科技行业一直在应用端有着无可比拟的优势,率先在应用端实现领先突破似乎是逆袭ChatGPT的关键路径。
科大讯飞一早就建立了认知大模型“1+N”专项攻关的体系,其中“1”就是通用的认知智能大模型,“N”就是将“讯飞星火”在教育、办公、汽车、人机交互、医疗等领域进行应用落地。而这次讯飞星火认知大模型V1.5更进一步拓宽了对“N”个行业领域的赋能。
比如AI口语助手升级的星火语伴APP,已经可以像外语口语老师一样进行开放式对话、情景交流,并进行实时口语纠错,配合虚拟老师形象,可以让用户可以身临其境的练习口语,并支持9种语言文本、语音和图片翻译。
在办公领域,科大讯飞发布了业界首个搭载大模型的会议室智能终端——讯飞听见智慧屏。它可以实现动态会议记录、会议内容自动整理输出,一键生成多种类型的会议文案,助力用户高效办公。
在医疗方面,讯飞医疗全面升级医疗诊后康复管理平台,将专业的诊后管理和康复指导延伸到院外,可以根据患者健康画像自动分析,平台可为患者智能生成个性化康复计划,包括重点关注、用药指导、康复运动、出院随访、健康知识、患者咨询等,并督促患者按计划执行。
在工业领域,在星火大模型的基础上,羚羊平台推出了工业AI——“羚机一动”。中小企业在羚羊平台上自由发布需求,羚机一动针对企业需求给出专业化建议策略,智能匹配方案、服务商、专家等资源,等等。可以说,讯飞星火大模型正如其名称一样,真正地已经在各个领域开始星火燎原了。
刘庆峰在现场宣布,讯飞将开放星火认知大模型开发接口,将七大维度能力、200+小助手对应能力全面开放给开发者,并且支持多端接入快速集成,支持私有化部署,与广大开发者共建生态。他表示:“通用人工智能的全新时代将是一个伟大的历史进程,绝不是一蹴而就的,所以我们既要有短期攻关的雄心,更要有长期主义的恒心。这是我们应该遵循的产业逻辑和科研发展应有的规律,这样才能够在长跑中真正胜出,真正的解决社会刚需,建设美好世界。”