一、机械 首席分析师
智能机器人,下一波人工智能浪潮?
(相关资料图)
5月17日,英伟达创始人提出具身智能是有望成为下一波人工智能浪潮。 英伟达创始人黄仁勋在2023年ITF世界大会上发表演讲并提出“人工智能和加速计算正在共同改变技术行业。下一波人工智能浪潮将是一种被称为具身AI的新型人工智能,即能够理解、推理并与物理世界互动的智能系统。”
具身智能机器人有望成为AI的最终载体,核心在于感知层、认知层。 我们认为具身智能机器人能够像人一样在环境中交互感知,自主规划、决策、行动并完成相应任务,技术原理包括感知层、认知层、执行层三大层面。从工业机器人的发展来看,工业机器人主要根据控制系统发出的指令信号控制机器人主体完成任务,主要依赖于机器人的执行层;而与工业机器人不同,具身智能机器人若能像人一样与环境交互、感知、决策、完成任务,将不得不提升感知层和认知层的能力。
感知层中视觉的重要程度较高。 从人体的感官来看,80%的信息获取来自于视觉,根据仝人智能吴易明博士分析,感知层面的核心在于视觉感知,主要原因:1)感知层需要与运动层交互印证:首先视觉感知需要与物理实存进行交互印证,是具身智能实现的基础;2)感知能力提升可使机器人运动更加“拟人化”:视觉感知通过与运动系统的执行参量、信息数据交互修正,使具身机器人从传统的僵化肢体运动提升为为高自由度、高精密、多表现形式的运动。
谷歌PaLM视觉模型、多模态大型语言模型横空出世,感知层和认知层有望迎来迎来突破,具身智能机器人未来或已来。 感知层和认知层是工业机器人向具身智能机器人迈进的门槛,而今年来机器视觉和多态语言大模型的快速迭代有望大幅提升机器人的感知能力和认知能力。1)感知层:人类的五大感官中视觉的获取的信息占比超80%,机器视觉能力对于感知层面至关重要,22年3月,谷歌发布最大的视觉-语言模型PaLM,最终参数量高达5620亿,有望提升机器人感知能力;2)认知层:GPT-4出现让机器人对于现实世界中图像、文字、数据的理解进入新台阶,根据微软最新的一项研究,将GPT拓展至机器人领域,实现语言控制机械臂、无人机等多个平台。
以下是我们对于具身智能机器人行业的两点判断:1)格局: 科技类企业或主导行业格局:我们认为未来机器人的核心在于感知层和认知层,因此算法类水平高的科技企业或在未来机器人市场具有更大主动权,行业的格局未来或以头部科技企业为主; 2)空间: 从远期潜在需求量来看,具身智能机器人在制造业、家政服务、商业服务等多个领域均有潜在需求,未来具身智能机器人的需求量将远多于目前工业机器人的需求量。
风险提升:技术进步低于预期,产业化进度低于预期
二、汽车 首席分析师
从主题迈向兑现,关注低成本解决方案
1 、Tesla bot再获进展:于5月18日召开2023年股东大会,在会议期间展示了其人形机器人Optimus研究的最新进展:Optimus能力全面提升。在演示视频中,Optimus展示了其使用端到端的形式学习人类行为,随后对物体进行分类摆放与抓取的能力。在电机扭矩控制方面,Optimus的力度控制更精确,且对周围环境有探测与记忆的能力。
2、机器人未来量产早于无人驾驶。无人驾驶量产目前卡在技术端,ASIL-D安全规则和CORNER CASE。从感知、认知和执行看,机器人的安全级别低于车,机器人未来量产会早于无人驾驶。
3、机器人赛道目前需要关注现象级产品的出现。现象级产品的出现是行业爆发的起点,而现象级产品目前核心制约之一是成本端。关注低成本供应链和技术方案的落地。
(1)车+bot供应链未来是会真正受益的方向之一,关注目前在海外布局的bot产业链,三花智控、拓普集团、绿的谐波等;
(2)关注低成本技术方案:硬件上看,从驱动、传感器到电池,未来行业将围绕低成本方案进行迭代。bot从工业发展到服务领域,关注arm、hand和传感方案的变动。我们认为,特斯拉等是行业成本控制能力强的主机供应商,其未来技术方案的落地和迭代,将是未来bot投资的核心方向。
风险提示:产业化时间低于预期
三、计算机 首席分析师
看好AI在金融、企业服务、机器人、安全等持续落地
5月18日,深信服安全GPT展示。公司安全GPT是开源大模型+海量安全数据+威胁情报+安全知识训练得到,通过大量安全专家和在线安全产品、原有小模型对其进行了大量微调,可针对用户自身安全日志和产品进行个性化检测诊断。安全GPT为自研,部署在托管云中。目前在文件检测、行为检测、日志分析等10+不同领域都有AI赋能,后续所有产品都将接入安全GPT。赋能效果如何?大幅提升流量和日志的安全检测能力,用户安全现状自动分析及建议生成,自动化调查、分析、研判提升安全运营效率,自然语言交互提高用户体验降低专业性要求。怎么看安全GPT对公司的影响?继今年3月28日微软推出Security Copilot后,公司于5月18日展示了安全GPT最新进展,整体看公司结合大模型后的研发进展超预期。演示效果显示,安全GPT通过自然语言交互的方式大幅度提升了安全运营的的全流程效率,能够降低对安全人员的需求量,后续有望大幅降低人力成本。
5月18日,中科创达发布魔方Rubik大模型。算法全部自研(并未基于开源模型),目前发布会上展示的是几十亿参数的版本,可以部署在8550芯片上进行推理。千亿参数大模型也在研发中,预计年底推出。提供软硬全栈能力:Rubik Server和Rubik Box可提供端侧和云侧的算力,形成机器人、智能终端等具身智能产品;OS层可通过WuChat让各个物联网厂商统一通过自然语言调用设备,不再需要介质间接管理家用设备;此外,公司还提供数据标注、微调等工具,以此提升车载设计领域的输出效果。应用层:GeniusCanvas:快速创作丰富多彩的概念效果和特效,构建多样的3D模型及形象库。3D工业模型自动优化,数字人动作自动生成,Kanzi特效算法和代码生成;CodePilot:面向安卓和通用开发者的工具,可一键生成部分代码,目前该工具处于内部研发阶段;Devices:支持Rubik Language产品与客户私有化数据相结合,助力用户训练个性化模型,并进行私有部署;Enterprise Suite:面向企业的套件,包括数据处理、模型训练、模型组网、模型压缩等。
我们持续优先推荐AI在计算机领域市场空间最大的落地应用环节,这其中首推To C场景的落地,即办公软件、证券IT、智能硬件等,其次是To B场景的落地,包括工业软件、企业服务、金融科技等,最后是To G和To 大B场景的落地,包括网络安全、安防、数字经济等。
对于代表性重点公司如深信服、恒生电子、海康威视等而言,下游客户需求回暖向上;叠加控费效果持续显现,大模型赋能亦将带来降本增效空间,有望迎来戴维斯双击。