圆桌主题:巅峰论剑大模型
圆桌 嘉宾:
吕伟 民生证券计算机行业首席分析师
(资料图)
卢志武 中国人民大学高瓴人工智能研究院教授
刘会福 软通动力CTO
俞珂白 立方数科CEO
孙亚夫 千方科技副总裁、研究院院长
吕伟: 今天非常荣幸邀请了学术界的卢志武教授,还有几位行业领军公司的领导,包括软通动力CTO刘总、立方数科CEO俞总,还有千方科技副总裁、研究院院长孙总,大家一起来讨论市场最关心的问题。 卢志武教授是第一个国内公开的多模态预训练模型“文澜”的发布者,最近在3月8号卢志武教授也发布了语言预训练大模型,在市场还没有太关注的时候,从学术的角度对多模态模型的看法,包括您看来学术的研发和产业、公司的关系,能为我们做一个介绍吗? 卢志武: 我简要谈一下研究多模态大模型的经历,我们最早研究多模态大模型是在2020年10月份左右的时候,那个时候是最早一批做大模型的,做多模态大模型就更少了,几乎没有,技术路线也不知道,我们经过很多的波折,最后把它做出来了。我们在2021年3月份的时候就发布了第一个版本,但是我们发现那个模型跟OpenAI的CLIP是特别像的,OpenAI是1月份发布的,我们几乎同时把我们的“文澜”模型做出来。 在后面的一年多或者两年继续在多模态大模型上深入,正是因为有了前面的积累,我们在GPT-4发布之前就把大模型ChatGPT发布了,真实的发布是12月8号。大概是这么一个过程。我们在这个领域已经研究了四五年,长期耕耘才有了这个眼光。 吕伟: 您怎么看待学术研究的产品跟企业和整个落地的关系? 卢志武: 学术界的一些研究成果,大部分落地还是很困难,但是我一直在大模型这个上面,我觉得跟产业界隔的gap没有那么大,几乎说你那个模型只要足够好,必然可以在产业界找到落地的场景,在大模型上并不像以前说的产学研过程太漫长。 吕伟: 我们看OpenAI也是,从产业的研发到落地非常快。后面我们问三位领导一个共性的问题,现在问的最多的是OpenAI ChatGPT大模型出来之后对于IT行业是利空还是利多?IT都会失业,还是IT的需求会大幅的增长?软通是国内IT软件服务的领军公司,我们战略上会有哪些变化? 刘会福: 软通动力对人工智能长期做了投入和投资,AI是过去很多年投资的热点,但是不管是对于IT公司,还是甲方企业,还是学术界,实际上效果一直不是很好。从去年年底ChatGPT出现,它真正解决了AI怎么和场景结合的问题。软通动力作为一个技术公司一直长期认为不管是哪一类技术,它的产生只会给整个IT企业带来巨大的机会。当然是有威胁,对原有的一些低质量的业务是有些冲击,但是机遇远大于威胁,AI在软件领域是未来10年最大的一个机遇。ChatGPT对软通动力来说既是一次转型升级大的机会,在数字化转型和智能化转型领域也将迎来一波新的增长点。 吕伟: 实际上是机遇大于利空。俞总,我们两块核心的业务,可能也会有左右互搏的担心,数字人那块业务是增量的新需求,俞总您对这块怎么看?俞珂白: 从我们企业来讲,我们一个是做软件,一个是做服务,从我的角度来看,类似于像ChatGPT这样的大模型或者说未来有很多小模型,对于我们企业有很大的增长机会,这个有几个方面。
第一个,我们要和模型进行交流肯定要通过一个界面,通过一个应用也好,或者通过一个软件也好,无论是To C端,还是To B端,肯定要有交流的界面。对于我们企业的数字人来讲其实就是一个交流界面,通过它去和模型本身产生这样的一种互动,至于解决什么问题,我觉得各种形式都可以。也就是说大家在讲的,一个个人的AI助理,至于这个AI助理做什么,大家都可以自定义它是你的工作助理也好,自定义你的学习助理也好,自定义你的生活助理也好,都可以。我们觉得数字人是一个友好界面和模型进行交流。第二个,在专业领域传统意义上To B的领域,比如讲建筑这个领域我们认为是非常大的机会,我们能看到AI的出现各行各业或多或少用到AI这样的技术,能够领先了解AI这项技术改变行业使用的效率,改变行业成本的这些企业有了优先的机会,比如讲我们在建筑领域,有传统意义上的画图,做室内设计、装修设计也好,未来在国内我相信也有很多辅助设计的工具。
还有更多的应用场景不仅是在设计阶段,而是在于使用阶段,像我们楼宇的智能化控制,原来我们大家只是为了做一些信息的传感,但是更多的是信息收集、信息采集、数据清洗以后,我们要影响前端的部署。我一直跟有的朋友举例子讲,现在的电梯都分高、中、低区,其实更合理的分配在于你楼面使用的人数,哪一个楼面的人数多,哪一个楼面电梯的使用率高,往往很难做到,基本上你做的时候就分好了。假如有AI的出现,或者AI更好的和现有智能化场景的结合,我相信对于各行各业都会有效率的提升,只要对于把一个人教会,不需要创新型的功能,都可以赋予这个AI的场景,我们自己本地部署了自己的模型,未来会有几个大模型,可能有5个、10个大模型,很多企业很多场景都会有自己的小模型,小模型的训练是有记忆的,你不断训练它就会不断地更精准,小模型也能解决行业问题,假如小模型接到大模型当中也能解决更多的问题。AI的出现对整个生产效率、生产工具是一种变革,而且是能够非常快速的见到一些行业的应用,且能够为行业解决一些问题。 吕伟: 千方科技拥有国内非常好的场景卡位,智能大交通数据,包括视频的数据,孙总您怎么看待AI发展?孙亚夫: 首先,任何一项新技术出现肯定会有一些行业一些人受到一些影响,但整体来说会让整个社会是受益,这是毫无疑问的。
我认为AI未来是一个基础能力,就像水和电一样。所有的行业都会被重新AI化一次,所以我认为是增加了机会。当然你要改变才能增加机会,不改变增加不了机会。 还有一个就是数字化程度越高的行业会越快被AI赋能,从我们现在能看到的来看互联网、移动互联网,包括现在办公系统、CRM系统会被很快AI化,汽车行业也会很快被AI化。因为数字化程度越高的行业越容易被AI赋能,金融行业这块会更快。交通行业现在的数字化程度正在逐步走向高度数字化,从我们来看,AI不仅仅能够提高我们交通行业信息化从业者的生产效率的提升,也能够把我们专业知识和大模型结合起来,会创造更多的机会。 吕伟: 今天难得请到卢志武教授,是整个AI基础大模型领域可以说是中国前沿领军的专家,有一个大家最关心的问题,我们知道OpenAI从GPT-3到3.5,过程中在预训练的基础上做了很多微调的工作,现在分析是它实现突破或者实现涌现非常重要的一点,您怎么看微调的工作对于后面大模型激发它更多的应用这么一个过程? 卢志武: 我来谈一下个人的观点,ChatGPT确实能力很强,有很多人分析它为什么能力这么强,我觉得要分开看,ChatGPT背后肯定首先有个语言模型及我们把它叫做GPT3.5,这么强首先是这个语言模型足够强,打个比方大学生在大学里面成绩很好,或者能力很强,一定是前面经过初中、高中的基础训练,我们可以认为前面那个基础模型就是我们的通识教育。但是到大学以后,更多的专业知识或者教他更多的东西,微调的步骤很重要,前面3.5那个模型也是特别重要的,两个是缺一不可。 吕伟: 相当于是一个坚实的基础,把它往更加通用专业的领域方面去调整。目前ChatGPT尤其在海外已经非常火了,在我们各自上市公司的领域里面,会率先在哪些方向落地?这是在座的各位最关心的。 刘会福: ChatGPT的应用最近整个网上的资料新闻非常多,创新也都层出不穷,对于像我们这样一家软件公司来讲,我们积极的去做这么一个布局和部署,算是市场上响应比较快的。从整个公司布局上也有幸请到卢志武教授作为软通动力的首席科学家,在大模型这个领域有一个理论的高点,来指导我们。 在场景上来说,我们做过很多的探讨,ChatGPT作为OpenAI的一个实例,首先它是一个To C的东西,大家能够迅速的注册,能够对话,能够使用。对于软通动力公司,我们首先在To C、互联网、文案、咨询这些领域有一些应用,在软通咨询、电商、互联网有实际的案例,律师事务所、会计师事务所这些也是非常好的落地方向,从落地的效果上来说也非常好,对生产力的提升和效率的提升有很大的帮助。 软通本身是一家软件公司,我们的投资人和股东都希望软通能通过这一轮的人工智能实现我们自身的智能化转型,为什么这么说呢?从需求的开发到设计到测试,这些是软件行业最基本的事项,也是软通自己的主业,虽然我们做了很多行业方案,但是最终离不开这一点。 现在等于我们自己在研究基于测试的大模型,在卢教授的指导下也有了一些成绩,在某些客户里面我们开始在测,如果这点能够进一步持续的深耕,对于整个生产的效率会有一个很大的提升,今天早上我们也发了天璇AI Copilot核心引擎。 再往下涉及到行业,在银行、保险、电力这些产业里面我们看到首先在核心知识图谱涉及到知识层面得到应用,行业侧也有了客户的案例,比如保险理赔、保险营销都有一些案例。对于软通动力自身本身也是一个规模较大的企业,我们自身的效率提升也在使用它,我们在人才供给的招聘和自身的财税服务也得到了全面的使用。这块使用之后,对于整个成本的下降和效率的提升也有很大的帮助。
从这三个方面,最终我们还是对整个生产有很大的变化。 因为卢教授的加入,我们在科研侧,比如软通推出数字孪生,在模型的建设、仿真这块会发现建设的效果比我们原来推出的数字孪生的技术有很大的进步,这是在科研侧巨大的变化。 吕伟: 这应该也是第一次向资本市场全面的揭示软通动力拥抱AI具体的战略方向。俞总刚才已经提到不少了,俞总可以系统的介绍一下AI的战略落地吗? 俞珂白: OpenAI ChatGPT出来以后,市场的信息是非常多,我最近每周都会跟硅谷那边开个会,GPT2.0开始,到3.0、4.0,基于它们创业的公司非常多,也已经换方向了,Chat自己的能力非常强,我们现在想干的事以后它帮我们干了,这个也会有很多的冲击,究竟我们能做一件什么样的事,能够在这个基础上可以长久持续保持这样的一种稳定的能力,我们也一直在思考这个事情。 交互的界面很重要,这个是我们在To C端数字人这块的业务。至于它是帮你做各种的角色扮演,你可以自定义它,甚至个人也可以训练它,把它做的更精准、更了解你,这个是一方面我们以C端为主的业务。更主要的是基于传统公司对于建筑、建设,包括媒体这样的一些领域,我们会有比较熟悉的一些场景,或者有一定的知识积累。 在这些当中对于公开的大模型从现在这个阶段,或者从未来一定的阶段上来说还没有那么的精准,现在Chat的做法理论上相当于算是经验主义,专业领域当中没有这么多的数据公布到网上去让它进行学习,不排除未来各种数据打通。 对于一个行业、对于一个企业自身的了解度还是有一定的壁垒和一定的护城河,包括这些数据未来不会公开,或者小模型私有的本地化部署,这个都是我们现在在做的一些事,建筑这个行业,全世界30%的能源是由建筑消耗掉的,这里面有很大的空间怎么样把使用的效率提高,包括很多能源是通过车消耗掉,车的驾驶和车路协同的有效性都可以真正为这个行业,或者为整个的城市、整个的世界降低成本。 我们在模型建模、数字仿真、自动驾驶训练,这些都会用到一些技术,我们本身介入的就是在于以建筑为主,我们叫的是设计行业,在设计行业当中帮助设计师提高效率,或者帮助设计完的成果去更优化的管理,都会有这样的应用场景,而且非常快。对于我们公司本身来说,也有很多的变化,程序员的要求会提高了,相对于简单的程序员,我们可能要调整掉,从现在来看类似于ChatGPT这样的大模型,对于编程代码的审核能力非常强,过往我们很多时候的效率低下的工作都会被它替代掉。 一 个是从行业,一个是从交互界面,一个是从企业本身,都会有很大的应用场景。
吕伟: 千方科技拥有大家最直接能想到的两个最好的卡位:交通大数据和视频数据的入口,孙总您怎么看待千方科技落地的方向? 孙亚夫: 千方科技在人工智能这个领域做得很早。千方科技旗下的宇视科技,是专门做视觉AIOT设备的,我们是从视觉AI开始起的。从OpenAI推出ChatGPT以后,我们还是比较兴奋的,因为我们看到了终于有一个AI可以对这个世界进行理解,它能够跟人进行有效的交互。 年后我们公司对大语言模型AI做了一个整体性的研究,主要有这么几个层面的考虑: 第一,我们现在基本上把AI作为提升我们的项目工程化效率的工具。我们做的很多业务软件系统是To G和To B的业务,尤其在交通板块这块,需要大量的定制开发。这里面用户的需求很多都是在不断地变化,这些需求的变化如果通过纯研发人员的程序研发过程,交付的效率很低。结合人工智能以后,我们在客户前端就可以直接实现快速编码,可以完成快速的交付。 第二,结合我们的应用场景进行AI新产品的开发。千方科技有两类场景,一类是视觉感知有关,这类场景可以举两个比较典型的例子:一个是原来千方跟阿里合作做数字警务室产品,一个片区的警察有很多的视频,我们原来的视觉AI模型可以解决视频数据结构化信息提取的问题。但是我们的警察在使用的时候只会说,帮我找出火车站今天早上某一个时间段可能存在某个特征的一个人。这样一句话,我们希望是通过现在通用人工智能转换成为我们原有业务系统的能力,对我们所构建的视频结构数据库进行搜索,快速给出结论。而不是让警察自己用业务系统,进行一系列复杂的操作查出来。通过AI化现有的业务系统,减少用户的投入,快速实现用户的需求,这个现在是完全可行的。另外一个场景是老人看护场景,现在很多的老人都是空巢老人,我们需要监测老人的行为如:老人是否摔倒了或者有些行为很危险。现在的产品的设置都是很简单的,检测到某个动作就通知你。由于现在的视觉AI模型对世界的理解不够,无法准确的判断行为,你会频繁的接到很多的报警。采用大语言模型AI之后就可以对行为做一个更加精准的理解,并且可以通过AI自动询问老人到底有什么问题,它经过理解以后决定到底要不要报警。 另外一类场景是交通场景,包含交通信号优化、调度的场景,交通运输抓违章运输的场景等等。很多违章运输在原有的视觉AI模型中,判断它到底是违章还是不违章。原来的视觉AI对整个世界没有概念,它不能理解这个世界。采用大语言模型AI之后,可以快速结合场景落地应用。 第三,大语言模型AI就像是一个被培训了很长时间的大学生,有一些专业领域的知识,但是很浅很薄。我们在交通领域干了20年,我们有成套的体系和方法,这些都在我们自己的交通专家脑子里面。我们有这样一支队伍,我们想把这支队伍的知识写成Q/A,形成模板,输入到像人的大语言模型AI或者阿里的大语言模型AI。我们的专家再结合实际的情况进行微调,我们就形成能交通领域的专业大语言模型AI。这个工作我们在做一些尝试。我们也不知道现在它通过专业领域的训练到底能不能达到真正的应用级水平。因为现在行业里面的用户是很专业的,是很挑剔的。结合到千方科技前端的感知设备,我们边侧的智能设备,再加上云端的专业模型,我们有可能会把交通系统变成一个半无人的或者是人来监督的一个自动化运行的系统,这是我们未来研发的目标。
现在我们和阿里的通义千问团队做过沟通,目前是拿一个省会级城市的TOCC来做试点。TOCC有很多的数据,怎么能够让领导直接去问的时候,就能够展现出来他要的那个结果,这是我们想要做的。 吕伟: 谢谢孙总,孙总透露了一个非常重要的干货,因为阿里是我们的股东之一,阿里的“通义千问”在省会城市已经开始落地了。 我们再问卢教授一个很关注的前沿问题,OpenAI的CEO也提到了,大模型从规模的角度到了一个尾声,规模的参数不一定会增大了,您怎么看待这个提法? 卢志武: 这肯定是一个很好的问题,包括我今天跟很多人讨论他们也问到这个问题,所以是个共性的问题。首先在专业的领域里面,称为大模型,至少要到百亿的规模才能叫大模型,如果要涌现能力的话至少有500亿的规模才有涌现能力,实际落地的时候也可以做蒸馏,基础的语言模型要到一定的量级。OpenAI CEO说实际情况可能这样的,已经把互联网上所有能爬的数据全爬了,人类迄今为止积累的所有数据它已经学过了,如果你把模型再增大,数据不够喂它了,翻译过来是这个意思,不是说那个模型就到尽头了,是数据到尽头了。 吕伟: 就是高质量的数据会存在一个瓶颈。我们再问三位领导最后一个问题,也是资本市场最关心的,三位都是在产业的第一线,在您看来ChatGPT大模型也好,最具商业化的、空间最大的,或者让您来投资的话,最佳的投资应用方向只能选一个,到底是哪个方向您最好大模型落地的商业方向和最具投资价值的? 刘会福: 我们的企业实际上在整个场地落地期间实际上也是在筛选,从现在的情况来看,从软通动力结合的业务结构来看,我们现在在金融这个领域是最早跟客户一起尝试,金融恰恰是软通最大的一个行业,金融这块的出现我们会作为一个主要的方向去耕耘。 俞珂白: 我觉得应该是在To C端的应用还是非常看好的,它很多的玩法会彻底颠覆,各种数据交互或者是产生的一些感知,有很多想象空间,像AI+元宇宙等等,这是一个全新的世界,我认为这个是最具备非常爆炸性的投资的机会,这个我觉得是很看好的。对于企业来讲,投会投那些,但是真正要到收入阶段还是要结合自己企业的能力,但是要在C端,国外和国内政策不一样,爆炸指数级还是在C端的应用。孙亚夫: 我觉得从短期来看应该是消费市场,主要表现会是以AI通用智能+专用智能的AIOT设备+消费场景的落地。如果是纯谈AI通用智能的软集成,我是不看好的,因为没有护城河。如果有设备也有可能不仅仅是在国内做,也可以在国外做。通用AI的能力未来会有很多家来做,但是专业的设备+场景落地,这个没有一些年的技术积累和市场的拓展,你是没有办法短期之内做起来的。
第二个是从长期的角度来看,我其实是看好To B行业领域市场。因为行业领域市场会受制于行业本身市场对AI的理解和应用的接受程度。它的渗透没有像消费市场那么快,但是它的门槛是最高的,是很难被跨过去的。吕伟: 孙总短期看好软硬件结合的专用智能设备,长期是在B端行业有护城河的企业里面。
今天因为时间的关系大家还是意犹未尽,再次感谢四位嘉宾,谢谢大家。