来源 | 追一科技
1、里程碑事件, 语言空间复杂度更大,一分钟语音接近200个字的生成(常用汉字3500个,3500^200次方=10^700),比围棋(10^171次方)复杂10^530次方倍。
(资料图)
2、ChatGPT是想象力、产品力、工程力融合的胜利。 它创新定义了产品形态和待解决问题,基于已知的技术原理,不断工程化与工艺打磨取得成果。20年基于大模型高昂的训练和预测成本考虑,业界曾经产生反思是否更为精巧设计的中小模型是未来发展方向,ChatGPT的想象力在于坚持探索和使用大模型,最终通过人类导师的引导,发现了激发大模型潜力的方法,实现了量变到质变的智能水平。这里得益于一批综合能力非常强,且不为五斗米折腰的牛人,以及非常不差钱的创新氛围和经济环境基础。
3、ChatGPT很好解决了语言组织的问题 , 体现语言理解和表达的能力,进一步通过思维链、跨语言、“跨界”的知识融合,部分解决了知识理解和推理的问题,但在部分深度问答情形下也会出现一本正经胡说八道的bug。
4、 语言是知识的载体,代表着人类群体智能,每个人只是一个agent,语言体系构建了人类智能协同与迭代的天花板。 人类基于社会性的知识传播和融合,使得人类文明爆炸式发展,ChatGPT在一定程度上重现了这一点, 跨界跨语言的知识融合在一起训练,产生出意想不到的能力“外推”,是ChatGPT最惊艳的地方之一。在搜索引擎中,每一个网页是独立存在的,未实现知识融合,所以在机制上ChatGPT比搜索引擎更加高效。
5、 ChatGPT的惊艳效果体现在语言理解和表达,以及足够多的知识, 知识的深度和广泛性决定了系统的难度与复杂度。 大厂对标完整复制ChatGPT,创业公司可以基于语言理解、表达的组织能力再结合领域内知识的形式复制,形成领域或者行业ChatGPT。
6、ChatGPT出现之前技术最复杂的是搜索引擎系统,除了网页搜索引擎之外,各家大厂都有面向自有数据的专门的搜索引擎。类似的后续也是 不同业务会有专门的ChatGPT。 网络结构和参数层面的深度耦合的方式优于用Prompt机制的浅度耦合方式。
7、ChatGPT的商业化需要考虑成本的经济性。 比如一通电话涉及到ChatGPT的成本预计在RMB几毛钱,有机会做到和通话通讯费用接近。大部分成本在于工艺成熟完善以及离线系统的运行,相对而言,目前更适合规模化的场景比如搜索、推荐等,专业场景的模型打磨和系统构建成本当前还比较高。
8、NLP企业软件市场可能会重新洗牌, 国内人力成本便宜,应用层开发、NLP入门门槛低等因素导致了市场割裂和厂商分散。比如除了大型客户业务量巨大对准确率效果指标有比较高的要求外,很多腰部客户的业务量不大对准确率效果指标要求不高。ChatGPT所涌现出的理解和表达智能水平效果指标腰部客户也需要,与此同时集中构建行业大模型会替代当前小模型的构建成本,拥有ChatGPT能力的公司毛利水平会更高,但ChatGPT的入门门槛很高类似无人驾驶级别的难度水平。
9、软件行业的核心逻辑变化,带来洗牌机会。 语言是复杂的问题得到了突破,软件从人类员工为中心逐步转变为AI员工为中心,软件核心将从依赖于流程和管理,转变为依赖于AI大模型,类似于传统汽车从依赖发动机,发展到新能源汽车依赖电池技术。在此之前,流程和管理类传统软件特别是国外软件优势非常强很难超越,而AI大模型驱动的软件有机会翻牌,弯道超车。
10、ChatGPT一类的大模型技术,当前仅限解决自然语言类的问题,未来很可能会被其他行业所借鉴。 比如生命科学、材料学、自动驾驶等,实现跨界的变化。大模型之所以能带来优势的本质,其实与这些行业基础技术是相通的。
综上,ChatGPT带来的底层技术革命影响巨大和广泛,不会一家独大赢家通吃,与此同时技术壁垒和门槛的原因不会出现红海竞争。各行各业都有机会抓住ChatGPT的技术红利。
最后,败不馁,胜不骄。互联网早期面临网页搜索和基础设施的困难与挑战不弱于今天所面临ChatGPT的挑战。当时的人才密度远不比今天,所以以今天的积累有理由坚信国内ChatGPT突破很快会来临。