来源:至顶网
(资料图片)
PaaS 到底是什么?它从哪里来,将到哪里去?有哪些厂商?国内企业如何选择?
01
第一部分:PaaS 技术的定义
(一)宏观上,PaaS 是处于 IaaS 和 SaaS 之间的平台层。
PaaS,Platform as a Service,平台即服务。它是一种云计算服务,向使用者提供云上应用程序所需的编程语言、库、服务、工具和解决方案。使用者无需管理或控制底层云基础设施(包括网络、服务器、操作系统或存储),但需管理已部署的应用程序,并负责配置应用程序托管环境。在云计算的典型层级中,PaaS 层介于 IaaS 层和 SaaS 层之间。
图1 PaaS 层介于 IaaS 层和 SaaS 层之间
(二)PaaS 服务的三大类划分
为了更好的观察 PaaS 服务的发展,我们将基于以下维度进行 PaaS 服务划分:
aPaaS ,Cloud Application Platform Service,云上应用的开发、部署和运行平台。
数据类 PaaS,进行更深度云上应用开发所需要的 BDPaaS(大数据平台即服务)、DBPaaS( DataBase PaaS ,数据库平台即服务)、 IoTPaaS (物联网平台即服务)、 AIPaaS (人工智能平台即服务)、安全及运维平台即服务等。
其他 Paas 在某些特定场景下发挥价值的平台即服务,比如商业流程管理, RPA 等。
02
第二部分:回顾 PaaS 的发展
PaaS 的发展史,用两句话就可高度概况: PaaS 的发展与云计算的发展相伴相随;aPaaS 代表了 PaaS 的前15年,数据类 PaaS 将成为未来 。
云计算的发端:2006年,Amazon Web Services(中文名:亚马逊云科技)正式推出并商业化
PaaS 的发端:
2007年,Salesforce 发布 force.com,其目的是支持第三方客户在其上开发、部署和管理应用。
此后,同类平台如雨后春笋般发展起来。
2011年,亚马逊云科技发布 Amazon Beanstalk 平台,红帽发布 OpenShift 平台,VMware 发布 CloudFoundry。
2016年,国内 PaaS 平台建设加速。国内科技巨头也开始发力公有云 PaaS,同时也有很多初创型PaaS 服务公司涌现在市场中。
根据《赛迪顾问:2021-2022年中国 PaaS 市场研究年度报告》,aPaaS 在整体 PaaS 市场中应用最多。aPaaS 能够为应用开发和运行提供丰富的组件和环境,帮助企业快速构建应用、智能化管理应用,2021年全球 aPaaS 在整体 PaaS 市场中的应用最多,占比为38.3%。
图2 2021年全球 PaaS 市场产品结构(来源:赛迪顾问)
厂商方面, 亚马逊云科技(Amazon Web Services)是全球 PaaS 市场第一大厂商 ,微软和 Salesfore 紧随其后。亚马逊云科技作为全球云服务领域的头部厂商,利用其在全球的26个地理区域中的84个可用区和300多个边缘节点,能够为全球大部分的国家和地区提供全面的 PaaS 服务,占全球 PaaS 市场规模的18.7%。
图3 2021年全球 PaaS 市场厂商TOP3(来源:赛迪顾问)
在国内 PaaS 市场, 公有云占比高超过60% ,值得一提的是,亚马逊云科技在国内云市场也展现出惊人竞争力。在发展能力方面名列第一、市场地位名列前三。
图4 2021年中国 PaaS 市场厂商竞争力象限分析图(来源:赛迪顾问)
03
第三部分:展望 PaaS 的未来
PaaS 当前的再进化,也可以用两句话高度概况: aPaaS 日臻成熟,向敏捷开发转型;数据类 PaaS 崛起,将很快完成赶超。
赛迪报告也指出“人工智能、物联网、大数据等新一代企业级应用加快迭代和创新也将充分释放 PaaS 的价值并增加对 PaaS 的需求,将带动 AIPaaS、IoTPaaS、DBPaaS 在整个 PaaS 市场的份额进一步扩大。”这种现象是源自用户对产品的更高要求,他们已经不满足于仅使用基础设施与开发工具。激烈的市场竞争与客户需求变化需要 PaaS 的使用者们借助更强大的工具完成自己的业务创新与应用云上应用部署,快速的场景创新需要更加敏捷、可扩展、智能的 PaaS 工具来实现”。
下面我将从数据类服务有哪些、为什么它的发展如此迅速以及它未来的发展趋势,三个方面来分别介绍,我将会以亚马逊云科技产品为范例。
(一)数据类PaaS服务是哪些?
一类是云数据库服务,包括关系型数据库和非关系型数据库,统称为 DBPaaS。
亚马逊云科技提供了八大类十余种数据库服务,如图5所示。
图5 八大类数据库服务(来源:亚马逊云科技官网)
第二类是数据分析即服务。
亚马逊云科技提供了交互式查询、大数据处理、日志分析和搜索分析、实时分析、数据仓库和可视化等数据分析类服务。其中,Amazon EMR 用于大规模数据处理,支持 Hadoop、Spark 等开源处理项目。Amazon MSK 用于实时数据接入与数据管道。Amazon Kinesis 用于实时数据流收集与分析。Amazon OpenSearch Service 是一个基于开源搜索引擎 OpenSearch 的日志分析与搜索分析工具,QuickSight 用于数据可视化。Amazon Athena 使用标准 SQL 即时分析存储在 Amazon S3 数据湖中的数据。Amazon Redshift 数据仓库服务,可以对 PB 甚至 EB 级结构化数据集合执行复杂查询。
图6 数据分析即服务(来源:亚马逊云科技官网)
第三类是人工智能即服务,称为 AI PaaS。
目前,各大公有云都提供了品类丰富的 AI 服务。亚马逊云科技将其服务分为人工智能(AI)服务和机器学习(ML)服务。其中,AI 服务比如文本、图像、视频等处理类服务;ML 服务主要是 Amazon Sagemaker 人工智能平台服务。
图7 人工智能服务家族(来源:亚马逊云科技官网)
把这三大类数据服务合并,加上区块链服务,就是图8的样子。这些服务构成了公有云数据类 PaaS 服务 可能是最齐全 的大家族。
图8 数据类 PaaS 服务家族(来源:亚马逊云科技官网)
云数据库类服务大家都比较熟悉,无需赘述。数据分析类服务和人工智能服务,两者之间是什么样的关系呢?实际上,两者之间不是孤立的,而是存在紧密的联系。主要有两种关系:
一种是数据分析与人工智能联动。
此类场景中,数据分析服务对源数据进行收集、筛选和清洗,并将处理后的数据作为人工智能服务的训练数据,最后产生推荐模型和部署为推荐服务。这种关系比较常见。
图9 数据分析服务于人工智能(来源:亚马逊云科技官网)
另一种是人工智能与数据分析集成。
多数的数据分析服务都集成了人工智能服务,比如 Redshift ML、Athena ML、Quicksight ML 等服务。以发布于2021年5月的 Amazon Redshift ML 服务为例,它底层基于 Amazon SageMaker 服务,让用户能够用 SQL 命令创建、训练、部署和使用机器学习(ML)模型。
图10 Amazon Redshift ML 服务(来源:亚马逊云科技官网)
如上图所示,数据进入 Redshift 数仓以后,用户可直接在 SQL 语句中使用‘create model’命令来创建机器学习模型。然后,Amazon Sagemaker 自动创建和训练出 ML 模型并进行部署,然后用户可以使用 SQL 语句来进行预测性查询。
(二)为什么未来数据类 PaaS 将异军突起甚至超越 aPaaS?
在赛迪顾问的“2021年全球 PaaS 市场产品结构”图(图2)中,这三类 PaaS 分别被称为 DBPaaS、BDPaaS和 AIPaaS。从全球份额上看,三者的份额加起来都没有 aPaaS 多。那为什么未来数据类 PaaS 将异军突起甚至超越 aPaaS 呢?主要原因有三:
1.先做应用建设,再增加数据服务,是几十年来的普遍 IT 规律。
过去还没有出现云服务的年代,应用都是传统式的。企业往往是先自己开发或购买应用,随后开始支撑业务。随着时间的推移,用户越来越多,数据库中就有了越来越多的数据。此时,企业往往会购买专业的数据分析类软件用于数据分析,那时候主要是制作给领导看的各种报表。但这种数据分析软件,往往都庞大而笨重,成本非常高,价格动辄千万级别。
有了公有云服务后,企业首先在公有云上建设一个应用。搭建过程中,可利用到云上各种服务,实现应用的快速构建,用亚马逊云科技的话说,他们负责做积木(Block),企业的工作就是搭积木(Build)。应用投产并得到验证后,企业会继续对应用做改造和扩充。此时用户越来越多,数据也越来越多,因此需要数据治理平台,可能是 S3 这样的对象存储,也可能是 Redshift 这样的数仓,执行简单的命令,就可以立即得到业务洞察,直接反哺业务。要进行预测的话,还可以利用人工智能服务。可见,用更少的钱,以非常小的起点,就可以获取之前上千万美金才能获取的能力,这就是公有云上的优势。
因此,无论是过去还是以前,先搭建应用,再做数据分析,直到人工智能,这是 IT 业务的基本旅程。aPaaS 的主要使命是为了开发者更便捷地搭建、发布和运行应用,而各种数据类 PaaS 则服务于数据分析和人工智能。
2.业务持续数字化转型,数据量越来越大,对数据服务的要求越来越多,也越来越高。
业务数字化的核心是数据驱动。业务数字化,带来数据量指数型增长,企业对数据存储和计算分析的能力要求不断提升。
一方面,云关系型数据库高速发展。 云上数据库性能和便捷性越来越高,而成本却越来越低。以 Amazon Aurora 为例,它是与 MySQL 和 PostgreSQL 兼容的关系数据库。性能和可用性与商用数据库相当,成本只有其 1/10,还大大减轻运维负担,节省运维成本。
另一方面,由于大数据、物联网、机器学习等应用场景的兴起, 非关系型数据的数据量和处理需求增长速度高。 Gartner 数据显示,2021年非关系型数据库的市场收入达到148亿美元,占总体数据库市场的19%。2017年时,这一比例仅为8%。
从图11可以看出,云上数据库在整个数据库市场的比例逐年快速上升。本地数据库和云上数据库的市场份额已经非常接近,到2021年,已经达到49%。按此趋势,今年(2022年)云数据库市场必将超过本地数据库。
图11 2017到2021年本地和云数据市场份额
3.新一代数字应用的出现,催生了数据类 PaaS 服务的需求。
人工智能、物联网、大数据、区块链等新一代企业级应用的加速迭代和创新,将充分释放 PaaS 的价值并增加对 PaaS 的需求,尤其是将带动 AIPaaS、IoTPaaS、DBPaaS 等数据类 PaaS 服务在整个 PaaS 市场的份额进一步扩大。
这种现象,一方面是源自用户对产品的更高要求,他们已经不满足于仅使用基础设施与开发工具。另一方面是面对激烈的市场竞争与客户需求变化,他们需要借助更强大的工具来完成自己的业务创新与应用云上应用部署,这都需要更加敏捷、可扩展、智能的、数据驱动的 PaaS 服务来实现。
(三)数据类 PaaS 服务的两个发展趋势
趋势一:一体化
所谓一体化趋势,是指数据库服务、数据分析服务和人工智能服务构成了一个完整闭环。 如图12所示,人、应用程序和设备作为数据源产生数据,原始数据进入数据湖,作为机器学习类服务和数据分析类服务的数据源,它们处理后的数据被保存进关系或非关系型数据库中。此类数据再反哺人、应用程序和设备,比如提供数据报表、画像标签、分析预测等能力,从而促进业务数字化水平,并完成数据处理闭环。
图12 数据闭环
这种闭环模式,对公有云平台提供商提出了高要求。他们不能再孤立地对待这些服务,而需要打通服务边界,建立数据自由流通的渠道,这反过来又要求打通企业的部门墙,实现数据服务一盘棋。
趋势二:无服务器化(Serverless)
下表是亚马逊云科技已有 Serverless 服务列表。可以看出,过去很长一段时间里,Serverless 工作主要还是在 aPaaS 和 DBPaaS 领域。笔者大胆预测,这两个领域的 Serverless 化工作接近完成,接下来数据分析和人工智能服务的 Serverless 化将是他们的工作重心。
图13 Amazon Serverless 服务
关于大数据分析的无服务器架构(Serverless),值得一提的是,在7月12日 Amazon Redshift Serverless 正式上线,带上之前已上线的 Amazon MSK Serverless 上线(4月),Amazon EMR Serverless 上线(6月),和原本就是serverless 架构的 Amazon Kinesis。亚马逊云科技已经率先在数据分析 PaaS 服务领域实现了数据仓库、大数据平台、流式数据分析的全方位无服务器化。趋势是不可逆的。
关于服务 Serverless 化的有三个直接好处:节省成本、降低技术和管理负担,以及加快应用交付速度,和两个间接好处:讨好用户,以及施压追随者。相信后续有越来越多的 Serverless 化数据分析和人工智能服务推出。
04
第四部分:PaaS 再进化之背景下,国内企业的应对之策
前文厘清了 PaaS 的概念,阐述了 PaaS 的发展趋势。 过去,是得 aPaaS 者得 PaaS 天下,而未来,则是得数据类 PaaS 者得 PaaS 天下。 在 PaaS 这种进化背景下,我们再来看看各类企业的应对之道。这里主要针对国内企业。
首先说说大中型传统企业。
国内大中型传统企业,很大部分都已完成 IaaS 云平台的建设,企业上云(应用从小机搬到 x86 或信创虚拟机上)业已完成过半甚至更多。往往都设立了大数据部门,建设了大数据平台。但是,大数据平台和云平台无论在组织结构上还是基础设施上都是分离的,两者井水不犯河水。大数据平台基本上都是池化的,买几千台服务器搞个大池子,提供的基本上是人机交互式接口。
很显然,这种模式很难满足这些企业未来的数字化要求。笔者建议做如下改变:
将大数据平台和云平台合并,由合并后新云平台提供服务化的数据分析服务,从而实现大数据平台由池化和工具化,向云化和服务化的转变。
将大数据部门和云计算部门合并,大数据团队成为云计算团队的一部分,即大数据团队成为云计算部门中的数据 PaaS 团队。
图14 大型传统企业的 PaaS 转型
再来说说国内公有云厂商。
国内几个大型公有云厂商,近年不约而同地宣告要把发展 PaaS 作为未来的重点发力方向。那么,根据前述观点,他们需把工作重心放到 Serverless 化的数据类 PaaS 服务上。笔者多个深度使用国内公有云服务的朋友都反馈,国内公有云的 IaaS 服务离与海外巨头的距离其实不大,但数据分析和人工智能类服务的差距还相当大。
再说说国内行业云提供商。
国内行业云提供商很多,但似乎没几家真正成气候的。从 IaaS 角度,行业云的产品和市场实力、规模自然没法和大型公有云相提并论,因此,只拼 IaaS 那肯定是拼不过的。那就只能在 PaaS 和 SaaS 上发力了。
从 PaaS 角度,行业云要将其行业属性注入,尤其是要注入数据类 PaaS 服务。看到有好几家行业云,主要还是做卖 IaaS 生意,数据分析服务没有,人工智能服务没有。没有带有行业属性并且自己大规模深度使用的 PaaS 服务,那行业云就无法成为真正的行业云。
最后说说中小企业。
上公有云是中小企业的最佳选择。企业创立之初,就能利用到业界最新最领先的云服务,包括 PaaS 服务,聚焦业务发展,这在没有公有云的年代是难以想象的。根据前面提到的 IT 旅程,由应用创建开始,到数据分析,到人工智能,充分利用云上的各种服务,打造先进的云原生应用系统,为业务发展提供灵活而强大的支撑力和驱动力。
05
第五部分:小结
综上所述,PaaS 现阶段的进化路径,是在由 以面向开发的 aPaaS 服务为中心向以数据类 PaaS 服务为重心发展 。 并借助像亚马逊云科技这类在机器学习、数据库、物联网、容器、云安全等方面具有较强的技术创新能力的公有云厂商,能够更好帮助企业进行应用开发、部署和管理。
这种进化趋势,和时下流行的数字化转型密不可分。数字化转型以业务模式转型和业务流程效率提升为目标,以 IT 技术作为支撑,是 IT 技术的综合运用,“以云为体,数智为用”,即以云为体系和基座,以人工智能、大数据、区块链等 IT 技术的综合运用来解决系统化问题。曾经有一位领导问我,数字化应用到底是什么样的。我回答道,通常来说,使用大数据服务和人工智能服务越多的应用,其数字化程度往往越高。下面的曲线可能不太精确,但笔者坚定地认为,数据类 PaaS,特别是数据分析和人工智能类服务,是提升业务数字化水平的利器。
图15 数据类 PaaS 服务的运用和业务数字化水平之间的关系
PaaS 的这次进化,不是以人的意志为转移的,而是和这轮企业业务数字化转型发展大潮密不可分。
附录:
附表1:PaaS 的分类(来自Gartner)
笔者把 Gartner 定义的 aPaaS 看作 狭义 aPaaS 。 广义 aPaaS 应包含更多的内容,具体见附表2。
附表1非常有助于我们了解到底有哪些 PaaS 服务,而附表2将这22个 PaaS 服务基于三大类进行了重新划分:
附表2 PaaS 服务大类
免责声明 : 本号所载内容为原创/投稿/授权/公开资料整理,仅供读者个人学习研究。版权归作者及源出处所有,仅代表作者个人观点,与本号立场无关。若所引用的内容来源标注有误或涉及侵权,请及时联系处理。