4月6日,Google云发起牵头成立了“云数据联盟”,联合了包括数据库、流处理、数据湖仓、图数据库、数据接入、数据虚拟化、搜索分析引擎、机器学习工具等头部软件厂商,参与方还有两家在美国领先的系统集成商。这是一个很典型的“云平台+领域技术+咨询集成服务”的产业联盟组合,可以看成是当前“企业数据平台”(大致相当于国内说的“数据中台”,在此不做概念辨析了)的供应方典范。
最近跟好几位国内的业界人士(行业内头部创业公司的创始人)交流,他们都说“数据中台”是个泥潭,整个行业模式出问题了: 从业人员苦逼难做,资本投入打水漂,企业用户满意度低。
业内人士对“数据中台”的普遍反应是:这个东西其实是一个数据相关的技术开发底座,是给工程师和科学家用的,没有面向业务人员的应用,所以不能直接给业务部门解决具体问题,导致企业管理层看不到这个东西的业务价值; 另一方面,某行业内公司创始人说: “中国的技术人员的钱是很难挣到的”。
数据中台的行业乱象其实反映了中国整个“企业IT”产业存在的问题,这已经不是在这个产业里的某个企业存在的问题,而是中国产业链和美国产业链存在着巨大不同。我详列比较如下:
在中国的产业和市场环境下,表象是:缺乏具备专业能力深度的供应商,前面提到的在美国市场上,数据湖仓公司Databricks的估值高达380亿美元,以SaaS模式提供的数据接入工具的Fivetran估值都高达近60亿美元,而中国市场上获得了大量融资的“数据中台”供应商,大多提供无所不包的解决方案, 看起来是产品商,其实是服务商 ,其市场价值比美国的专业产品公司相差甚远。
也不能怪中国的技术创业者们不努力,996得还不够,因为中国企业IT产业的特质为他们发展造成了巨大障碍,主要有四:
一、云和生态
当前在美国市场上对企业数据平台和数据分析应用需求的爆炸式增长,是跟企业越来越多地把企业应用系统、业务系统、物联网系统(例如制造业的工业互联网平台)放到云上去,或者使用云服务、第三方大数据服务分不开的,正是因为数据分布在不同的云上,出现了“数据网格”、“ 数据经纬(data fabric) ”等新一代分布式数据管理的架构或方法,这就出现了具有互联网时代的去中心化特征的技术供应商生态,优秀创业公司不断涌现。
下面是两个美国数据平台技术供应商生态地图例子:
来源 https://lakefs.io
来源 https://7wdata.be
中国的 “ 中 ” 字就代表了中心化,这也许是中国企业与生俱来的基因吧,中国企业上云率和美国相比低很多,不愿意把数据放在企业控制力之外的云上,都希望自己建、自己用、自己拥有、自己能控制的平台,找供应商也希望有一家能拥有所有技术。
所以在中国市场上,很少有上图那样细分的技术提供商,为了不错失生意机会,大多数技术供应商都给自己贴个笼而统之的标签:我是干“数据中台”的。
二、平台竞争和垄断
即使企业上云,每个主题领域的数据技术供应商在云平台上提供服务,其实跟卖衣服、卖化妆品的商家在天猫、京东平台上开店的道理是一样的,平台运营方的盈利模式如何保障?平台自营和入驻商家之间的利益怎么平衡?
电商平台之间怎样开展竞争流量,中小商家如何在平台上生存并盈利呢,中国的电商平台已经在过去几年给出了答案,可以预见到数据中台创业公司们在中国各个云平台上的命运。
三、企业的数字化运营能力
企业应用数据来支持业务是一种组织能力,“数据是新石油”、“数据资产”的道理虽然被越来越多的中国企业接受,然而,要建立起包括产品经理、数据架构师、数据工程师、数据科学家、数据分析师、数据治理管理员等一系列组织角色,建立起数据从源头到消费的运作流程和工程能力(如下图所示) ,对大多数中国企业来讲都是个挑战; 企业自己管数、 用数 能力不具备时,工具需求也跟不上。
来源 : https://towardsdatascience.com
四、市场营销和咨询牵引
在数据平台对企业用户的影响上,美国市场上主导舆论的是专业中立技术咨询机构,例如Gartner,最近的Data Fabric也是Gartner提出的,以及保持供应商中立的技术实施公司、系统集成商和管理咨询公司。
然而中国企业IT市场却是先天不足,没有产生权威的技术咨询机构、咨询能力强的管理咨询机构或者强大的本土系统集成商,很多做中台的系统集成商由于艳羡产品的高毛利和资本市场价值,在给客户做项目时,就把自己这个项目里的开发产出,包装成“产品”卖给下个客户,破坏了行业生态。而大的云平台厂商则掌握了市场上的主流话语权,又恰逢最近几年中外地缘政治摩擦,国外云服务及数据技术进入中国进度放缓,于是市场上名词乱飞,恶性竞争,玩家互害……
我个人很支持国产软件厂商,但是数据中台国产化这个行业,现在真的很难,快被玩坏了。最后放张国产软件厂商全景图,大家觉得哪家能在“数据中台”这条跑道里跑出来?