来源：ScienceAI
近年来，在多种因素的推动下，机器学习 (ML) 经历了快速转型和采用。

(资料图片仅供参考)

关于人工智能（AI）和 ML 为什么会不断发展，有很多观点。麦肯锡最近的一份报告将 ML 的工业化和应用 AI 确定为今年的主要趋势之一。在本周 AWS re:Invent 大会的一次会议上，亚马逊（AWS）人工智能和机器学习副总裁兼总经理 Bratin 概述了这家云巨头看到的六大关键趋势，这些趋势有助于推动 2022 年及以后的创新和采用。

AWS 声称其 AI/ML 服务拥有超过 100,000 名客户。这些服务分布在三个层级：ML 基础设施服务，使组织能够构建自己的模型；SageMaker，提供构建应用程序的工具；以及针对特定用例的专用服务，例如转录。

「机器学习已经从一项小众活动转变为公司开展业务不可或缺的一部分，」Saha 在会议期间说。

趋势一：模型复杂性不断提高

Saha 说，近年来 ML 模型的复杂性呈指数级增长。他对「指数」一词的使用也不夸张。

衡量机器学习模型复杂程度的一种方法是计算其中的参数数量。Saha 解释说，参数可以被认为是嵌入在 ML 模型中的值变量。Saha 说，2019 年，当时最先进的 ML 模型大约有 3 亿个参数。快进到 2022 年，最好的模型现在已经超过 5000 亿。

「换句话说，在短短三年内，机器学习模型的复杂程度增加了 1600 倍，」Saha 说。

这些庞大的模型现在通常被称为基础模型。使用基础模型方法，可以使用海量数据集对 ML 模型进行一次训练，然后针对各种不同的任务进行重复使用和调整。因此，企业可以通过更易于采用的方法从日益复杂的过程中受益。

「[基础模型] 将机器学习的成本和工作量降低了一个数量级，」Saha 说。

趋势二：数据增长

越来越多的数据和不同类型的数据被用于训练 ML 模型。这是 Saha 确定的第二个关键趋势。

组织现在正在构建经过结构化数据源（如文本）以及非结构化数据类型（包括音频和视频）训练的模型。能够将不同的数据类型放入 ML 模型中，这导致 AWS 开发了多种服务来帮助训练模型。

Saha 强调的一种此类工具是 SageMaker Data Wrangler，它可以帮助用户使用一种使其适用于 ML 训练的方法来处理非结构化数据。本周在 re:Invent 大会上，AWS 还在 SageMaker 中添加了对地理空间数据的新支持。