机器学习三个时代的计算趋势

来源：AI前线

作者：Annu Kumari

译者：Phoenix

策划：凌敏

决定现代机器学习发展的三个基础是计算、数据和算法进化 (ML，机器学习)，本文着眼于最易量化的元素的趋势。

在 2010 年之前，训练计算的发展与摩尔定律同步，每两年一翻；自 2010 年代初，引入深度学习以来，训练计算的速度已经加快，大约每六个月增加一倍；2015 年末，出现了一种新的趋势。

基于这些观察，机器学习的计算历史被划分为三个时代—— 前深度学习时代、深度学习时代和大规模时代。本文总结了用于训练高级机器学习系统快速增长的计算需求。

趋势

比较是在一个由 123 个里程碑式的机器学习系统组成的数据集上进行的，并标注了训练它们所需的计算量。在深度学习起步之前，有一段进展缓慢的时间，这种趋势在 2010 年加速，此后一直没有放缓。另外，在 2015 年和 2016 年，出现了大规模模型的新趋势，以比上一个时代快两个数量级的速度扩张。

来源: https://arxiv.org/pdf/2202.05924.pdf

过渡到深度学习

在深度学习出现之前和之后，人们注意到了两种不同的趋势机制。

此前，训练机器学习算法所需的算力是每 17 至 29 个月翻一番。之后，整体趋势加快速，每 4 到 9 个月翻一番。

根据摩尔定律，晶体管密度每两年翻一番（Moore，1965 年），通常简化为计算性能每两年翻一番——基本上符合前深度学习时代的趋势。目前尚不清楚深度学习时代何时开始，从前深度学习到深度学习时代的过渡没有明显的间断。此外，无论深度学习时代始于 2010 年还是 2012 年，结果几乎都不会改变。

来源：https://arxiv.org/pdf/2202.05924.pdf

大规模深度时代的趋势

数据显示，大规模型模型的新趋势始于 2015-2016 年，这种新趋势始于 2015 年底的 AlphaGo，一直持续到现在，大规模模型是由大公司训练的，更高的训练预算可能是打破先前的趋势的原因。

另外，常规规模模型受欢迎的程度并未受到影响，这一趋势在 2016 年之前和之后是相同的速度，每 5 到 6 个月翻一番，如下表所示。大规模模型的计算量增加的趋势明显放缓，每 9 到 10 个月翻一番。由于这些模型的数据有限，明显放缓可能是噪声的结果。

这一发现与 Amodei & Hernandez (2018) 和 Lyzhov (2021) 形成对比，前者发现 2012 年至 2018 年的倍增期为 3.4 个月，后者发现 2018 年至 2020 年的倍增期超过 2 年。以前的评估无法区分这两个独立的模式，因为大规模的趋势是最近才发展起来的。

来源：https://arxiv.org/pdf/2202.05924.pdf

结论

研究结果与早期研究一致，这显示了训练计算更适度的规模。1952 年到 2010 年有 18 个月的倍增时间，2010 年到 2022 年有 6 个月的倍增时间，从 2015 年末到 2022 年的大规模新趋势，快了 2 到 3 个数量级，倍增时间为 10 个月。

总而言之，在前深度学习时代，计算进展缓慢，随着 2010 年进入深度学习时代，这种趋势加速了。在 2015 年底，企业开始生产优于趋势的大规模模型，如 AlphaGo，标志着大规模时代的开始。然而，这并不能确定区分大规模和常规规模的模型而形成模式。

在计算机教学中，硬件基础设施和工程师的作用越来越大，凸显了两者的战略必要性。获得巨大的计算预算或计算集群，以及应用它们的专业知识，已经成为前沿机器学习研究的代名词。

声明 来源 ：AI前线 ， RAD极客会推荐阅读，不代表RAD极客会立场，转载请注明，如涉及作品版权问题，请联系我们删除或做相关处理！

推荐内容

机器学习三个时代的计算趋势

用友商旅云：重构商旅服务，助力企业数智化创新

为企业出海“搭桥”，汇量科技靠什么出圈？

与「看不见的手」掷骰子的人

无代码AI营销平台Mutiny完成5000万美元融资，老虎全球基金、Insight Partners领投

上海联通等一等，兄弟公司爱心物资运来啦！克服物流受阻困难！

5G分流比，这里率先突破40%！

联通被判侵权！排超联赛IPTV侵权“第一案”！

安华金和&OceanBase打造数据库安全联合解决方案

60岁华裔数学家将在美接受审判，被指控7项重罪，可能面临最高20年监禁

中国移动：一季度净利256亿元 同比增长6.5%

创维将推出超短焦VR一体机、AR眼镜Viture开启众筹、HTC推特流出新产品......

安吉星手机应用APP迎来10.0重磅升级

美国窃密全球的主战装备被我国曝光！国产化和自主可控是应对王道

Oracle数据库机：让数据价值回归用户“第一性原理”

阻止“TA们”监听你，AI能做到吗？

超算云如何登上“东数西算”的快车

​对于现阶段GameFi发展而言，兼容EVM重要吗？

多家平台宣布，将上线显示用户IP属地功能

Omdia观察：沃达丰推出基于区块链的平台来推动物联网经济

丰田再次宣布停产，5月全球销量将为75万辆

合其家物物地图走进社区，林昕杨提出的“两圈融合”首站落地福州

继物物地图之后，合其家集团董事长林昕杨推出运营增效新模式

又闯红线？中国联通某分公司因违法行为被警告

为了保护隐私？谷歌安卓商店颁布新规定：通话录音软件全凉了

建议赶紧升级！微信安卓版迎来重大更新：瞬间释放大量存储空间

获国家级认可，畅捷通入选2021年“中小企业数字化转型典型案例”！

三家运营商一季度业务喜提“开门红”

中广电移动两家分公司成立！

“携号转网”两年多，你后悔了吗？

收购拍乐云，布局音视频，钉钉上演迷踪拳还是组合拳？

百度再战社交，语音比元宇宙有机会？

Meta VR游戏展再临，多人VR游戏春天要来了？

知乎回应裁员40人：视频业务上没有裁员计划

网传小红书裁员，知情人称年度考核优化，裁员比例未超10%

多名专业剪辑师联名发布公开信：指责苹果Final Cut Pro“太落伍”

三大特色服务加持，合其家集团董事长林昕杨物物地图地图更多使命

解放周报 | 湖南：总投资52.5亿元！长沙发布193个智慧城市场景、海南：数字化赋能，感受海南“住”“行”“云生活”等

美丽天天秒2+1模式APP系统制度

一家SaaS公司的营收能力如何？就用这个模型来衡量

IDC：增速、规模双新高，2021 年中国 IT 安全软件市场同比增长 31.7%

盘点中国互联网的“第一股”

SaaS 长河下，AfterShip 技术升级的“加减法”

真正的“线上办公”到来后，游戏公司们还习惯吗？

视频号到底能为腾讯赚多少钱？

物联网安全市场高速发展 网络安全和漏洞的威胁也越来越大

凯文教育：与腾讯云、科诚数科签订《战略合作框架协议》

小红书被曝裁员20%，裁员信息上微博热搜

中央部委首提元宇宙，多地政府超前布局

AI有声书《智能交通》上线 李彦宏300句话生成20万字语音作品

机器学习三个时代的计算趋势

新中产钱包缩水，谁来圆蕉下的lulu梦？

融资丨「数派跨境」完成近千万元天使轮融资，领星集团独家投资

融资丨「寓科未来」完成D+轮融资，清华x-lab创业DNA基金、启恒产业投资基金加持

英国石油巨头与澳大利亚电动汽车充电桩签订多年期合同

融资丨「小森日禾」完成数百万元天使轮融资，睿鼎资本独家投资

与「看不见的手」掷骰子的人

为企业出海“搭桥”，汇量科技靠什么出圈？

用友商旅云：重构商旅服务，助力企业数智化创新

无代码AI营销平台Mutiny完成5000万美元融资，老虎全球基金、Insight Partners领投

第一波“刘畊宏女孩”已经受伤了

60岁华裔数学家将在美接受审判，被指控7项重罪，可能面临最高20年监禁

超算云如何登上“东数西算”的快车

中国移动：一季度净利256亿元 同比增长6.5%

安吉星手机应用APP迎来10.0重磅升级

阻止“TA们”监听你，AI能做到吗？

Omdia观察：沃达丰推出基于区块链的平台来推动物联网经济

丰田再次宣布停产，5月全球销量将为75万辆

安华金和&OceanBase打造数据库安全联合解决方案

​对于现阶段GameFi发展而言，兼容EVM重要吗？

Oracle数据库机：让数据价值回归用户“第一性原理”

5G分流比，这里率先突破40%！

上海联通等一等，兄弟公司爱心物资运来啦！克服物流受阻困难！

创维将推出超短焦VR一体机、AR眼镜Viture开启众筹、HTC推特流出新产品......

美国窃密全球的主战装备被我国曝光！国产化和自主可控是应对王道

联通被判侵权！排超联赛IPTV侵权“第一案”！

多家平台宣布，将上线显示用户IP属地功能

当下自动驾驶商业化落地过程中的五大难点

声明
来源：AI前线， RAD极客会推荐阅读，不代表RAD极客会立场，转载请注明，如涉及作品版权问题，请联系我们删除或做相关处理！

中国移动：一季度净利256亿元同比增长6.5%

对于现阶段GameFi发展而言，兼容EVM重要吗？

物联网安全市场高速发展网络安全和漏洞的威胁也越来越大

AI有声书《智能交通》上线李彦宏300句话生成20万字语音作品

中国移动：一季度净利256亿元同比增长6.5%

对于现阶段GameFi发展而言，兼容EVM重要吗？

石头科技披露2021年年报及2022年一季报净利润14.02亿元

苹果推出iPhonePayPay防欺诈功能向所有Wallet用户发布通知

物联网安全市场高速发展网络安全和漏洞的威胁也越来越大

AI有声书《智能交通》上线李彦宏300句话生成20万字语音作品

诺基亚：到2025年SaaS市场规模达31亿美元可助CSP大幅降低IT支出