焦点热讯:Batch大小不一定是2的n次幂！ML资深学者最新结论_中国智能在线

Batch大小不一定是2的n次幂？

(相关资料图)

是否选择2的n次幂在运行速度上竟然也相差无几？

有没有感觉常识被颠覆？

这是威斯康星大学麦迪逊分校助理教授Sebastian Raschka （以下简称R教授）的最新结论。

在神经网络训练中，2的n次幂作为Batch大小已经成为一个标准惯例，即64、128、256、512、1024等。

一直有种说法，是这样有助于提高训练效率。

但R教授做了一番研究之后，发现并非如此。

在介绍他的试验方法之前，首先来回顾一下这个惯例究竟是怎么来的？

2的n次幂从何而来？

一个可能的答案是：因为CPU和GPU的内存架构都是由2的n次幂构成的。

或者更准确地说，根据内存对齐规则，cpu在读取内存时是一块一块进行读取的，块的大小可以是2，4，8，16 （总之是2的倍数）。

因此，选取2的n次幂作为batch大小，主要是为了将一个或多个批次整齐地安装在一个页面上，以帮助GPU并行处理。

其次，矩阵乘法和GPU计算效率之间也存在一定的联系。

假设我们在矩阵之间有以下矩阵乘法A和B：

当A的行数等于B的列数的时候，两个矩阵才能相乘。

其实就是矩阵A的第一行每个元素分别与B的第一列相乘再求和，得到C矩阵的第一个数，然后A矩阵的第一行再与B矩阵的第二列相乘，得到第二个数，然后是A矩阵的第二行与B矩阵的第一列……

因此，如上图所示，我们拥有2×M×N×K个每秒浮点运算次数（FLOPS）。

现在，如果我们使用带有Tensor Cores的GPU，例如V100时，当矩阵尺寸（M，N以及K）与16字节的倍数对齐，在FP16混合精度训练中，8的倍数的运算效率最为理想。

因此，假设在理论上，batch大小为8倍数时，对于具有Tensor Cores和FP16混合精度训练的GPU最有效，那么让我们调查一下这一说法在实践中是否也成立。

不用2的n次幂也不影响速度

为了了解不同的batch数值对训练速度的影响，R教授在CIFAR-10上运行了一个简单的基准测试训练——MobileNetV3 （大） ——图像的大小为224×224，以便达到适当的GPU利用率。

R教授用16位自动混合精度训练在V100卡上运行训练，该训练能更高效地使用GPU的Tensor Cores。

如果你想自己运行，该代码可在此GitHub存储库中找到（链接附在文末）。

该测试共分为以下三部分：

小批量训练

从上图可以看出，以样本数量128为参考点，将样本数量减少1 （127）或增加1 （129），的确会导致训练速度略慢，但这种差异几乎可以忽略不计。

而将样本数量减少28 （100）会导致训练速度明显放缓，这可能是因为模型现在需要处理的批次比以前更多（50,000/100=500与50,000/128= 390）。

同样的原理，当我们将样本数量增加28 （156）时，运行速度明显变快了。

最大批量训练

鉴于MobileNetV3架构和输入映像大小，上一轮中样本数量相对较小，因此GPU利用率约为70%。

为了调查GPU满载时的训练速度，本轮把样本数量增加到512，使GPU的计算利用率接近100%。

△ 由于GPU内存限制，无法使用大于515的样本数量

可以看出，跟上一轮结果一样，不管样本数量是否是2的n次幂，训练速度的差异几乎可以忽略不计。

多GPU训练

基于前两轮测试评估的都是单个GPU的训练性能，而如今多个GPU上的深度神经网络训练更常见。为此，这轮进行的是多GPU培训。

正如我们看到的，2的n次幂（256）的运行速度并不比255差太多。

测试注意事项

在上述3个基准测试中，需要特别声明的是：

所有基准测试的每个设置都只运行过一次，理想情况下当然是重复运行次数越多越好，最好还能生成平均和标准偏差，但这并不会影响到上述结论。

此外，虽然R教授是在同一台机器上运行的所有基准测试，但两次运营之间没有特意相隔很长时间，因此，这可能意味着前后两次运行之间的GPU基本温度可能不同，并可能稍微影响到运算时间。

结论

可以看出，选择2的n次幂或8的倍数作为batch大小在实践中不会产生明显差异。

然而，由于在实际使用中已成为约定俗成，选择2的n次幂作为batch大小，的确可以帮助运算更简单并且易于管理。

此外，如果你有兴趣发表学术研究论文，选择2的n次幂将使你的论文看上去不那么主观。

尽管如此，R教授仍然认为，batch的最佳大小在很大程度上取决于神经网络架构和损失函数。

例如，在最近使用相同ResNet架构的研究项目中，他发现batch的最佳大小可以在16到256之间，具体取决于损失函数。

因此，R教授建议始终把调整batch大小，作为超参数优化的一部分。

但是，如果你由于内存限制而无法使用512作为batch大小，那么则不必降到256，首先考虑500即可。

作者Sebastian Raschka

Sebastian Raschka，是一名机器学习和 AI 研究员。

他在UW-Madison （威斯康星大学麦迪逊分校）担任统计学助理教授，专注于深度学习和机器学习研究，同时也是Lightning AI的首席 AI 教育家。

另外他还写过一系列用Python和Scikit-learn做机器学习的教材。

推荐内容

焦点热讯:Batch大小不一定是2的n次幂！ML资深学者最新结论

2022-08-02
环球精选！报告：想学AI的学生数量已涨200%，老师都不够用了

2022-08-02
天天微资讯！阿里回应被列入“预摘牌”名单

2022-08-02
环球快消息！中国电信：天翼云已成为全球最大运营商云

2022-08-02
天天最资讯丨亮点提前看！广东电信IPTV全网超高清升级发布会迎来行业重大变革

2022-08-02
最新消息：稳！艺赛旗连续四年入选Gartner 技术成熟度曲线报告

2022-08-01
每日热议!2022数字经济体验周 | 神州信息金融科技创新中心圆满完成场景开放活动

2022-08-01
世界要闻：向安卓看齐？苹果App Store新增广告位：应用页也有推广

2022-08-01
【全球热闻】清华大学新闻学院教授沈阳：目前元宇宙产业生态系统处于亚健康状态

2022-08-01
世界即时：相比技术与产品，倾听与意见才是Web3当下的首要任务

2022-08-01
【热闻】云端未来顺应发展趋势，专注ARM研发致力打造未来场景

2022-08-01
环球通讯！X 2 Earn必须依靠旁氏启动？GameFi的出路在哪？(下)

2022-08-01
焦点滚动:科普 | 什么是比特币的恐惧与贪婪指数？

2022-08-01
当前速递！我不允许你不知道！！高画质、高扩展性的实时3D中文引擎！

2022-08-01
世界聚焦：机器学习理论基础总结

2022-08-01
世界焦点！新华数藏运营改版上线，进群免费撸空投

2022-08-01
关注：焦点|5G建设步入快车道 5G+的未来风口在哪？

2022-08-01
全球通讯！校园歌手大赛决赛蓄势待发天翼爱音乐AI视频彩铃创助威新方式

2022-08-01
环球快看：从6月底开始，陆续有科技互联网公司撤回了IPO申请

2022-07-29
每日观察!360亮相2022全球数字经济大会，N世界打造元宇宙参会体验

2022-07-29
最新快讯!“人工智能，有必要像人类一样吗？”

2022-07-29
每日速看!科普 | “大姨太”ETH 和 “小姨太”ETC的爱恨情仇

2022-07-29
全球视讯！那些破釜沉舟入局Web3.0的互联网精英都怎么样了？

2022-07-29
世界热议:海外多家权威媒体热议波场TRON：为互联网去中心化奠定基础

2022-07-29
【天天热闻】家大业大的中国电信，究竟家业有多大？

2022-07-29
每日热门：对话 Rabbit Hole 创始人：声誉 DAO 工具的发展

2022-07-29
环球热点！数据分析工具暗藏合规风险？这个动作刻不容缓

2022-07-29
每日视讯：Arcane Research：比特币上市矿企谁为熊市做好了准备谁会濒临倒闭会继续抛售比特币吗

2022-07-29
世界微速讯：投资大师小米：左手点石成金，右手握着枷锁

2022-07-29
天天资讯：亿恩科技2022年半年度亏损80.94万元同比止盈转亏

2022-07-29
世界快看：腾讯“幻核”风波背后：上半年数字藏品平台猛增639家

2022-07-29
世界最资讯丨工信部：扩大5G在乡镇和农村广度覆盖，推进光纤到房间商用步伐

2022-07-29
全球滚动:数字藏品行业洗牌将至，“千藏大战”谁将出局？

2022-07-29
今日报丨52个Martech关键词：人工智能

2022-07-29
天天精选！只需229元，就能搞定家庭千兆组网！还能零元购手机？

2022-07-29
【天天报资讯】荣获2022数字中国创新大赛车联网安全赛优秀应用案例二等奖

2022-07-29
世界今热点：媒体数字藏品，如何「破圈」出击？

2022-07-29
环球快消息！后CentOS时代，开源社区将走向何方？

2022-07-29
“真实”滤镜消失了？抖音达人主页显示所属MCN机构上线

2022-07-29
当前聚焦：2022年一季度中国IT服务行业A股上市企业归属母公司净利润排行榜：8家企业净利润超过亿元，汉得信息净利润同比增幅最高（附热榜TOP100详单）

2022-07-28
世界资讯：探迹荣获2021-2022年度人工智能与大数据最具投资价值公司奖

2022-07-28
世界新动态：分析：比特大陆旗帜鲜明支持 ETC复兴的希望与难点

2022-07-28
焦点要闻：一图看懂密评全过程

2022-07-28
快看：一站式便利服务，“电视+宽带+手机号卡”的融合业务

2022-07-28
环球快播：“东数西算”后，济南迎来首届算力大会

2022-07-28
重点聚焦!为了找回装满宝贝的硬盘，英国小伙儿拉来1100万风险投资，还要翻遍整个垃圾场

2022-07-28
今热点：Meta宣布Quest 2全系涨价100美元，8月1日开始实施；索尼剧透PSVR2新功能，将包括透视模式、广播模式及电影模式

2022-07-28
天天热点评！投资回报率增长450%，元宇宙已成零售业的新“现实”

2022-07-28
天天滚动:谷歌母公司发布二季度财报：低于市场预期却大涨约5%

2022-07-27
天天日报丨Instagram再次“TikTok化”，为何被强烈抵制？

2022-07-27

天天微资讯！阿里回应被列入“预摘牌”名单

2022-08-02
环球精选！报告：想学AI的学生数量已涨200%，老师都不够用了

2022-08-02
焦点热讯:Batch大小不一定是2的n次幂！ML资深学者最新结论

2022-08-02
法、意等国正加大对欧盟委员会施压要求立法确保大型科技公司为欧盟电信基础设施提供资金

2022-08-02
Facebook210亿条好友关系信息公布作为研究美国经济不平等问题研究项目的一部分

2022-08-02
天天热门:融资丨「泰邦生物集团」完成3亿美元融资，Platinum Orchid、GIC领投

2022-08-02
天天最资讯丨亮点提前看！广东电信IPTV全网超高清升级发布会迎来行业重大变革

2022-08-02
环球快消息！中国电信：天翼云已成为全球最大运营商云

2022-08-02
天天观热点：诈骗130万美元？“二舅币”澄清了，但炒币者更急了

2022-08-02
每日快看：用做题的逻辑来创业，市高考状元创立方便速食「巴狗」，年营收近2亿

2022-08-02
今热点：脉脉上的相亲生意

2022-08-02
全球热议:融资丨「恒创睿能」完成超3亿元B轮融资，致力于退役动力电池循环综合利用

2022-08-01
新动态：融资丨「聆知」获数百万元天使轮融资，专注于女性成长

2022-08-01
速递！融资丨「点点达洗车」完成3000万元A轮融资，致力于汽车后场服务

2022-08-01
世界即时：相比技术与产品，倾听与意见才是Web3当下的首要任务

2022-08-01
每日热议!2022数字经济体验周 | 神州信息金融科技创新中心圆满完成场景开放活动

2022-08-01
最新消息：稳！艺赛旗连续四年入选Gartner 技术成熟度曲线报告

2022-08-01
【全球热闻】清华大学新闻学院教授沈阳：目前元宇宙产业生态系统处于亚健康状态

2022-08-01
世界要闻：向安卓看齐？苹果App Store新增广告位：应用页也有推广

2022-08-01
快资讯：睫毛界的黑科技：软磁睫毛如何让美睫更简单？

2022-08-01
天天快资讯丨我在B站做直播，不露面，月入2万

2022-08-01
焦点滚动:科普 | 什么是比特币的恐惧与贪婪指数？

2022-08-01
当前速递！我不允许你不知道！！高画质、高扩展性的实时3D中文引擎！

2022-08-01
环球通讯！X 2 Earn必须依靠旁氏启动？GameFi的出路在哪？(下)

2022-08-01
世界聚焦：机器学习理论基础总结

2022-08-01
【热闻】云端未来顺应发展趋势，专注ARM研发致力打造未来场景

2022-08-01
焦点热文：融资丨「上海慧程」完成超亿元D轮融资，中信建投资本领投

2022-08-01
天天头条：融资丨「中科迪宏」获得数千万人民币B1轮融资，庐峰投资领投

2022-08-01
天天微资讯！融资丨「百迈生物」完成超5000万元A轮融资，领航新界独家投资

2022-08-01
环球观点：《二舅》惹“造假”争议，短视频的“精神家乡”存在吗？

2022-08-01
天天热文：融资丨「国台酒业」获数亿元投资，日初资本投资

2022-08-01
电脑用AirPods难受？微软商店推出MagicPods 教你Win11连AirPods的正确姿势

2022-08-01
全球通讯！校园歌手大赛决赛蓄势待发天翼爱音乐AI视频彩铃创助威新方式

2022-08-01
关注：焦点|5G建设步入快车道 5G+的未来风口在哪？

2022-08-01
世界焦点！新华数藏运营改版上线，进群免费撸空投

2022-08-01
【全球独家】融资丨「NTX™纺织科技集团」完成近2亿美元C2轮融资，大钲资本领投

2022-08-01
全球聚焦：互联网大厂、母婴巨头纷纷布局：这个“魔法棒”有点东西

2022-08-01
全球百事通！我被B站“抖”晕了

2022-08-01
全球视讯！铁腕裁员十万大军，亚马逊终于“回血”

2022-08-01
当前聚焦：花7000元买GAI的小卡，到底为什么？

2022-08-01
世界通讯！找工作、想镀金、搞外快，大厂内推成了一门生意？

2022-08-01
焦点信息:六个核桃撑不起养元饮品的第二春？

2022-08-01
当前关注：品牌怎么都在投播客？

2022-07-31
热点聚焦：每日优鲜何以至此

2022-07-31
焦点速读：长视频平台的钞能力，都藏在VIP里

2022-07-31
全球热头条丨手握900亿订单，光伏最强搅局者出现了

2022-07-31
当前热讯：上市不能包治百病，网约车和锁电拖住了广汽埃安

2022-07-31
【当前热闻】每日优鲜的现在，生鲜电商的未来？

2022-07-31
速讯：“二舅”刷屏，B站再迎全网爆款；香港红磡体育馆发生严重舞台事故；排队五年，《长津湖》出品方博纳影业终将上市｜文娱周报

2022-07-30
天天热点！对话52TOYS：中国收藏玩具如何在东南亚1年增长10倍？

2022-07-30
热讯：Web3.0的镰刀还能割多久?

2022-07-30
环球焦点！每日优鲜回应关停30分钟极速达业务；阿里巴巴申请香港纽约双重上市；趣店被质疑借预制菜向加盟商放贷；钱大妈完成新一轮融资丨消费周报

2022-07-30
当前视点！Shein依然很火，它的“学徒”冰凉

2022-07-30
【世界独家】抖音显示MCN，达人揭开“真面目”？

2022-07-30
视点！残酷建仓期：董承非的选择保守吗？

2022-07-30
【环球聚看点】搞投资、做茶饮、卖矿泉水，伊利急寻第二曲线

2022-07-30
今日要闻!每日优鲜徐正独家回应：我没有跑路

2022-07-29
每日短讯：国民食品涨价频频上热搜，牵动了谁的神经？

2022-07-29
每日观察!360亮相2022全球数字经济大会，N世界打造元宇宙参会体验

2022-07-29
每日速看!科普 | “大姨太”ETH 和 “小姨太”ETC的爱恨情仇

2022-07-29
环球快看：从6月底开始，陆续有科技互联网公司撤回了IPO申请

2022-07-29
全球视讯！那些破釜沉舟入局Web3.0的互联网精英都怎么样了？

2022-07-29
最新快讯!“人工智能，有必要像人类一样吗？”

2022-07-29
三星首批第二代3nm GAA工艺芯片交付有望于2024年量产

2022-07-29
世界热议:海外多家权威媒体热议波场TRON：为互联网去中心化奠定基础

2022-07-29
环球热点！数据分析工具暗藏合规风险？这个动作刻不容缓

2022-07-29
【天天热闻】家大业大的中国电信，究竟家业有多大？

2022-07-29
世界微速讯：投资大师小米：左手点石成金，右手握着枷锁

2022-07-29
每日热门：对话 Rabbit Hole 创始人：声誉 DAO 工具的发展

2022-07-29
每日视讯：Arcane Research：比特币上市矿企谁为熊市做好了准备谁会濒临倒闭会继续抛售比特币吗

2022-07-29
环球新动态：西门子投资美国最大公用充电桩Electrify America，估值164亿丨海外邦

2022-07-29
天天热点评！融资丨「瑞博生物」完成4000万美元E轮融资，加速核酸药物研发

2022-07-29
【全球播资讯】30分钟达，“逼死”每日优鲜？

2022-07-29
环球快消息！1元水消失，消费者为何不骂?

2022-07-29
天天速递！融资丨「云快充」完成C轮融资，ABB投资

2022-07-29
世界最资讯丨工信部：扩大5G在乡镇和农村广度覆盖，推进光纤到房间商用步伐

2022-07-29
今日报丨52个Martech关键词：人工智能

2022-07-29
世界快看：腾讯“幻核”风波背后：上半年数字藏品平台猛增639家

2022-07-29
全球滚动:数字藏品行业洗牌将至，“千藏大战”谁将出局？

2022-07-29
天天资讯：亿恩科技2022年半年度亏损80.94万元同比止盈转亏

2022-07-29
环球快消息！后CentOS时代，开源社区将走向何方？

2022-07-29
“真实”滤镜消失了？抖音达人主页显示所属MCN机构上线

2022-07-29
世界今热点：媒体数字藏品，如何「破圈」出击？

2022-07-29
【天天报资讯】荣获2022数字中国创新大赛车联网安全赛优秀应用案例二等奖

2022-07-29
天天精选！只需229元，就能搞定家庭千兆组网！还能零元购手机？

2022-07-29
哈啰回应员工划破70辆美团电单车被拘：盲目报复，凌晨酒后过激

2022-07-29
环球速看：花100元在元宇宙“克隆”自己，创建数字分身竟然只要5分钟？

2022-07-29
世界微动态丨美瞳一年卖百亿，年轻人的眼睛正在出问题

2022-07-29
今日讯！数据告诉你：工作3年存款10万是什么水平？

2022-07-29
世界热推荐：元气森林杀入可乐红海，打响反围剿之战

2022-07-28
关注：被饶毅炮轰“假药”的益生菌，要被团灭？

2022-07-28
当前聚焦：2022年一季度中国IT服务行业A股上市企业归属母公司净利润排行榜：8家企业净利润超过亿元，汉得信息净利润同比增幅最高（附热榜TOP100详单）

2022-07-28
当前短讯！融资丨「源古纪」获数千万融资，致力于呼吸系统疾病精准诊断研究

2022-07-28
世界即时看！融资丨「火石创造」完成亿元B轮融资，致力于数据驱动产业发展

2022-07-28
环球热文：融资丨「Senzo」获200万美元股权融资，BioAdvance 领投

2022-07-28
世界新动态：分析：比特大陆旗帜鲜明支持 ETC复兴的希望与难点

2022-07-28
世界资讯：探迹荣获2021-2022年度人工智能与大数据最具投资价值公司奖

2022-07-28
今日热讯：融资丨「飞渡科技」完成A+轮融资，专注于数字孪生底层开发

2022-07-28
全球今头条！海外创投丨「Xook」获130万美元Pre-seed融资，专注于机器自动化菜肴制作

2022-07-28
精选！融资丨「小电天体」完成A轮融资，魏桥创业集团与软银中国资本联合投资

2022-07-28