反向用随机梯度下降来优化人生

沐神对本回答的评论，hhh

看完李沐老师的文章亚马逊首席李沐 | 用随机梯度下降来优化人生，深受感慨，本人阅读大量文献，提出了下面“ 反向用随机梯度下降来优化人生“的方案。下文与李沐老师的文章一一对应，李沐老师的放在了引用块里。

【资料图】

不是很懂优化这块，欢迎批评指点。

李沐：目标要大。不管是人生目标还是目标函数，你最好不要知道最后可以走到哪里。如果你知道，那么你的目标就太简单了，可能是个凸函数。你可以在一开始的时候给自己一些小目标，例如期末考个80分，训练一个线性模型。但接下来得有更大的目标，财富自由也好，100亿参数的变形金刚也好，得足够一颗赛艇。

反向：目标要小而具体。如果目标过大，很容易导致因为噪声过大，奖励过于稀疏而发散[1]。收敛情况很好的，往往是图片分类这种目标非常明确而具体的。比如真实机器人面临的搜索空间很大的任务，很容易发散[2]。

李沐：坚持走。不管你的目标多复杂，随机梯度下降都是最简单的。每一次你找一个大概还行的方向（梯度），然后迈一步（下降）。两个核心要素是方向和步子的长短。但最重要的是你得一直走下去，能多走几步就多走几步。

反向：该放弃时就要放弃。一个简单也很有效的解决梯度策略发散的技巧就是抛弃过大的梯度[3]。如果遇到很大的梯度还不选择抛弃，很容易会导致发散的结果。另外一种解释是，很多场合训练几个epoch就能发现梯度越来越大，这时候一定要停下来检查数据，不然一晚上过后只能得到一个nan的结果。

李沐：痛苦的卷。每一步里你都在试图改变你自己或者你的模型参数。改变带来痛苦。但没有改变就没有进步。你过得很痛苦不代表在朝着目标走，因为你可能走反了。但过得很舒服那一定在原地踏步。需要时刻跟自己作对。

反向：拒绝内卷。优化有两种模式，一种很陡峭曲折的（比较艰难，对应内卷），一种是比较平滑的（比较轻松，对应佛系和不卷）。这里我引用一篇顶会论文中[4]的可视化结果，

左边的（a)对应很内卷，优化曲面不平滑；右边的（b）对应很平滑的过程

那么究竟是(a)好呢，还是(b)好呢？想必大家已经猜到了，(b)这种优化模式要远远好于(a)，错误率小两倍多（错误率：(b)5.89%，(a)13.31%）。因此，大家一定要学会拒绝内卷，保护自己平滑的优化过程。

李沐：四处看看。每一步走的方向是你对世界的认识。如果你探索的世界不怎么变化，那么要么你的目标太简单，要么你困在你的舒适区了。随机梯度下降的第一个词是随机，就是你需要四处走走，看过很多地方，做些错误的决定，这样你可以在前期迈过一些不是很好的舒适区。

反向：别走太远。正则化是深度学习乃至机器学习中非常常见的技巧，要想取得好的收敛效果，往往需要加以约束，不能走得太远[3]。

李沐：赢在起点。起点当然重要。如果你在终点附近起步，可以少走很多路。而且终点附近的路都比较平，走着舒服。当你发现别人不如你的时候，看看自己站在哪里。可能你就是运气很好，赢在了起跑线。如果你跟别人在同一起跑线，不见得你能做更好。

反向：起点不重要。 Facebook的一篇论文[5]用大量实验事实证明，接受预训练的模型，虽然一开始会好一些，但是后面跟随机初始化的模型相差无几。有实验结果图为证：

李沐：很远也能到达。如果你是在随机起点，那么做好准备前面的路会非常不平坦。越远离终点，越人迹罕见。四处都是悬崖。但随机梯度下降告诉我们，不管起点在哪里，最后得到的解都差不多。当然这个前提是你得一直按照梯度的方向走下去。如果中间梯度炸掉了，那么你随机一个起点，调整步子节奏，重新来。

反向：太远就到不了了。如果间隔时间太长，奖励函数的折损会非常严重，这会严重影响强化学习的成功率。这也是为什么现在强化学习仍然只是在模拟器中成功。

李沐：简单最好。当然有比随机梯度下降更复杂的算法。他们想每一步看想更远更准，想步子迈最大。但如果你的目标很复杂，简单的随机梯度下降反而效果最好。深度学习里大家都用它。关注当前，每次抬头瞄一眼世界，快速做个决定，然后迈一小步。小步快跑。只要你有目标，不要停，就能到达。

反向：越结构化的模型越好。文献显示[6]，拓扑结构复杂的模型，在同样的梯度下降算法之后会产生更小的泛化误差。而过于简单的模型，往往会容易收敛到平凡解。

拓扑参数更复杂的模型，泛化能力更强

有些点没讲到，是因为找不到特别好的文献，或者读起来没那么有趣。

如果要我说，人生反正不是监督学习，更像是强化学习甚至无监督学习。

当然，也可能人生就是随机挑战。

推荐内容

反向用随机梯度下降来优化人生

环球关注：内容创作的正确打开方式：AIGC，云计算ETF（516510）涨超2.7%

全球聚焦：致远互联荣登“2022北京企业100强榜单”

亨通光电：PEACE项目巴基斯坦—埃及—肯尼亚、埃及—法国段已建设完毕并按计划于2022年内投入使用

世界今日报丨GameFi 2022年度报告：从第一参与者视角了解现状和未来

世界最新：赵长鹏：Binance 更愿意投资虚拟现实（VR）或元宇宙游戏

上市前夜，Abelian创始人详解项目愿景、技术、产品和生态

环球讯息：腾讯诉TapTap侵权案将开庭：侵害其商标权

看点：反「PPT骗子」，互联网大厂是认真的吗？

环球观速讯丨用ChatGPT剽窃的罪，OpenAI要亲手洗刷

天天即时：谷歌加紧测试ChatGPT竞品，靠对话可搜最新信息

世界关注：ChatGPT偷家：Stack Overflow正被程序员抛弃，访问量一个月骤降3200W

世界快报:艺赛旗荣获RPA产业推进方阵“2022年突出贡献单位”称号

焦点！2023哪些CRM趋势值得关注

奇点云通过DCMM数据管理能力成熟度评估模型三级认证 | StartDT NEWS

【速看料】Meta搞元宇宙：一年烧了932亿

微头条丨天翼云再进一名，成功拿下第三！电信云业务“赢麻了”？

今日快看!云祺入选《CCSIP 2022中国网络安全行业全景册》

热门：蚂蚁集团子公司入股易碳数科 后者为工业碳数据云计算公司

钉钉杭州投资公司注销

今日讯！为解封QQ空间，16岁少年独闯腾讯总部

今日要闻!前沿科技 | 轻量元宇宙，触手可及的元宇宙杀手锏

世界热讯:腾讯荟聚已进行平台升级，更名“品牌发现”

市值一夜暴涨，Meta又活过来了？业绩超预期竟不是主要原因

【播资讯】黑鲨科技成被执行人,执行标的6万余元

天天百事通！微软正式停售Win10系统｜全新 Edge「凤凰版」浏览器，同窗分屏功能亮了！

革了“搜索”命的，是短视频与AI？

环球今热点：OpenAI将推出月费20美元的ChatGPT付费订阅计划

Meta 第四季度净利同比下滑 55%，Facebook 日活达 20 亿

【全球新视野】ETH2.0 热门概念：SSV.Network 生态盘点 去中心化的质押基础设施

冠福股份预计2022年至少盈利4.1亿 净利润同比增长305.59%

世界短讯！2023“开门红” | 指掌易在多个行业接连传来签约喜讯

“中国ChatGPT”引爆百度股价，百度获资本市场价值重估

热门：Meta将于8月1日永久关停热门多人VR游戏《Echo VR》；爱立信引入VR培训计划，以更好开展5G建设工作

世界快资讯丨【AI律师】全球首个AI律师出道！CEO悬赏一百万美元招「工具人」，只需当个传话筒

连续五个季度绩后股价狂泻，Snap还能重获投资者青睐吗？

环球速读：大厂布局NFT：害怕错失下一代互联网浪潮

天天热点评！ChatGPT官方鉴别器紧急发布！当代自相矛盾，不想却遭遇群嘲

焦点热议:淘丁集团 | 互联网跟帖评论有新规，内容审核平台也要加强防范

全球实时：苹果首款头显即将进入量产：允许用户“全天佩戴”，正打造开发工具

世界热点评！2023年中国数据与内容技术十大预测

天天头条：2023年,通信运营商移动物联网的蓝海在哪里?

印尼网络安全服务初创公司Peris.ai获East Ventures投资

3000亿美元巨擘，全球SaaS头牌的掘金之路

天天微动态丨30亿美元！CoStar拟收购默多克旗下房产网站运营商Move

环球报道:IDC报告｜指掌易零信任案例&移动安全案例入选《CIO视角：中国未来信任优秀案例分析，2022》

最新消息：ChatGPT，人工智能划时代的标志

当前时讯：奇安信首次盈利，网络安全国家队将迎来收获期？

【世界新视野】万字详解Token经济模型设计：精髓与方法论，从理解用户想要什么开始

全球热资讯！一年融三轮，AI独角兽联创二次创业，瞄准千亿规模的 “ 新中年 ”营养抗衰市场

反向用随机梯度下降来优化人生

世界即时：谁动了我的会员？

特斯拉“背叛”特斯拉

环球关注：内容创作的正确打开方式：AIGC，云计算ETF（516510）涨超2.7%

全球今头条！黄渤：用最平实的方式打开“中年危机”播

环球消息！融资丨「钠创新能源」完成数亿元A+轮融资，昆仑资本、青岛国合、日照芯能投资

报道：融资丨「微蚁科技」完成超2000万元新一轮融资，浙江协同创新独家投资

全球聚焦：致远互联荣登“2022北京企业100强榜单”

亨通光电：PEACE项目巴基斯坦—埃及—肯尼亚、埃及—法国段已建设完毕并按计划于2022年内投入使用

天天热讯:2022年湖南耕地净增加13.33万亩，迎来“进大于出”历史性突破

全球快报:谁抛弃了华润万家超市？

视频号，鹅厂“全村的希望”？

快播：打工人在996，新富人去旅居

2023“开门红”，新茶饮又续上命了？

ChatGPT横空出世，有很多你不知道的细节

世界今日报丨GameFi 2022年度报告：从第一参与者视角了解现状和未来

世界最新：赵长鹏：Binance 更愿意投资虚拟现实（VR）或元宇宙游戏

上市前夜，Abelian创始人详解项目愿景、技术、产品和生态

微信支持注册小号：一手机号可注册两个微信账号

环球观速讯丨用ChatGPT剽窃的罪，OpenAI要亲手洗刷

看点：反「PPT骗子」，互联网大厂是认真的吗？

世界关注：ChatGPT偷家：Stack Overflow正被程序员抛弃，访问量一个月骤降3200W

天天即时：谷歌加紧测试ChatGPT竞品，靠对话可搜最新信息

环球讯息：腾讯诉TapTap侵权案将开庭：侵害其商标权

每日精选：奢侈品社区店，一种很新的二手生意

世界微资讯！融资丨「卓翼智能」完成Pre-B轮融资，动平衡资本独家投资

当前速递！大厂“抢”超市，线下商超慌不慌？

焦点！2023哪些CRM趋势值得关注

世界快报:艺赛旗荣获RPA产业推进方阵“2022年突出贡献单位”称号

热门：蚂蚁集团子公司入股易碳数科后者为工业碳数据云计算公司

【全球新视野】ETH2.0 热门概念：SSV.Network 生态盘点去中心化的质押基础设施

冠福股份预计2022年至少盈利4.1亿净利润同比增长305.59%

热门：蚂蚁集团子公司入股易碳数科后者为工业碳数据云计算公司

【全球快播报】嘉里物流查询单号嘉里物流

【全球新视野】ETH2.0 热门概念：SSV.Network 生态盘点去中心化的质押基础设施

冠福股份预计2022年至少盈利4.1亿净利润同比增长305.59%