羊驼进化成鲸鱼，Meta把对齐「自动化」，Humpback击败现有全部LLaMa模型

来源 | 机器之心

这一年来，以 ChatGPT 和 GPT-4 为代表的大语言模型（LLM）发展迅速，紧随其后，Meta 开源的 LLaMa、Llama 2 系列模型在 AI 界也引起的了不小的轰动。但随之而来的是争议不断，有人认为 LLM 存在一些不可控的风险，给人类生存构成一些潜在威胁。

(资料图片)

为了应对这些挑战，对 LLM 对齐的研究变得越来越重要，有研究者提出指令跟随（instruction following），但这种方法需要大量的人工注释。然而，注释如此高质量的指令跟随数据集耗费巨大。

本文来自Meta AI 的研究者提出了一种可扩展的方法即指令回译（instruction backtranslation），该方法通过自动注释相应的指令来构建高质量的指令跟随语言模型。

论文地址：https://arxiv.org/pdf/2308.06259.pdf

具体而言，该研究从一个语言模型开始，并作为种子模型，该模型在少量的种子数据以及 web 语料库上进行了微调。种子模型的作用是用来构建训练样本，然后这些样本中的一些高质量样本将会被筛选出来，接着，这些数据被用来微调一个更强大的模型。

经过两轮迭代的数据集对 LLaMa 进行微调，所产生的模型 Humpback 在 Alpaca 排行榜上优于其他现有的非蒸馏模型，如 LIMA、Claude、Guanaco 等。

Humpback 原意为座头鲸，又名驼背鲸，Meta 将模型命名为 Humpback，也别有深意吧。

之所以称为指令回译，研究者表示这借鉴了机器翻译中经典的反向翻译方法，其中人类编写的目标句子会自动用模型生成的另一种语言的源句子进行注释。

图灵奖得主 Yann LeCun 高度概括了这项研究的方法，并称赞 Meta 这项工作为对齐研究做出重要贡献：

还有网友对这项研究进行了很好的概括：数据质量对大模型来说确实很重要，研究过程中，他们使用不同级别的过滤数据，微调了一个模型，结果表明，只有最好的样本才能得出比其他样本表现更好的模型。

该论文提出了一种需要两个步骤完成的新的数据增强范式。首先，必须拥有一组种子（指令、输出）对和语料库才能生成更多好的指令数据。

下图比较了 Humpback 与一些开源模型和专有模型。

下表 4 表明，本文方法在 65B 和 33B 模型尺度上都是非蒸馏模型中表现最好的模型。

下面我们看看具体方法。

方法简介

该研究提出了一种自训练方法（self-training），该方法通常假定可以访问基本语言模型、少量种子数据和未标记的样本集（例如网络语料库）。未标记数据往往是一大堆形态各异的文档，由人类编写，其中包括人类感兴趣的各种话题内容，但最重要的是没有与指令进行配对。

这里还有两个关键的假设，第一个假设是这个非常大的文本集（未标记样本集）存在一些子集，适合作为某些用户指令的生成样本。第二个假设是可以预测这些候选答案的指令，这些指令可以用于形成高质量样本对，以训练指令遵循模型。

如下图 1 所示，该研究提出指令回译过程包含两个核心步骤：

自增强：为未标记的数据（即网络语料库）生成指令，以为指令调优产生训练数据对（指令 - 输出）。

自管理：自主选择高质量样本数据作为训练数据，以微调基础模型来遵循指令，这种方法是迭代完成的。

其中，自管理步骤采用的 prompt 如下表 1 所示：

实验及结果

本文的数据集主要包括种子数据和增强数据，具体信息如表 2 和图 2 所示：

图 3 表示尽管扩大了数据规模，但没有自我管理（self-curation）的增强数据用来训练模型并不能提高指令跟随性能。

下图比较了不同指令调优数据集的数据效率。

数据和模型的联合扩展：该研究发现在 7B 模型中观察到的数据扩展趋势同样也适用于更大的模型。例如对 65B 的种子模型增加高质量的增强数据会带来进一步的改进。

常识推理：该研究在五个常识推理基准上进行了测试，SIQA 、PIQA、Arc-Easy、Arc-Challenge 和 Openbook QA （OBQA），结果总结于表 5 中。结果表明，与基础模型相比，本文模型在社会推理等多个方面的表现有所提高。

MMLU：表 6 总结了不同模型在 MMLU（massive multitask language understanding）的结果。与基础模型相比，本文微调模型提高了零样本准确率，但在 5 个样本上下文示例中表现不佳。

推荐内容

羊驼进化成鲸鱼，Meta把对齐「自动化」，Humpback击败现有全部LLaMa模型

前哨丨特斯拉要新建“同类首个”数据中心

科大讯飞的“极差”中报与“体面”减持

妙鸭背后，AIGC的C端漂流丨祛魅AI

大模型之争，华为暂时领先苹果

遭腾讯“清仓式”减持，掌趣科技能用AI重获资本青睐吗？

贵阳贵安软件和信息技术服务业（上海）招商推介会在上海举办

中国LoRa产业链企业已超3000家，我们对未来保持乐观｜专访Semtech

3109亿元！华为公布上半年成绩

雷军2023年度演讲：人因梦想而伟大，不断追寻梦想，并不断成长

猛！拿下2万多单，近700亿

欠薪！停薪！央国企也没那么安稳了

SaaS出海：黄粱易得，黄金难收

分析发现：5G对运营商收入拉动越来越难，危！

科大讯飞：刘庆峰卖出公司1.73%股份用于偿还借款本金

电商模特1元购，人图背景随便换！国产AI工具降本99%

美女新难题：如何自证不是AI

永洪：《2023信创产业白皮书》轻松掌握信创产业最新最佳实践！

人类数据告急，微软OpenAI开始用AI喂AI，奥特曼放话：未来所有数据都将变成合成数据

安道麦选择ZStack Cube超融合一体机进行虚拟化纳管升级

#阿里在深圳成立文化科技公司# 含人工智能业务

浅谈国内SaaS企业的核心挑战

30天揽金5千万，AI数字人能成为普通人的「财富密码」？

经纬张颖：AI的远与近

​重磅！2023科脉云帆OS平台发布会定档8月18日

“百模大战”愈演愈烈，属于阿里云的增量机会来了

ISC 2023：数字政务安全体系 为数字政府建设注入新动能

藏不住了，原来它才是中国SaaS届扛把子

UC伯克利教授惊人预测：2030年GPT可执行人类180万年工作，一天学2500年知识

马斯克脑机接口公司再获融资；阿里免费开放AI专利许可 | 图灵周报

经验：企业数据仓库建设方案总结！

OpenAI 推出网络爬虫 GPTBot，引发网站抵御潮：信息被爬走就很可能意味着永远无法删除

百度网盘基于文心大模型全面升级，推出“云一朵”智能助理

王小川又发大模型，闭源或许离商业更近

蓝牙/Wi-Fi主导的短距无线格局将破？华为星闪技术刷屏！原生于中国！

VR游戏周报 |《重炮母舰：锻造》上线PICO，《VR Skater》登陆PS VR2

腾讯视频独播的《镖人》动画&瑞幸咖啡联名、阿里妈妈发万相台无界版、2023微信广告生态合作伙伴大会召开｜商业市场WEEKLY97

4个月搓出3款大模型，王小川偷了大厂的“家”

数字化浪潮下的新风险：MSS安全托管成新蓝海

大模型加持，讯飞智能办公本X3助办公效率再提速

武功高手星闪，行走万物互联江湖

AI营销公司「奥创光年」获千万美元A轮融资，用人工智能提升全域营销效率

金蝶GPT：纵横之路与诗和远方

视频丨融合RPA先进技术，『胜券参谋』深度发掘零售企业数据运营价值

tiktok在国际的影响力，tiktok有几个国家有基金补贴

数字化转型业务成收入增长新引擎（08月11日 | 通信事儿全知道~）

ISC2023：“聚焦大模型 安全创未来”数据安全高峰会召开

毅佰联合公会张小风：成功路上并没有那么拥挤

AI早知道-202308011

安全高效，零信任VPN为远程办公保驾护航

前哨丨特斯拉要新建“同类首个”数据中心

羊驼进化成鲸鱼，Meta把对齐「自动化」，Humpback击败现有全部LLaMa模型

桐柏县开展河南首个花生“保险+期货”收入险试点

男子地铁扫码乞讨被乘客锁喉制服地铁禁止乞讨网友纷纷拍手叫好 具体是啥状况呢

引金融“活水” 助推水利民生--浦发银行郑州分行主承销5亿元中期票成功发行

科大讯飞的“极差”中报与“体面”减持

涉案超1216万元 房全忠被判十年十个月

融入园林要素 建好口袋公园

郑煤机：融资净买入453.13万元，融资余额2.93亿元（08-15）

2020年深圳展会时间表 2020年深圳展会时间表

微信公众号可以修改图片了！最多支持替换或删除 3 张

金杯电工(002533.SZ)：公司订单充足，同比往期有一定增长

主营产品产销量增加 双汇发展上半年营收净利双增长

美军正在演练“同时打赢两个超级大国”

创影史最高纪录!2023暑期档上半程票房达87.87亿

湖南新晃：开启“三绿创森”模式

2800平方米，北京大兴跑出拆违“加速度”

哈尔斯营收净利双降 ，品牌和代工业务难平衡 | 看财报

盗窃7000元取得谅解书怎么判

切尔西第7签！凯塞多签8年，转会费1.15亿镑，英超历史标王

德合集团(00368.HK)盈喜：预计上半年纯利不少于750万港元

东方证券：上半年归母净利润19.01亿元，同比增长193.72%

全国生态日 | 抓获9300余人 山东公安严打各类污染环境和破坏自然资源突出违法犯罪

大模型之争，华为暂时领先苹果

热血传奇万宇在线论坛（热血传奇 万宇）

妙鸭背后，AIGC的C端漂流丨祛魅AI

雷特科技大宗交易成交15.00万股 成交额185.85万元

弘阳地产：上半年业绩预警

遭腾讯“清仓式”减持，掌趣科技能用AI重获资本青睐吗？

重磅！2023科脉云帆OS平台发布会定档8月18日

ISC 2023：数字政务安全体系为数字政府建设注入新动能

ISC2023：“聚焦大模型安全创未来”数据安全高峰会召开

男子地铁扫码乞讨被乘客锁喉制服地铁禁止乞讨网友纷纷拍手叫好具体是啥状况呢

涉案超1216万元房全忠被判十年十个月

融入园林要素建好口袋公园

主营产品产销量增加双汇发展上半年营收净利双增长

哈尔斯营收净利双降，品牌和代工业务难平衡 | 看财报

全国生态日 | 抓获9300余人山东公安严打各类污染环境和破坏自然资源突出违法犯罪

热血传奇万宇在线论坛（热血传奇万宇）

雷特科技大宗交易成交15.00万股成交额185.85万元

大卫席尔瓦（关于大卫席尔瓦的基本详情介绍）

江西“最美辅导员”项化平：坚守学生工作一线争当筑梦人

iPhone 15也不行！富士康母公司：今年苹果、安卓手机销量都下滑后者更难

精进电动董秘回复：公司严格根据企业会计准则，按合同约定履行技术合同中的义务，技术开发工作在交付客户

快手在贵州成立科技公司杨远熙任执行董事

梁田自曝遭性骚扰地铁上被尾随一直用恶心的眼光偷看

泉庄镇文化站暑期小课堂受称赞

重磅！2023科脉云帆OS平台发布会定档8月18日

秋水仙碱痛风的你吃对了吗？

【甘快看】甘肃：深挖绿洲农业优势乳企“扬”长项拓市场

ISC 2023：数字政务安全体系为数字政府建设注入新动能

36家上市券商分红近340亿有7家派现金额超20亿

长相思第一季大结局基本情况讲解

天津滨海高新区发放首笔数字人民币“科创积分贷”

数据复盘：7亿净流入文化传媒龙虎榜抢筹首创证券

云南文山三七产地市场交易量较少交易处于淡季