开发者笑疯了！ LLaMa惊天泄露引爆ChatGPT平替狂潮，开源LLM领域变天_中国智能在线

来源 | 新智元

编辑|Aeneas 好困

【导读】 Meta的LLaMA模型开源，让文本大模型迎来了Stable Diffustion时刻。谁都没想到，LLaMA的一场「史诗级」泄漏，产生了一系列表现惊艳的ChatGPT「平替」。

谁能想到，一次意外的LLaMA泄漏，竟点燃了开源LLM领域最大的创新火花。

(资料图片仅供参考)

一系列表现出色的ChatGPT开源替代品——「羊驼家族」，随后眼花缭乱地登场。

开源和基于 API 的分发之间的摩擦，是生成式AI生态系统中最迫在眉睫的矛盾之一。

在文本到图像领域，Stable Diffusion的发布清楚地表明，对于基础模型来说，开源是一种可行的分发机制。

然而，在大语言模型领域却并非如此，这个领域最大的突破，比如GPT-4、Claude和Cohere等模型，都只能通过API获得。

这些模型的开源替代品没有表现出相同水平的性能，特别是在遵循人类指令能力上。然而，一场意想不到的泄露，让这种状况彻底发生了改变。

LLaMA的「史诗级」泄漏

几周前，Meta AI推出了大语言模型LLaMA 。

LLaMA 有不同的版本，包括7B、13B、33B和65B的参数，虽然它比GPT-3小，但在许多任务上，它都能和GPT-3的性能相媲美。

LLaMA 起初并未开源，但在发布一周后，这个模型忽然在4chan上泄露了，引发了数千次下载。

这个事件，可以被称为「史诗级泄漏」了，因为它成为了大语言模型领域层出不穷的创新来源。

短短几周内，基于它构建的LLM代理的创新，已经呈爆炸式增长。

Alpaca、Vicuna、Koala、ChatLLaMA 、FreedomGPT、ColossalChat…… 让我们来回顾一下，这场「羊驼家族」的大爆炸，是如何诞生的。

Alpaca

在三月中旬，斯坦福发布的大模型Alpaca火了。

Alpaca是由Meta的LLaMA 7B微调而来的全新模型，仅用了52k数据，性能约等于GPT-3.5。

关键是训练成本奇低，不到600美元。

斯坦福研究者对GPT-3.5（text-davinci-003）和Alpaca 7B进行了比较，发现这两个模型的性能非常相似。Alpaca在与GPT-3.5的比较中，获胜次数为90对89。

对于斯坦福的团队来说，想要在预算内训练一个高质量的指令遵循模型，就必须面临2个重要的挑战：要有一个强大的预训练语言模型，以及一个高质量的指令遵循数据。

恰恰，提供给学术研究人员使用的LLaMA模型搞定了第一个问题。

对于第二个挑战，「Self-Instruct: Aligning Language Model with Self Generated Instructions」论文给了很好的启发，即使用现有的强语言模型来自动生成指令数据。

LLaMA模型最大的弱点，就是缺乏指令微调。OpenAI最大的创新之一就是将指令调优用在了GPT-3上。

对此，斯坦福使用了现有的大语言模型，来自动生成遵循指令演示。

现在，Alpaca直接被网友们奉为「文本大模型的Stable Diffusion」。

Vicuna
3月底，来自UC伯克利、卡内基梅隆大学、斯坦福大学和加州大学圣地亚哥分校的研究人员开源了Vicuna，这是一个与GPT-4性能相匹配的LLaMA微调版本。

130亿参数的 Vicuna ，通过在ShareGPT收集的用户共享对话上对LLaMA进行微调训练而来，训练成本近300美元。

结果显示Vicuna-13B在超过90%的情况下，实现了与ChatGPT和Bard相匹敌的能力。

对于Vicuna-13B训练流程，具体如下：

首先，研究人员从ChatGPT对话分享网站ShareGPT上，收集了大约70K对话。

接下来，研究人员优化了Alpaca提供的训练脚本，使模型能够更好地处理多轮对话和长序列。之后利用PyTorch FSDP在8个A100 GPU上进行了一天的训练。

在模型的质量评估方面，研究人员创建了80个不同的问题，并用GPT-4对模型输出进行了评价。

为了比较不同的模型，研究人员将每个模型的输出组合成一个单独的提示，然后让GPT-4评估哪个模型给出的回答更好。

LLaMA、Alpaca、Vicuna和ChatGPT的对比

Koala

最近，UC伯克利 AI Research Institute（BAIR）又发布了一个新模型「考拉」（Koala），相比之前使用OpenAI的GPT数据进行指令微调，Koala的不同之处在于使用网络获取的高质量数据进行训练。

研究结果表明，Koala可以有效地回答各种用户的查询，生成的回答往往比Alpaca更受欢迎，至少在一半的情况下与ChatGPT的效果不相上下。

研究人员希望这次实验的结果可以进一步推动围绕大型闭源模型相对于小型公共模型的相对性能的讨论，特别是结果表明，对于那些能在本地运行的小模型，如果认真地收集训练数据，也可以取得大模型的性能。

事实上，在此之前斯坦福大学发布的Alpaca模型，根据OpenAI的GPT模型对LLaMA的数据进行微调的实验结果已经表明，正确的数据可以显著改善规模更小的开源模型。

这也是伯克利的研究人员开发和发布Koala模型的初衷，希望为这个讨论结果再提供了一个实验证明。

Koala对从网上获取的免费交互数据进行了微调，并且特别关注包括与ChatGPT 等高性能闭源模型交互的数据。

研究人员并没有追求尽可能多的抓取网络数据来最大化数据量，而是专注于收集一个小型的高质量数据集，包括ChatGPT蒸馏数据、开源数据等。

ChatLLaMA

Nebuly开源了ChatLLaMA ，这是一个使用让我们使用自己的数据创建对话助手的框架。

ChatLLaMA让我们使用自己的数据和尽可能少的计算量，来创建超个性化的类似ChatGPT的助手。

假设在未来，我们不再依赖一个「统治所有人」的大型助手，每个人都可以创建自己的个性化版本类ChatGPT助手，它们可以支持人类的各种需求。

不过，创建这种个性化助手需要在许多方面做出努力：数据集创建，使用RLHF进行高效训练，以及推理优化。

这个库的目的是，通过抽象计算优化和收集大量数据所需的工作，让开发人员高枕无忧。

ChatLLaMA旨在帮助开发人员处理各种用例，所有用例都与RLHF训练和优化推理有关。以下是一些用例参考：

为垂直特定任务（法律、医疗、游戏、学术研究等）创建类似ChatGPT的个性化助手；

想在本地硬件基础设施上使用有限的数据，训练一个高效的类似ChatGPT的助手；

想创建自己的个性化版本类ChatGPT助手，同时避免成本失控；

想了解哪种模型架构（LLaMA、OPT、GPTJ等）最符合我在硬件、计算预算和性能方面的要求；

想让助理与我的个人/公司价值观、文化、品牌和宣言保持一致。

FreedomGPT

FreedomGPT使用Electron 和 React构建，它是一个桌面应用程序，允许用户在他们的本地机器上运行LLaMA。

FreedomGPT的特色，从它的名字上就可见一斑——它回答的问题不受任何审查或安全过滤。

这个程序由AI风险投资公司Age of AI开发。

FreedomGPT 建立在 Alpaca 之上。FreedomGPT使用Alpaca的显著特征，因为与其他模型相比，Alpaca相对更易于访问和定制。

ChatGPT遵循OpenAI的使用政策，限制仇恨、自残、威胁、暴力、性方面的内容。

与ChatGPT不同，FreedomGPT回答问题时没有偏见或偏袒，并且会毫不犹豫地回答有争议或争论性的话题。

FreedomGPT甚至还回答了「如何在家制造炸弹」，而OpenAI专门从GPT-4中删除了这一点。

FreedomGPT很独特，因为它克服了审查限制，在没有任何保障的情况下迎合有争议的话题。它的标志是自由女神像，因为这个独特而大胆的大语言模型象征了自由。

FreedomGPT甚至可以在不需要联网的情况下，就能在计算机上本地运行。

此外，开源版本将很快发布，使用户和组织可以完全定制。

ColossalChat

UC伯克利提出的ColossalChat只需要不到100亿个参数就可以达到中英文双语能力，效果与ChatGPT和GPT-3.5相当。

此外，基于LLaMA模型的ColossalChat，还复刻了完整的RLHF过程，是目前最接近ChatGPT原始技术路线的开源项目。

中英双语训练数据集

ColossalChat发布了一个双语数据集，其中包含大约100,000个中英文问答对。

该数据集是从社交媒体平台上的真实问题场景中收集和清理的，作为种子数据集，使用self-instruct进行扩展，标注成本约为900美元。

与其他self-instruct方法生成的数据集相比，该数据集包含更真实和多样化的种子数据，涵盖更广泛的主题。

该数据集适用于微调和RLHF训练。在提供优质数据的情况下，ColossalChat可以实现更好的对话交互，同时也支持中文。

完整的RLHF管线

RLHF的算法复刻共有三个阶段：

在RLHF-Stage1中，使用上述双语数据集进行监督指令微调以微调模型。

在RLHF-Stage2中，通过对同一提示的不同输出手动排序来训练奖励模型分配相应的分数，然后监督奖励模型的训练。

在RLHF-Stage3中，使用了强化学习算法，这是训练过程中最复杂的部分。

相信很快，就会有更多项目发布。

谁也没想到，这场LLaMA的意外泄露，竟点燃了开源LLM领域最大的创新火花。

推荐内容

开发者笑疯了！ LLaMa惊天泄露引爆ChatGPT平替狂潮，开源LLM领域变天

2023-04-11

实时焦点：当ChatGPT续写《红楼梦》，能替代原著吗？

2023-04-11

清华天才王小川创立百川智能打造中国版OpenAI

2023-04-11

商汤科技发布“鸡肋”产品糊弄交差？收入萎缩客户流失“战略性亏损”被证伪

2023-04-11

世界今日讯！事关21亿元收购案！华为深夜发声：不可能，无意愿

2023-04-11

观点：爆：中国移动最赚钱的分省排名以及政企排名！

2023-04-11

天天时讯：真正的包罗“万”象！上海AI实验室、港中文等提出V3Det目标检测数据集，含有13029个类别！

2023-04-11

【环球热闻】字节跳动已超越腾讯、阿里成中国最赚钱互联网公司

2023-04-11

【全球聚看点】海外设计师打造苹果MR头显概念渲染图；索尼新型3D显示屏即将上市，无需 VR 头显也可支持沉浸式体验

2023-04-11

环球观速讯丨涉图片侵权、错误信息诽谤等，AIGC将迎来侵权潮？

2023-04-11

环球热推荐：政企市场成运营商比拼新焦点一季度四家战绩谁更给力

2023-04-11

世界快播：谷歌云游戏四年探索，全剧终

2023-04-11

天天短讯！为何“周一睡觉俱乐部”上海首店开出就能制造社交话题？

2023-04-11

环球资讯：GPT-4，究竟强大在哪里？

2023-04-10

焦点短讯！科普 | 号称以太坊“黑暗森林”的MEV是什么？

2023-04-10

全球观察：深陷免费泥潭的视频会议厂商，该醒醒了

2023-04-10

湖南开启终端测试！直播卫星户户通将与中国广电5G网络融合？

2023-04-10

炫到爆炸！HuggingGPT在线演示惊艳亮相，网友亲测图像生成绝了

2023-04-10

“看不见”的5G，让智慧生活充满无限可能

2023-04-10

江西景德镇陶溪川怎么成为年轻人的社交的实验场？

2023-04-10

天天热资讯！ChatGPT惨遭“多国围剿”，TikTok也出事了

2023-04-10

3家企业获融资；火锅食材供应商锅圈考虑香港IPO；卓尔集团发起成立纺织服装供应链平台“华纺链”|一周产业互联网

2023-04-10

【全球新视野】医生如何看待ChatGPT

2023-04-10

世界今日报丨知行科技冲刺IPO，毛利大降、营收单一的AI新秀能被看好吗？

2023-04-10

追本逐源丨OSCAR开源供应链沙龙圆满举办

2023-04-10

建圈强链—物联网企业生态行（走进秦川物联网）活动圆满结束

2023-04-10

世界新动态：私域动态：杭州阿里由122亿减资至1亿;百度打假称文心一言目前无官方App;京东将发布新一代产业大模型…

2023-04-10

计算机孟灿|计算机软件行业深度研究：AI+工业信息化，高价值、高普及、高认可之路

2023-04-10

世界资讯：AI大模型出现了人们不可预测的能力

2023-04-10

消息！ChatGPT的AI安全之道

2023-04-10

环球资讯：马化腾走向张一鸣的牌桌

2023-04-10

天天播报:阿里版GPT测评，世界上怎么有这么嘴碎的AI！你给我停止生成

2023-04-10

2023年3月VR/AR行业月报 | VR陀螺

2023-04-10

全球时讯：爱奇艺奇遇携手京东科技，蓄势扬帆剑指XR数智化？

2023-04-10

世界快讯:VR游戏周报 | 射击品类爆发，《Half-Life 2》第2章VR MOD免费发布

2023-04-10

AI抢饭碗成真！近500家美国企业用ChatGPT取代员工，有公司省下超10万美元

2023-04-07

关注：小米辟谣余承东加盟造车/ ChatGPT编造教授性骚扰丑闻/ 中国电科回应加班舆情…今日更多新鲜事在此

2023-04-07

中国移动荣获中国标准创新贡献奖一等奖

2023-04-07

决战以太坊之巅，二层战火全面蔓延

2023-04-07

速读：中国联通：智能全光底座推动算网一体化发展

2023-04-07

全球聚焦：更快更准确！开放猫V2.0版新网站新域名正式上线！

2023-04-07

环球观速讯丨统信软件中标农信银服务器操作系统采购项目

2023-04-07

全球观天下！上线！中粮集团携手用友，开启人力数智化“在线”新旅程！

2023-04-07

环球快播：报告征集 | 2023年中国工业数据库发展洞察报告

2023-04-07

世界球精选！训练人工智能的中国县城工人

2023-04-07

天天实时：不能降本增效，谈元宇宙都是白搭

2023-04-07

神策数据荣获2023 未来合作伙伴大会“先锋驱动奖”

2023-04-07

环球通讯！链上＋1！汉王影研与趣链科技签署战略合作协议

2023-04-07

快报：第一财经报道 | 中企通信全新安全运营中心（SOC）于上海正式启用

2023-04-07

热头条丨GPT-5要停？OpenAI凌晨发文回应：保障AI安全，我们没有「偷工减料」

2023-04-07

开发者笑疯了！ LLaMa惊天泄露引爆ChatGPT平替狂潮，开源LLM领域变天

2023-04-11

实时焦点：当ChatGPT续写《红楼梦》，能替代原著吗？

2023-04-11

当前速递！做人大忌（此文无价）

2023-04-11

环球时讯：融资丨「泽维生物」获千万元级别天使轮投资

2023-04-11

【天天热闻】融资丨「奇点云」完成近亿元C2轮融资，余杭国投领投

2023-04-11

【时快讯】融资丨「云轴科技」宣布获数亿元C轮融资，国鑫创投、君联资本领投

2023-04-11

热点评！跨越8国、500城，超级App Grab怎么“黏住”近万名人才？

2023-04-11

首发丨「享刻智能」获4000万天使轮融资，真格基金、中关村智友科学家基金联合领投

2023-04-11

首发丨「享刻智能」获4000万天使轮融资，真格基金、中关村智友科学家基金联合领投

2023-04-11

清华天才王小川创立百川智能打造中国版OpenAI

2023-04-11

天天快资讯：看数据说废钢——底部支撑缺失废钢或偏弱调整运行

2023-04-11

商汤科技发布“鸡肋”产品糊弄交差？收入萎缩客户流失“战略性亏损”被证伪

2023-04-11

世界今日讯！事关21亿元收购案！华为深夜发声：不可能，无意愿

2023-04-11

天天动态:一年内向乌克兰提供百万发炮弹？欧洲恐做不到

2023-04-11

洗衣机固定不住老是跑？单桶洗衣机都放得下吗？

2023-04-11

净水机水质多少合格？净水器净化出来的水达到什么标准？

2023-04-11

滚筒洗衣机选什么电机？怎么选半自动洗衣机？

2023-04-11

易开得净水器怎样拆洗？易开得净水器质量怎么样？

2023-04-11

洗衣机蒸汽除菌是什么意思？洗衣机的除菌功能有用吗？

2023-04-11

易开得多久换一次滤芯?易开得净水器为什么不换滤芯?

2023-04-11

沃克韦恩净水器靠谱？沃克韦恩净水机质量怎么样？

2023-04-11

带锡箔的粽子怎么加热?外卖锡箔盒可以明火加热吗?

2023-04-11

量子电视是什么意思?led原色量子点电视好吗?

2023-04-11

每日看点!从董宇辉到董洁，直播带货也开始“种草”了

2023-04-11

每日动态!AI会杀死“美图秀秀们”吗？

2023-04-11

当前关注：华尔街最新投资中国地图

2023-04-11

环球微动态丨Keep，除了帕梅拉你还有什么

2023-04-11

香山在哪里(香山在哪里哪个省市)

2023-04-11

速看：火锅届「蜜雪冰城」要上市了，海底捞慌不慌？

2023-04-11

观点：爆：中国移动最赚钱的分省排名以及政企排名！

2023-04-11

没有冰箱怎么保存芒果？芒果能不能放冰箱里？

2023-04-11

【环球热闻】字节跳动已超越腾讯、阿里成中国最赚钱互联网公司

2023-04-11

环球观速讯丨涉图片侵权、错误信息诽谤等，AIGC将迎来侵权潮？

2023-04-11

【全球聚看点】海外设计师打造苹果MR头显概念渲染图；索尼新型3D显示屏即将上市，无需 VR 头显也可支持沉浸式体验

2023-04-11

天天时讯：真正的包罗“万”象！上海AI实验室、港中文等提出V3Det目标检测数据集，含有13029个类别！

2023-04-11

掌趣科技：4月10日融券卖出金额14.56万元，占当日流出金额的0.06%

2023-04-11

昆仑万维2022年净利润11.5亿经营性净利润同比大增112%

2023-04-11

天天短讯！为何“周一睡觉俱乐部”上海首店开出就能制造社交话题？

2023-04-11

世界快播：谷歌云游戏四年探索，全剧终

2023-04-11

环球热推荐：政企市场成运营商比拼新焦点一季度四家战绩谁更给力

2023-04-11

直径超3米！郑开同城郑州东部原水干管工程首段顺利贯通

2023-04-11

零跑汽车的2022：年亏51亿，还需要克服哪些挑战？

2023-04-11

跟小学生抢饭吃，和老人争学上，不安分的年轻人在想什么鬼点子？

2023-04-11

高铁上偶遇湖南警察辽宁一女士17.35万元被骗款失而复得

2023-04-11

全球热文：小米会不会收购小鹏？

2023-04-11

微头条丨年轻人集体“上山”，捧出一个IPO

2023-04-11

B 站停更潮，一场内容生产危机？

2023-04-11

【快播报】为什么说抖音已成为餐饮人线上经营的必争之地？

2023-04-11

世界新动态：腾讯游戏一个400多人工作室被“掏空”了

2023-04-11

【播资讯】TikTok、Lazada混战：东南亚电商的“面子”和“里子”

2023-04-11

金普天气早知道｜降温未息，浮尘又起

2023-04-11

全球新动态：“翰墨桃花情书画展风采”——西沽街社工站睦邻活动

2023-04-11

世界滚动:浙江一老师误将作业布置给上届学生，结果被大家的回应整破防了

2023-04-10

当前速递！【昔日女神】水岛爱 -- 水嶋あい

2023-04-10

江西省新余市仙女湖区市场监督管理局公布40批次食品抽检信息

2023-04-10

周口：调整二套住房认定标准，购房可提取直系亲属公积金

2023-04-10

环球资讯：GPT-4，究竟强大在哪里？

2023-04-10

每日精选：融资丨嵌入式机器视觉产品研发商「深视智能」完成数亿元C轮融资

2023-04-10

财报速递：苏轴股份2022年全年净利润8371.00万元，总体财务状况优秀

2023-04-10

天天速看：融资丨「灵赋生物」完成近亿元人民币A2轮融资，国投创业领投

2023-04-10

融资丨剧本杀种草交流平台「谜圈」完成1000万元天使轮融资

2023-04-10

【速看料】融资丨「洞悉网络」完成数千万元A+轮融资

2023-04-10

重点聚焦!融资丨「华宁世纪」获1800万元首轮融资，煜华资本投资

2023-04-10

焦点短讯！科普 | 号称以太坊“黑暗森林”的MEV是什么？

2023-04-10

全球观察：深陷免费泥潭的视频会议厂商，该醒醒了

2023-04-10

psv(psv是什么意思)

2023-04-10

湖南开启终端测试！直播卫星户户通将与中国广电5G网络融合？

2023-04-10

热点在线丨美国石油商“如此吝啬”投资新产能凭什么指责OPEC+？

2023-04-10

今日聚焦!“酒吧界蜜雪冰城”，难进县城

2023-04-10

炫到爆炸！HuggingGPT在线演示惊艳亮相，网友亲测图像生成绝了

2023-04-10

“看不见”的5G，让智慧生活充满无限可能

2023-04-10

环球要闻：【风口研报】“光热发电”火了！能源股卷土重来？旅游酒店板块也站在风口？

2023-04-10

江西景德镇陶溪川怎么成为年轻人的社交的实验场？

2023-04-10

每日动态!前途汽车，何处觅“前途”？

2023-04-10

世界观察：探访国内最大的咖啡文化节：玩得疯狂、过得疲惫

2023-04-10

天天热资讯！ChatGPT惨遭“多国围剿”，TikTok也出事了

2023-04-10

匆匆朗读应该什么语气_匆匆朗读

2023-04-10

3家企业获融资；火锅食材供应商锅圈考虑香港IPO；卓尔集团发起成立纺织服装供应链平台“华纺链”|一周产业互联网

2023-04-10

每日热点：英伟达GeForce RTX 4070 Founders Edition曝光：双槽厚度，12VHPWR接口

2023-04-10

【全球新视野】医生如何看待ChatGPT

2023-04-10

世界今日报丨知行科技冲刺IPO，毛利大降、营收单一的AI新秀能被看好吗？

2023-04-10

世界播报:通用汽车为何拒绝CarPlay：不想给苹果做嫁衣

2023-04-10

当前焦点!UP主停更背后，是全网创作者的赚钱焦虑

2023-04-10

计算机孟灿|计算机软件行业深度研究：AI+工业信息化，高价值、高普及、高认可之路

2023-04-10

世界新动态：私域动态：杭州阿里由122亿减资至1亿;百度打假称文心一言目前无官方App;京东将发布新一代产业大模型…

2023-04-10

2023郑州新郑电动车上牌费用

2023-04-10

建圈强链—物联网企业生态行（走进秦川物联网）活动圆满结束

2023-04-10

耳机怎么打开耳返?为什么耳机突然没有耳返?

2023-04-10

追本逐源丨OSCAR开源供应链沙龙圆满举办

2023-04-10

耳机丢了怎么查找耳机?有线耳机一整套丢了怎么找回?

2023-04-10

世界资讯：AI大模型出现了人们不可预测的能力

2023-04-10

电脑连接蓝牙音响总是断断续续?电脑音响和蓝牙音响同时出声?

2023-04-10

win10电脑插入耳机没声音?电脑怎么设置前置耳机?

2023-04-10

卡拉ok声卡怎样接功放？功放与声卡有什么区别？

2023-04-10

录音机怎么和电脑连接？录音机线怎么连接电脑？

2023-04-10

黑河市爱辉区六点六万亩高标准农田进入施工“黄金期”

2023-04-10

b450主板带不带蓝牙？b450i主板usb没反应？

2023-04-10

致那些我们“犟着”的时刻！

2023-04-10

如何测麦克风频响曲线？耳机喇叭曲线怎么分析？

2023-04-10

音箱怎么接电脑？音箱正常连电脑没声音？

2023-04-10

中国智能在线豫ICP备20022870号-6 联系：553 138 779qq.com