世界信息:跑分达ChatGPT的99%，人类难以分辨！开源「原驼」爆火，iPhone都能微调大模型了_中国智能在线

自动测试分数达到 ChatGPT的99.3% ，人类难以分辨两者的回答……

这是开源大模型最新成果，来自羊驼家族的又一重磅成员——华盛顿大学原驼（Guanaco）。

(资料图)

更关键的是，与原驼一起提出的新方法 QLoRA 把微调大模型的显存需求从>780GB降低到<48GB 。

开源社区直接开始狂欢，相关论文成为24小时内关注度最高的AI论文。

以Meta的美洲驼LLaMA为基础，得到原驼 650亿参数版只需要48GB显存单卡微调24小时， 330亿参数版只需要24GB显存单卡微调12小时。

24GB显存，也就是一块消费级RTX3090或RTX4090显卡足以。

不少网友在测试后也表示，更喜欢它而不是ChatGPT。

英伟达科学家Jim Fan博士对此评价为：大模型小型化的又一里程碑。

先扩大规模再缩小，将成为开源AI社区的节奏。

而新的高效微调方法QLoRA迅速被开源社区接受，HuggingFace也在第一时间整合上线了相关代码。

GPT-4做裁判，原驼得分达到ChatGPT的99.3%

论文中，团队对原驼总共做了三项测试，自动评估、随机匹配和人类评估。

测试数据来自小羊驼Vicuna和Open Assistant。

自动评估由大模型天花板GPT-4当裁判，对不同模型的回答进行打分，以ChatGPT （GPT3.5）的成绩作为100%。

最终原驼650亿版得分达到ChatGPT的99.3%，而GPT-4自己的得分是114.5%，谷歌Bard是94.8%。

随机匹配，采用棋类专业比赛和电子竞技同款的Elo记分机制，由GPT-4和人类共同做裁判。

原驼650亿和330亿版最终得分超过ChatGPT （GPT3.5）。

人类评估，则是把原驼650亿版的回答和ChatGPT的回答匿名乱序放在一起，人类来盲选哪个最好。

论文共同一作表示，研究团队里的人都很难分辨出来，并把测试做成了一个小游戏放在Colab上，开放给大家挑战。

这里节选其中一个问题（附中文翻译），你能分辨出哪个是ChatGPT回答的吗？

问题：How can I improve my time management skills? （如何提高时间管理技能？）

（完整测试地址在文末）

总的来说，原驼的优势在于不容易被问题中的错误信息误导，比如能指出地球从来没有被科学界认为是平的。

以及擅长心智理论（Theory of Mind），也就是能推测理解他人的心理状态。

但原驼也并非没有弱点，团队发发现它不太擅长数学，以及容易用提示注入攻击把要求保密的信息从它嘴里套出来。

也有网友表示，虽然一个模型能在某个数据集上无限接近ChatGPT，但像ChatGPT那样通用还是很难的。

全新方法QLoRA，iPhone都能微调大模型了

原驼论文的核心贡献是提出新的微调方法 QLoRA 。

其中Q代表量化（Quantization），用低精度数据类型去逼近神经网络中的高精度浮点数，以提高运算效率。

LoRA是微软团队在2021年提出的低秩适应（Low-Rank Adaptation）高效微调方法，LoRA后来被移植到AI绘画领域更被大众熟知，但最早其实就是用于大语言模型的。

通常来说，LoRA微调与全量微调相比效果会更差，但团队将LoRA添加到所有的线性层解决了这个问题。

具体来说，QLoRA结合了4-bit量化和LoRA，以及团队新创的三个技巧：新数据类型4-bit NormalFloat 、分页优化器（Paged Optimizers）和双重量化（Double Quantization）。

最终QLoRA让 4-bit 的原驼在所有场景和规模的测试中匹配16-bit的性能。

QLoRA的高效率，让团队在华盛顿大学的小型GPU集群上每天可以微调LLaMA 100多次……

最终使用Open Assistant数据集微调的版本性能胜出，成为原驼大模型。

Open Assistant数据集来自非盈利研究组织LAION（训练Stable Diffusion的数据集也来自这里），虽然只有9000个样本但质量很高，经过开源社区的人工仔细验证。

这9000条样本用于微调大模型，比100万条指令微调（Instruction Finetune）样本的谷歌 FLAN v2效果还好。

研究团队也据此提出两个关键结论：

数据质量 >> 数据数量

指令微调有利于推理，但不利于聊天

最后，QLoRA的高效率，还意味着可以用在手机上，论文共同一作Tim Dettmers估计以 iPhone 12 Plus的算力每个晚上能微调300万个单词的数据量。

这意味着，很快手机上的每个App都能用上专用大模型。

推荐内容

世界信息:跑分达ChatGPT的99%，人类难以分辨！开源「原驼」爆火，iPhone都能微调大模型了

2023-05-26
5G移动电话用户达6.34亿！工信部发布2023年1－4月份通信业经济运行情况|今日热文

2023-05-25
加速数实融合，数据交易3.0模式上新天天热闻

2023-05-25
今日最新！大模型之战，科大讯飞拼了

2023-05-25
即时焦点：最新爆料！ChatGPT或嵌入Windows11，6月公测

2023-05-25
元宇宙降温后，百度希壤业务负责人马杰退场丨游戏干线

2023-05-25
ChatGPT的胜利，宣告知识图谱的消亡？

2023-05-25
每日时讯!云知声发布山海大模型，创始人黄伟：目标年内达到比肩ChatGPT的通用能力

2023-05-25
百度何俊杰：用AI原生思维重构百度移动生态，让AI人人可用

2023-05-25
Glassnode 数据研究：回顾比特币铭文爆发的“疯狂一周”_当前讯息

2023-05-25
让业务用起来 | 观远数据敏捷分析实践巡展上海站回顾-世界简讯

2023-05-25
世界焦点！中兴通讯宣布加入“科学碳目标倡议”（SBTi）

2023-05-25
世界头条：有了AI，新的学习方式

2023-05-25
世界快看点丨孙燕姿回应AI孙燕姿，音乐行业也在回应AI音乐

2023-05-25
JBD量产彩色MicroLED“蜂鸟”光引擎，内置微显示屏获SID 2023年度最佳全球微资讯

2023-05-25
恐怖的挥霍速度，每年烧上百亿美元，元宇宙大梦“压垮”Meta，苹果出手能否改写颓局

2023-05-25
三大互联网巨头的云计算盘点：阿里云、腾讯云、字节云

2023-05-25
微软全面拥抱OpenAI：Windows集成ChatGPT，Bing搜索接入GPT_世界今亮点

2023-05-25
郑州设立百亿元宇宙基金计划2025年核心产业规模突破500亿元

2023-05-25
孙燕姿回应了！天天看热讯

2023-05-25
ChatGPT迎来iPhone时刻，而苹果拒绝贴贴…

2023-05-25
天天微头条丨和AI谈恋爱，掏空我钱包

2023-05-25
IPO雷达｜金智教育再遭交易所质疑，旗下APP违法收集用户信息被查_动态

2023-05-25
【天天播资讯】拉卡拉携手15家金融机构发起“茁跃伙伴计划”

2023-05-25
人工智能诗评很强大，亲身体会才知道

2023-05-24
通讯！AI最先赋能哪些行业：OpenAI的研究

2023-05-24
当前头条：必应在国内搜索能超过百度？反智报告是怎么产生的？

2023-05-24
焦点速读：亚马逊中国回应“关闭应用商店”：不影响业务运营

2023-05-24
ChatGPT 将整合微软 Bing 搜索

2023-05-24
周成虎院士：数字中国的时空信息底座

2023-05-24
Build 2023大会上，微软全面与ChatGPT对接信息

2023-05-24
GitHub Stars 秒破万，Meta 开源能识别 4000 种语言、生成 1000 多种语音大模型！-天天观点

2023-05-24
【国金计算机|行业点评】华为完成全球88家子公司MetaERP切换，重视ERP国产替代

2023-05-24
像监管核武器一样监管AI，OpenAI高层发文探讨「超级智能」监管

2023-05-24
腾讯企点客服赛道国内TOP1！Gartner报告公布最新市场份额|观察

2023-05-24
当前热议!天涯社区再被执行31万，累计被执行超1.23亿

2023-05-24
【天天报资讯】金山软件一季度营收19.7亿，同比增长6%，不及市场预期

2023-05-24
全球快资讯：销售易行业首发“数字客户空间” ：三大场景解锁企业、伙伴、客户互动新方式

2023-05-24
四大运营商重磅联手！中国形成全球最大5G异网漫游标杆指日可待|焦点热议

2023-05-24
AI诈骗正在全国爆发！“10分钟被骗430万”，财务人应如何应对？

2023-05-24
9.8亿！电信、联通拿什么追赶移动？-世界观焦点

2023-05-24
Worldcoin：开创数字身份和全球货币新纪元_世界热头条

2023-05-24
和AI比创作，人类真的怕了吗？-世界看热讯

2023-05-24
多云何以治天下？“即服务”兴，“边缘”强-环球报道

2023-05-24
AI换脸10分钟骗走430万！普通人如何预防AI诈骗？紧急转发朋友！

2023-05-24
比特币生态的风险和机会（一）

2023-05-24
简讯：日本总务省最新报告：Open RAN与传统RAN的安全风险基本相当

2023-05-24
数字经济成为我国经济发展新亮点世界报道

2023-05-23
中国移动重磅发布“企业无忧”服务——FTTR全光e企组网全球热讯

2023-05-23
今日看点：华为再招“天才少年”，薪酬5倍+，年薪超200万

2023-05-23

世界信息:跑分达ChatGPT的99%，人类难以分辨！开源「原驼」爆火，iPhone都能微调大模型了

2023-05-26
西城区启动“守袋行动”筑牢金融风险防线-环球焦点

2023-05-26
环球简讯:花钱吃剩菜！“剩菜盲盒”正成为年轻人的新型就餐方式？

2023-05-26
mp5电影下载操作流程 mp5电影下载

2023-05-26
八上英语单词朗读录音mp3_有没有八年级上册英语单词朗读 MP3_世界最新

2023-05-26
杨亚林在怒江州调研时强调：守住线管住面全力维护边境民族地区安全稳定环球热讯

2023-05-26
会计证书的等级划分_会计证书-全球观焦点

2023-05-26
【世界说】美媒：得不到正确诊断和适当治疗……种族主义令美国黑人群体更易患阿尔茨海默病

2023-05-26
SHEIN也想做时尚女孩的“拼多多” 全球视讯

2023-05-26
天天快资讯：英首相女友赴美签证被拒_或因其曾对东非进行了访问

2023-05-26
看点：马斯克：AI有小概率可以毁灭人类

2023-05-26
2023贵州人才博览会黔西南州兴义市仓更镇人民政府面试成绩公示|每日速递

2023-05-26
qq主题怎么设置自己的照片(手机QQ应用主页面的设置)|世界最资讯

2023-05-26
灯烛_关于灯烛介绍

2023-05-26
卧室壁橱的标准

2023-05-26
1929年美国经济大萧条_美国经济大萧条的原因

2023-05-26
【全球快播报】浸的读音有什么区别_浸的读音

2023-05-26
天天实时：斗罗大陆之选择背景_斗罗大陆开局选择背景

2023-05-26
欧化(01711)发盈警，预期年度净亏损不多于2200万港元_每日快讯

2023-05-26
当前讯息：tpo防水卷材是什么材质_tpo防水卷材是什么

2023-05-26
腺苷怎么读_腺苷-世界速读

2023-05-26
水利部和中国气象局5月25日18时联合发布黄色山洪灾害气象预警

2023-05-26
时讯：莲湖区市民中心开设自助绘图区让办证绘图方便快捷又省心

2023-05-26
车门锁了后备箱锁不住是什么原因 _途达加装机械增压的利弊是什么-即时

2023-05-26
每日头条!2023天津建博会参观攻略（时间/地点/预约入口）

2023-05-26
环球资讯：洋河股份品牌价值何以再创新高？

2023-05-26
最高检：仍有大量性侵未成年人犯罪未落实强制报告制度环球热文

2023-05-26
怎么画手指心形_怎么画手指

2023-05-26
九部门：到2025年新增品牌培育管理体系贯标中小企业2000家以上今日要闻

2023-05-26
环球热头条丨第一次做手工作文200字(7篇)

2023-05-26
5月25日基金净值：华夏智胜价值成长A最新净值1.5411，跌0.1% 每日速读

2023-05-26
快看点丨房地产开发板块跌0.61% 深深房A涨6.07%居首

2023-05-26
长庆采气二厂劳动竞赛提升上产“加速度”

2023-05-26
中方宣布美光未通过安全审查，白宫急忙回应，称正与中方沟通焦点关注

2023-05-26
36e是多大的内衣码_36e是多大_世界新消息

2023-05-26
【天天新要闻】坎爷和新婚娇妻出街又雷人？不穿鞋就出来，娇妻内搭空气还蒙着脸

2023-05-25
国际油价最新消息：隔夜市场消息及数据汇总|天天简讯

2023-05-25
苯与氢气加成化学反应方程式_苯与氢气加成

2023-05-25
2023新疆高考准考证打印时间及入口在哪打印|环球热点评

2023-05-25
植物大战僵尸无尽版攻略图_植物大战僵尸无尽版攻略图文解析

2023-05-25
3D打印40年：从小众技术到大众应用还有多远？-每日热议

2023-05-25
天天时讯：连锁面馆行业“遇冷”，五爷拌面的挫折与野心

2023-05-25
热点评！首届天津音乐节 | 宋思衡：专业的艺术家专业的观众呈现高水准的音乐盛会

2023-05-25
观速讯丨苹果上架可定位旅行杯，售价1412元

2023-05-25
阿里旗下游戏《三国志·战略版》被判侵权，赔偿网易5000万每日聚焦

2023-05-25
蓝帆医疗：研发创新步入收获期 “穿越至暗”反转趋势显现

2023-05-25
聚焦：800余本伪造建筑工程师证件卖往全国各地，13人被抓

2023-05-25
成都市人民北路中学劳动月系列活动精彩纷呈

2023-05-25
后天，月球表面将浮现神秘“X”……_世界速读

2023-05-25
翅膀硬了！曝八村垒拒绝湖人报价，拒绝3年2400万坚持索要4年7000万|今日精选

2023-05-25
5G移动电话用户达6.34亿！工信部发布2023年1－4月份通信业经济运行情况|今日热文

2023-05-25
中国影视剧“乘风破浪”到非洲

2023-05-25
世界快消息！Mysteel日报：全国生铁价格弱势下行

2023-05-25
四大期指25日开盘小幅下跌焦点关注

2023-05-25
2023广西柳州市人力资源和社会局拟录用参照公务员法管理单位工作人员公示

2023-05-25
大连热电: 临2023-021大连热电股份有限公司股票交易异常波动公告每日视讯

2023-05-25
铠侠推出EXCERIA PLUS G3系列SSD：顺序读写 5000 MB/s，最高 2TB

2023-05-25
国家疾控局发布4月全国法定传染病疫情概况观速讯

2023-05-25
风味之中有“玄机”：复合调味料何以“智”造？_全球观天下

2023-05-25
视讯！黄峥VS许仰天，谁是欧美下沉市场之王？

2023-05-25
全球即时看！长城举报比亚迪排放不达标背后：专家称如果坐实审核标准会被动摇

2023-05-25
Pacific Asset Management Co.,Ltd减持广深铁路股份(00525)167万股每股作价约2.21港元速读

2023-05-25
广物控股集团10亿元超短期融资券将于6月1日兑付利率2.3%

2023-05-25
steam在连接至steam服务器时遇到问题视频（steam在连接至steam服务器时遇到问题）

2023-05-25
资讯：中捷精工（301072）：该股换手率大于8%（05-25）

2023-05-25
OpenAI竞对再被谷歌加注，4.5亿美元新融资到位，累计已吸金14.5亿美元-最新资讯

2023-05-25
加速数实融合，数据交易3.0模式上新天天热闻

2023-05-25
蘸水面怎么吃（蘸水）-环球最新

2023-05-25
15的因数有哪些50以内（15的因数有哪些）天天微资讯

2023-05-25
苹果公布最新供应链名单，中国厂商10进13出

2023-05-25
天天关注：官方售价24.95万元起新款奔驰长轴距A级上市

2023-05-25
今日关注：缩微农具留住乡愁

2023-05-25
今日最新！大模型之战，科大讯飞拼了

2023-05-25
当前关注：西条拓巳最后咋了_西条拓巳

2023-05-25
精选足篮专家：金宏侃球豪取11连红天涯侃球10连红观察

2023-05-25
天天新资讯：*ST金山收到上交所问询函要求对持续经营能力等做补充披露

2023-05-25
不止茶饮烘焙，半个餐饮圈都爱上了“低糖”_当前头条

2023-05-25
融资丨小型化高温质子交换膜燃料电池项目“氢新科技”再获千万级别天使+轮融资-全球观焦点

2023-05-25
每日焦点！你家的小区监控是真是假？来这里说说……

2023-05-25
四川宜宾市高县发生3.9级地震，震源深度9千米-全球热资讯

2023-05-25
元宇宙降温后，百度希壤业务负责人马杰退场丨游戏干线

2023-05-25
即时焦点：最新爆料！ChatGPT或嵌入Windows11，6月公测

2023-05-25
闭眼买、放心开，比亚迪e平台3.0究竟有哪些亮点，我们来一探究竟-天天精选

2023-05-25
精神向内，行动向外，创业者的人生加减法_焦点日报

2023-05-25
天天新动态：天衣无缝意思是啥天衣无缝意思

2023-05-25
ChatGPT的胜利，宣告知识图谱的消亡？

2023-05-25
百度何俊杰：用AI原生思维重构百度移动生态，让AI人人可用

2023-05-25
起底电诈⑥丨“嘘寒问暖”还是“飞来陷阱”?你的“领导”可能不是你领导……

2023-05-25
意大利警方破获文物走私案追回文物3500余件|世界最新

2023-05-25
Glassnode 数据研究：回顾比特币铭文爆发的“疯狂一周”_当前讯息

2023-05-25
每日时讯!云知声发布山海大模型，创始人黄伟：目标年内达到比肩ChatGPT的通用能力

2023-05-25
我，25岁，陷入“衰老焦虑”

2023-05-25
天天新资讯：维尼修斯感谢球迷和球队支持：爱你们，感谢，感谢，还是感谢！

2023-05-25
每日消息!泳池清洁的未来，机器正在取代人工

2023-05-25
小鹏汽车，等待拐点

2023-05-25
便利店玩联名，奥特曼来了也不管用

2023-05-25
一个路口开5家店，零食集合店生意还能火多久？

2023-05-25
A股申购 | 易实精密(836221.BJ)开启申购 2022年新能源汽车零部件产品收入占比增长至50.82% 天天热文

2023-05-25
让业务用起来 | 观远数据敏捷分析实践巡展上海站回顾-世界简讯

2023-05-25
世界焦点！中兴通讯宣布加入“科学碳目标倡议”（SBTi）

2023-05-25