给ChatGPT喂黑话学得贼快，网友：你把AI教恶心了我们还怎么玩？_中国智能在线

梦晨萧箫发自凹非寺量子位 | 公众号 QbitAI

ChatGPT彻底让网友们陷入疯狂，也带?了一众理论研究。

原因无他，这只AI说话太“对味”，不仅准确掌握沟通要领，就连人类的语言艺术都玩得明明白白。

这不，让它模仿产品经理挂在嘴边的“赋能”、“抓手”和“闭环”：

(资料图)

△ 图源@LeaskH，省略300+黑话词汇

ChatGPT张口就来：

△ 图源@LeaskH

味实在太冲，网友直呼“把AI教恶心了”：

但要知道，直到ChatGPT之前，语言模型还做不到精准get沟通要领，不仅回答经常驴唇不对马嘴，针对特定的说话风格也难以模仿到位。

什么时候开始，语言模型的对话能力变得这么强了？背后的原理究竟是什么？

对此，MIT助理教授Jacob Andreas提出观点：

最近这批语言模型，已经有了自己的“目标”和“信念”。

MIT：语言模型会推测人类意图

首先来看一个喜闻乐见的AI犯傻例子。

提示词是：我从来没吃过烤芝士三明治，在我母亲（）之前。

结果GPT-3的text-davinci-002版本，填上了“母亲去世之前”，后面却又说母亲在我小时候总是给我做这个吃，前后矛盾了。

除这种错误之外，当前的一众语言模型还会描述不可能出现的情况和无效的推论。

Jacob Andreas认为，这些错误的共同点是“AI未能对交流意图做建模，只满足了语法正确。”

不过，还是同样的GPT-3，只需在提示词中加上角色设定就会表现出截然不同的行为。

同样是保龄球和树叶的真空自由落体实验，让AI扮演一个物理学家就能得出正确答案“他们下落速度一样”。

同时AI也预测一个从没看过这个演示的人会以为保龄球更早落地，还能指出错误在于真空室中没有空气阻力。

从这些例子可以看出，语言模型可以模拟不同的智能体(agent)，预测它们的观察、内部状态、行动和语言。

不过口说无凭，直接上证据。

首先，Jacob Andreas训练了一个实验性的LSTM神经网络。

训练数据集中，有持两组不同信念的人A型人与B型人撰写的文章，以及尽管A、B中存在矛盾也全盘接受的O型人。

尽管训练中模型从来没见过有关身份的信息，仍然以98%的精度能执行按写作者类型分类的任务，并在一定条件下生成指定类型的文章。

Jacob Andreas认为此时的神经网络并不能看成A型、B型或O型智能体，但却可以模仿任意一种。

当然这个实验是极度简化的，不过在现实中也有大量例子可以佐证语言模型可以拥有意图（Intentions)、信念（Beliefs）和愿望（Desires）。

2017年，OpenAI在亚马逊电商评论数据集上训练了一个LSTM网络，并在完全不同IMDB电影评论数据上做了评估。

有意思的是，团队在网络中定位到一个专门对评论的态度做出响应的“情感神经元”，对情感正负面作二值分类时精度高达92%。

如果人为固定这个神经元的值，相应的态度也能体现在模型声称的电影评论文本上。

△ arxiv.org/abs/1704.01444

Jacob Andreas认为这代表语言模型尽管在训练中没看到评论配套的打分信息，仍然可以学到人类的意图，也就是写下这段文字是为了传递什么情绪。

语言模型学到人类的信念的证据，则来自2021年他自己团队的一项研究。

这次的训练数据集用冒险小说和实验操作描述，也就是说都涉及到一个人的观察和动作，模型架构采用了BART和T5。

△ arxiv.org/abs/2106.00737

在实验中，模型能以97%的精度推断出不同物体在一系列动作之后的状态和与其他物体的关系变化，尽管文本中没有明确提到这些变化。

与上一个实验一样，如果人为固定这些表征，同样可以影响生成文本。说明语言模型不仅学到了低层次的语法关系，还获得了对世界状态的“信念”：包括看到了什么，自己做了什么，以及对情况变化的推测。

最后轮到愿望或者说声称这段文字是为了完成什么目标（Goal），这次是最近OpenAI与牛津大学合作的一项有关提示工程的研究。

研究特意挑选了网络上的谣言、都市传说和误解比较多的内容作数据集。

使用常规问法时，模型果然会输出错误的答案，而且越大的模型错的越多。

△ arxiv.org/abs/2109.07958

一旦换个问法，在问题中加入“假如你是史密斯教授，经过仔细研究后……”，准确率就从38%飙升到58%。

如果在提问前先给一个阴谋论的示例，那准确率就剩下不到20%。

综合以上案例，Jacob Andreas认为当前的语言模型虽然还是会出错，但已经能作为未来智能体模型的基础，最终有望实现有目的交流和行动。

而在目前所有语言模型中，ChatGPT表现最为惊艳，它又有何特殊之处？

用人类沟通技巧训练ChatGPT

无论是架构还是训练方法，ChatGPT都不算一个船新的模型。

但在动用大量人（jin）力（qian）后，充分吸收了各种人类沟通技巧的ChatGPT横空出世，甚至还学会了合理拒绝，减少乱说话的情况发生。

先来看看它的架构和训练方法。

架构上，研究者们微调了GPT 3.5 中的某个模型，得到了ChatGPT。

GPT 3.5是一个模型合集，里面有三个模型，都是基于code-davinci-002迭代而来，包括text-davinci-002和text-davinci-003：

其中text-davinci-002就是在code-davinci-002的基础上，采用了InstructGPT训练方法改进得到，而text-davinci-003又是text-davinci-002的改进。

ChatGPT就是基于这几个模型之一做了微调，并同样采用了InstructGPT的训练方法。

训练上，InstructGPT采用了强化学习 “秘方”，让语言模型不再埋头苦干，而是学会对人类的反馈“做出反应”。

具体来说，研究人员先收集平时用户给GPT-3等模型输入的提示词，得到一个提示词数据集（用户同意的情况下）。

然后，基于这个提示词数据集，让模型输出几种不同的答案，并对这些答案进行排序，从而训练得到一个reward模型。

值得注意的是，这里的排序是人工打分的，研究者们聘请了约40人团队专门来给AI生成的效果打分，意在让AI输出“人类最满意的结果”。

最后，使用强化学习方法，使用reward模型对模型进行“调教”，从而让模型真正掌握人类沟通技巧。

所以这个方法也被称之为基于人类反馈的强化学习（RLHF，Reinforcement Learning from Human Feedback）。

不过，ChatGPT也没有完全照搬InstructGPT的训练方法，在数据收集设置上有些细微差异。

值得一提的是，这次训练ChatGPT，还动用了微软的Azure AI超级计算机。

估计等ChatGPT一收费，微软又要赚麻了。（手动狗头）

所以，这种训练方法效果有多神奇？

简单来说，InstructGPT在参数量只有GPT3的1%情况下，采用这种训练方法，输出效果依旧比GPT3更好。

如下图，InstructGPT模型在只有13亿参数（下图PPO-ptx和PPO）的时候，人类对它的输出效果，就要比1750亿参数的GPT-3 （下图GPTprompted和GPT）更满意：

值得注意的是，除了采用上述架构和训练方法以外，研究人员还额外给这个模型附加了不少限制 ——

让它拒绝输出（或生成提醒）虚假信息、血腥暴力等限制性内容和不道德的内容。

例如输入“当哥伦布2015年来到美国会发生什么”时：

未加限制的原版模型直接给出了违背历史的回答：

当哥伦布于2015年来到美国……

但ChatGPT却发现了这个bug，及时加上一句提醒：

这问题有点棘手，毕竟哥伦布1506年就死了。但我们可以假装他2015年来到了美国……

一下子AI生成的回答就显得有理有据了。

One More Thing

ChatGPT到底能不能算一个智能体模型，智能体模型和语言模型又有啥区别？

有人让它问了问它自己……

朋友们，你们说ChatGPT够格了吗？

MIT论文地址：

https://arxiv.org/abs/2212.01681

推荐内容

给ChatGPT喂黑话学得贼快，网友：你把AI教恶心了我们还怎么玩？

2022-12-19
环球速读：元宇宙开了个「盗梦空间」实体店！

2022-12-19
AI产业加速时代，我们为何要关注数据标注平台？

2022-12-19
三年结束，被“远程办公”挤爆的服务器，仍需向微软靠拢

2022-12-19
全球热资讯！众合云科集团创始人兼CEO 余清泉：当下中国企业需要跨地域的专业雇佣服务｜WISE 2022中国数字化创新高峰论坛

2022-12-19
【世界热闻】慧策荣获亿邦未来零售“数字化突出贡献奖”，以技术驱动零售数字化发展

2022-12-19
每日头条!VR游戏周报 | 《机甲足球》引进国内，《Population: One》更新沙盒模式

2022-12-19
世界观速讯丨从实体店窥见元宇宙空间

2022-12-19
Resolution Games召开发布会；Meta发布2023年VR办公场景的四大预测

2022-12-19
环球热消息：和明星干杯、和朋友击掌，VR里看世界杯竟然这么有意思

2022-12-19
科大讯飞：借力新潮“一体两翼”深耕社区营销，拥抱AI学习时代

2022-12-16
百度Apollo城市域智驾方案来袭安全熟路行车稳如“老司机”

2022-12-16
戴尔科技全球首席技术官John Roese预言2023

2022-12-16
爆火的ChatGPT，先颠覆谁？

2022-12-16
ICLR盲审阶段就被评审赞不绝口的论文：会是Transformer架构的一大创新吗？

2022-12-16
全球最资讯丨国防科大最新综述论文，全面阐述知识图谱推理技术进展

2022-12-16
微动态丨在一篇由GPT-3生成的论文中，ChatGPT重现了图灵测试的原始论文

2022-12-16
基于太赫兹波段的负曲率轨道角动量光纤

2022-12-16
联讯总经理李建征入选广州市会展和数字经济知识产权保护中心专家库

2022-12-16
世界视点！数据可视化实用干货分享

2022-12-16
环球最新：增长分析产品入选《2022中国数字化转型与创新评选》榜单

2022-12-16
热点！张溪梦谈与奇点云合并：借助数据云，分析云实现了全域能力｜36氪Pro

2022-12-16
信息：特斯拉可玩上千Steam游戏/ Waymo防撞测试结果不输人类/ Twitter欲强制开启个性化广告…今日更多新鲜事在此

2022-12-15
全球观点：量子位揭2022人工智能年度公司&人物榜单，深兰科技同时入选

2022-12-15
美象科技：以「数字孪生技术」赋能数字经济，连接「虚拟与现实」| 镁客·请讲

2022-12-15
全球观天下！符合人类创作过程的AIGC：自动生成长故事的模型出现了

2022-12-15
全球快看点丨从“围观”到“交朋友”，皮皮App线上派对打破互动壁垒

2022-12-15
2024年，苹果将允许开发者在欧洲上架第三方商店

2022-12-15
每日热讯!亲测ChatGPT写文章，我终于感受到了被元宇宙攻陷的未来

2022-12-15
大厂追逐AI绘画新风口：热闹、流量和变现想象力

2022-12-15
IAA品类洞察：扫描品类加快变现，如何抓住增长机遇？

2022-12-15
全球微动态丨NFT2.0：探索NFT未来发展之路

2022-12-15
天天热文：中国广电云南2022任务进展

2022-12-15
【聚看点】总预算240万元，中广电移动启动项目管理系统一期工程项目招标

2022-12-15
天天热资讯！航天宏图全自动建模软件：PIE-Smart 下载

2022-12-15
全球实时：2022年11月VR/AR行业月报 | VR陀螺

2022-12-15
世界快看点丨中国移动杨慰民：自智网络实现L3自动化闭环，将向L4智能化闭环演进

2022-12-15
全球讯息：电信与联通在广东开通全国首个共建共享低频5G基站

2022-12-14
山东济南：到2025年培育100家以上元宇宙企业

2022-12-14
今日热文：数字化转型，越务实越成功

2022-12-14
环球最新：用友BIP项目云，让服务类项目管理如此敏捷

2022-12-14
云游戏拉开产业化大幕

2022-12-14
焦点速递！这些车企在企业微信里，装上高速的“组织引擎”

2022-12-14
焦点速讯：香港证券交易所首批BTC和ETH期货ETF登场，12月16日挂牌上市交易

2022-12-14
全球观焦点：“AI换脸”不能想换就换，深度合成技术新规落地

2022-12-14
全球快资讯：130亿美元！Meta或再收天价罚单，下一个轮到谁？

2022-12-14
谷歌启动ARCore地理空间API挑战赛；索尼新专利显示其或正在开发AR游戏

2022-12-14
今日聚焦!元宇宙现金订单频繁落地，炒概念终于回归业绩本身

2022-12-14
当前速讯：蔡进：以数字化平台链接上下游企业是目前的一大趋势

2022-12-14
环球信息:清华大学互联网产业研究院平台经济首席专家平庆忠：网上商城是企业数字供应链建设的基础

2022-12-14

环球速读：元宇宙开了个「盗梦空间」实体店！

2022-12-19
给ChatGPT喂黑话学得贼快，网友：你把AI教恶心了我们还怎么玩？

2022-12-19
AI产业加速时代，我们为何要关注数据标注平台？

2022-12-19
三年结束，被“远程办公”挤爆的服务器，仍需向微软靠拢

2022-12-19
全球热资讯！众合云科集团创始人兼CEO 余清泉：当下中国企业需要跨地域的专业雇佣服务｜WISE 2022中国数字化创新高峰论坛

2022-12-19
今日快讯：融资丨「Databento」完成3180万美元融资，Trousdale Ventures、Unusual Ventures等领投

2022-12-19
环球热资讯！融资丨「SafeAI」完成3800万美元B轮融资，Builders VC、Autotech Ventures等投资

2022-12-19
融资丨「飞步科技」完成超亿元B2轮融资，安徽省铁路发展基金和浙江大学教育基金会联合投资

2022-12-19
天天微头条丨创业邦、复旦管院联办2022未来独角兽峰会，12月29日上海见

2022-12-19
融资丨「缤趣小方精品母婴生活馆」完成数百万天使轮融资，氢创资本投资

2022-12-19
win7产品密钥最简单激活方法是什么？最新win7永久激活密钥的办法是什么？

2022-12-19
安卓大屏刷机教程是什么？安卓手机刷机用什么刷机工具？

2022-12-19
海尔统帅跟海尔热水器哪个质量好？海尔洗衣机都有哪几种样子？

2022-12-19
海尔统帅跟海尔热水器哪个质量好？现在的海尔洗衣机怎么样？

2022-12-19
宏碁电脑售后维修点查询是什么？宏碁电脑售后维修服务中心怎么样？

2022-12-19
液晶拼接屏幕有两种吗？拼接屏如何取消拼接功能？

2022-12-19
电脑黑屏教你如何修复黑屏？开机黑屏安全模式也是黑屏？

2022-12-19
win7无法安装无线网卡驱动？如何安装网卡驱动win7？

2022-12-19
电脑键盘上快捷键是哪个？笔记本电脑键盘的快捷键是哪个？

2022-12-19
新联想bios设置u盘启动的办法是什么？联想启天m4500如何设置u盘启动？

2022-12-19
【快播报】融资丨「金竟科技」完成A+轮融资，光速中国领投

2022-12-19
你笑《贪玩蓝月》不懂游戏，《贪玩蓝月》笑你不懂人生

2022-12-19
【世界热闻】慧策荣获亿邦未来零售“数字化突出贡献奖”，以技术驱动零售数字化发展

2022-12-19
世界观速讯丨从实体店窥见元宇宙空间

2022-12-19
Resolution Games召开发布会；Meta发布2023年VR办公场景的四大预测

2022-12-19
每日头条!VR游戏周报 | 《机甲足球》引进国内，《Population: One》更新沙盒模式

2022-12-19
环球热消息：和明星干杯、和朋友击掌，VR里看世界杯竟然这么有意思

2022-12-19
环球看点！程一笑的“取舍” | 大佬们的2022

2022-12-19
每日短讯：太难了，堂食刚恢复，餐厅员工就“阳”了一大片

2022-12-19
世界快讯:1.5万家火锅阵亡，让设备回收公司赚翻天

2022-12-19
焦点速讯：“拖延型”股权激励，会让公司付出更大“代价”

2022-12-19
每日热闻!2022最后一个月，日本市场又杀出个小爆款？

2022-12-19
兔年经济前景黯淡，但资本市场却未必

2022-12-19
环球看热讯：曾经风光无限的日式快餐，正悄悄败走中国

2022-12-19
站在物美的肩膀，多点长不大？

2022-12-19
天天消息！2022啤酒股PK：华润向上，燕京向下

2022-12-19
视焦点讯！李书福“一把手工程”厉害了，即将拿下第8个IPO

2022-12-18
精彩看点：为什么中国品牌最爱阿根廷队？

2022-12-18
当前聚焦：年轻人纷纷“入坑”！每4个人就有一辆，“国民车”小电驴火爆2022

2022-12-17
天天新资讯：全国最会吃鸡的地方，靠它造就“百亿产业”

2022-12-17
当前短讯！电影《阿凡达》大成，游戏《阿凡达》大败？

2022-12-17
热推荐：《阿凡达2》：不完美，但能“救命”

2022-12-17
院线需要阿凡达

2022-12-17
当前最新：周鸿祎，追“风”者也

2022-12-17
天天热消息：李诞带着脱口秀，来到淘宝直播间

2022-12-17
环球观点：一件印着Supreme大logo的服装，怎么就成了顶级潮流？

2022-12-17
世界新资讯：“高烧”让电解质水“沸腾”，被抢断货

2022-12-17
“北面浓度”越来越高，它凭什么成为年轻人的“校服”？

2022-12-17
全球观焦点：便利店的“三大样板”

2022-12-17
科大讯飞：借力新潮“一体两翼”深耕社区营销，拥抱AI学习时代

2022-12-16
融资丨「Uolo」完成A轮融资，Winter Capital领投

2022-12-16
今日视点：拉夫劳伦是怎么教美国人当爹的？

2022-12-16
短讯！新能源车的下半场：“国补”之后，谁将裸泳？

2022-12-16
席梦思负债10亿美元申请破产，火了100多年的床垫慈禧都睡过

2022-12-16
百度Apollo城市域智驾方案来袭安全熟路行车稳如“老司机”

2022-12-16
戴尔科技全球首席技术官John Roese预言2023

2022-12-16
“卡塔尔小王子”中国捞金：一个愿打，一个愿挨

2022-12-16
融资丨「Pathzero」完成860万澳元A+轮融资，Carthona Capital领投

2022-12-16
环球报道:融资丨「BR光电保养」完成一亿元人民币天使轮投资，小崧科技投资

2022-12-16
【焦点热闻】只要放弃拯救人类文明，马斯克就能让特斯拉重回巅峰？

2022-12-16
微动态丨在一篇由GPT-3生成的论文中，ChatGPT重现了图灵测试的原始论文

2022-12-16
基于太赫兹波段的负曲率轨道角动量光纤

2022-12-16
全球最资讯丨国防科大最新综述论文，全面阐述知识图谱推理技术进展

2022-12-16
爆火的ChatGPT，先颠覆谁？

2022-12-16
ICLR盲审阶段就被评审赞不绝口的论文：会是Transformer架构的一大创新吗？

2022-12-16
当前视点！遭疯抢的电解质水，收割了谁？

2022-12-16
今日视点：融资丨「华先医药」完成超亿元的B+轮融资，粤科珠西（粤科集团）、拓为中汇联合领投

2022-12-16
环球讯息：不看门店，资本看上了餐饮“打工人”？

2022-12-16
今日讯！黑马频出，中式汉堡硝烟渐起

2022-12-16
【天天播资讯】正午的阳光不刺眼了

2022-12-16
博思得c168打印教程是什么？博思得e58标签打印机怎么安装？

2022-12-16
电脑突然蓝屏是什么原因导致的？电脑无缘无故蓝屏如何修复？

2022-12-16
苹果笔记本进不去系统？苹果笔记本重装系统教程是什么？

2022-12-16
电脑中丢失dll文件怎么办？win7电脑丢失dll文件怎么恢复？

2022-12-16
u盘无法读取也不能格式化？u盘无法格式化有写保护怎么办？

2022-12-16
科达视频会议终端密码找回？科达视频会议模板？

2022-12-16
电脑连不上网显示黄色感叹号？电脑wifi已连接但有感叹号？

2022-12-16
苹果12死机强制重启按什么键？苹果12手机失灵了如何强制关机？

2022-12-16
怎么远程修改路由器密码？怎样修改无线路由器密码？

2022-12-16
电脑连不上网是怎么回事？电脑连不上网了怎么办教程是什么？

2022-12-16
电脑突然蓝屏出现英文无法重启？电脑蓝屏关机自动重启？

2022-12-16
世界视点！数据可视化实用干货分享

2022-12-16
联讯总经理李建征入选广州市会展和数字经济知识产权保护中心专家库

2022-12-16
环球最新：增长分析产品入选《2022中国数字化转型与创新评选》榜单

2022-12-16
热点！张溪梦谈与奇点云合并：借助数据云，分析云实现了全域能力｜36氪Pro

2022-12-16
世界报道:携程回暖，尚需时日

2022-12-16
全球今日讯！虎头局开放加盟，筹备出海，连锁小吃的春天又来了？

2022-12-16
世界看热讯：中国打工人，“掘金”卡塔尔

2022-12-16
全球热推荐：「辣条第一股」弄丢了多少人的信心？

2022-12-16
这三年离开职场的人，现在怎么样了？

2022-12-16
水果自由的「锅」，百果园和洪九果品谁来背？

2022-12-16
信息：特斯拉可玩上千Steam游戏/ Waymo防撞测试结果不输人类/ Twitter欲强制开启个性化广告…今日更多新鲜事在此

2022-12-15
美象科技：以「数字孪生技术」赋能数字经济，连接「虚拟与现实」| 镁客·请讲

2022-12-15
全球观点：量子位揭2022人工智能年度公司&人物榜单，深兰科技同时入选

2022-12-15
全球观天下！符合人类创作过程的AIGC：自动生成长故事的模型出现了

2022-12-15
2024年，苹果将允许开发者在欧洲上架第三方商店

2022-12-15
每日热讯!亲测ChatGPT写文章，我终于感受到了被元宇宙攻陷的未来

2022-12-15
全球快看点丨从“围观”到“交朋友”，皮皮App线上派对打破互动壁垒

2022-12-15
大厂追逐AI绘画新风口：热闹、流量和变现想象力

2022-12-15
IAA品类洞察：扫描品类加快变现，如何抓住增长机遇？

2022-12-15