ChatGPT自己会选模型了！微软亚研院+浙大爆火新论文|环球时讯_中国智能在线

【新智元导读】「贾维斯」已来！微软亚研院和浙大推出了一个大模型协作系统HuggingGPT，让ChatGPT协调HF社区模型，处理各种多模态任务能力超强。

ChatGPT引爆的AI热潮也「烧到了」金融圈。

近来，彭博社的研究人员也开发了一个金融领域的GPT——Bloomberg GPT，有500亿参数。

GPT-4的横空出世，让许多人浅尝到了大型语言模型的强大能力。

(资料图片)

然而，OpenAI不open。业界许多人纷纷开始做GPT的克隆，而且许多ChatGPT平替的模型都是基于已经开源的模型上构建，尤其是Meta开源的LLMa模型。

比如，斯坦福的草泥马（Alpaca）、UC伯克利联手CMU、斯坦福等骆马（Vicuna），初创公司Databricks的Dolly等等。

针对不同任务和应用构建的各种类ChatGPT的大型语言模型，在整个领域呈现出百家争鸣之势。

那么问题来了，研究者如何选择合适的模型，甚至是多个模型，去完成一项复杂的任务呢？

近日，微软亚洲研究院和浙江大学的研究团队，发布了一个大模型协作系统HuggingGPT。

论文地址：https://arxiv.org/pdf/2303.17580.pdf

HuggingGPT利用ChatGPT作为控制器，连接HuggingFace社区中的各种AI模型，来完成多模态复杂任务。

这意味着，你将拥有一种超魔法，通过HuggingGPT，便可拥有多模态能力，文生图、文生视频、语音全能拿捏了。

HuggingGPT搭桥

研究者指出解决大型语言模型（LLMs）当前的问题，可能是迈向AGI的第一步，也是关键的一步。

因为当前大型语言模型的技术仍然存在着一些缺陷，因此在构建 AGI 系统的道路上面临着一些紧迫的挑战。

- 受限于文本生成的输入和输出形式，当前LLMs缺乏处理复杂信息（如视觉和语音）的能力；

- 在实际应用场景中，一些复杂任务通常由多个子任务组成，因此需要多个模型的调度和协作，这也超出了语言模型的能力范围；

- 对于一些具有挑战性的任务，LLMs在零样本或少样本设置下表现出优异的结果，但它们仍然比一些专家弱（如微调模型）。

为了处理复杂的人工智能任务，LLMs应该能够与外部模型协调，以利用它们的能力。因此，关键点在于如何选择合适的中间件来桥接LLMs和AI模型。

研究者发现，每个AI模型都可以通过总结其模型功能表示为一种语言形式。

由此，便引入了一个概念，「语言是LLMs，即ChatGPT，连接人工智能模型的通用接口」。

通过将AI模型描述纳入提示中，ChatGPT可以被视为管理人工智能模型的大脑。因此，这一方法可以让ChatGPT能够调用外部模型，来解决实际任务。

简单来讲，HuggingGPT是一个协作系统，并非是大模型。

它的作用就是连接ChatGPT和HuggingFace，进而处理不同模态的输入，并解决众多复杂的人工智能任务。

所以，HuggingFace社区中的每个AI模型，在HuggingGPT库中都有相应的模型描述，并将其融合到提示中以建立与ChatGPT的连接。

随后，HuggingGPT将ChatGPT作为大脑来确定问题的答案。

到目前为止，HuggingGPT已经围绕ChatGPT在HuggingFace上集成了数百个模型，涵盖了文本分类、目标检测、语义分割、图像生成、问答、文本到语音、文本到视频等24个任务。

实验结果证明，HuggingGPT拥有处理多模态信息和复杂人工智能任务的能力。

四步工作流程

HuggingGPT整个工作流程可以分为如下四个阶段：

- 任务规划：ChatGPT解析用户请求，将其分解为多个任务，并根据其知识规划任务顺序和依赖关系

- 模型选择：LLM根据HuggingFace中的模型描述将解析后的任务分配给专家模型

- 任务执行：专家模型在推理端点上执行分配的任务，并将执行信息和推理结果记录到LLM中

- 响应生成：LLM总结执行过程日志和推理结果，并将摘要返回给用户

多模态能力，有了

实验设置

实验中，研究者采用了gpt-3.5-turbo和text-davinci-003这两种GPT模型的变体作为大型语言模型（LLMs），这些模型可以通过OpenAI API公开访问。

为了使LLM的输出更加稳定，我们将解码温度设置为0。

同时，为了调整LLM的输出以使其符合预期格式，我们在格式约束上设置了logit_bias为0.1。

研究人员在如下表格中提供了为任务规划、模型选择和反应生成阶段而设计的详细提示，其中{{variable}}表示在提示被输入LLM之前，需要用相应的文本填充域值。

研究人员在广泛的多模态任务上测试了HuggingGPT。

在ChatGP和专家模型的配合下，HuggingGPT可以解决语言、图像、音频和视频等多种模式的任务，包含了检测、生成、分类和问题回答等多种形式的任务。

虽然这些任务看起来很简单，但掌握HuggingGPT的基本能力是解决复杂任务的前提条件。

比如，视觉问答任务：

文本生成：

文生图：

HuggingGPT可以整合多个输入的内容来进行简单的推理。可以发现，即使有多个任务资源，HuggingGPT也能将主要任务分解成多个基本任务，最后整合多个模型的推理结果，得到正确答案。

此外，研究人员通过测试评估了HuggingGPT在复杂任务情况下的有效性。

就HuggingGPT处理多项复杂任务的能力进行了展示。

当处理多个请求的时候，可能包含多个隐含任务或者需要等多方面的信息，这时依靠一个专家模型来解决是不够的。

而HuggingGPT可以通过任务规划组织多个模型的协作。

一个用户请求中可能明确包含多个任务：

下图展示了HuggingGPT在多轮对话场景下应对复杂任务的能力。

用户将一个复杂的请求分成几个步骤，通过多轮请求达到最终目标。结果发现，HuggingGPT可以通过任务规划阶段的对话情境管理来跟踪用户请求的情境状态，并且可以很好地解决用户提到的请求资源以及任务规划。

「贾维斯」开源

目前，这一项目已经在GitHub上开源，但是代码并没有完全公布。

有趣的是，研究者给这个项目命名为《钢铁侠》中的贾维斯，无敌AI这就来了。

JARVIS：一个连接LLMs和ML社区的系统

顺便提一句，HuggingGPT需要有了OpenAI的API才可以使用。

网友：研究的未来

JARVIS / HuggingGPT就像此前Meta提出的Toolformer一样，都在充当着连接器的作用。

甚至，包括ChatGPT plugins也是如此。

网友称，「我强烈怀疑第一个人工通用智能（AGI）的出现将比预期更早。它将依靠「胶水」人工智能，能够智能地将一系列狭义人工智能和实用工具粘合在一起。

我获得了访问ChatGPT的Wolfram插件的权限，这使它一夜之间从数学菜鸡变成了数学天才。当然，这只是一个小步骤，但却预示着未来的发展趋势。

我预测，在接下来的一年左右，我们将看到一种人工智能助手，它与数十个大型语言模型（LLMs）及类似工具相连，而终端用户只需向其助手发出指令，让其为他们完成任务。这个科幻般的时刻即将到来。

还有网友称，这就是未来的研究方法。

GPT在一大堆工具面前，知道如何使用它们了。

推荐内容

ChatGPT自己会选模型了！微软亚研院+浙大爆火新论文|环球时讯

2023-05-09
“AI教父”Hinton离职谷歌最新访谈视频_世界观速讯

2023-05-09
竞逐国产大模型，谁能最先落地？

2023-05-09
科大讯飞等在马鞍山成立大数据公司# 注册资本1亿

2023-05-09
世界讯息：国产AI大模型酣战，科大讯飞打响“智慧涌现”第一枪

2023-05-09
焦点快报!思必驰明日科创板上会：对话式AI赋能汽车、家电等场景，营收复合年增长54%

2023-05-09
苹果新专利显示正在为未来HMD研究光栅显示器；和光微获近千万元融资

2023-05-09
2023华为中国合作伙伴大会：数字未来如何共赢？动态

2023-05-09
谷歌内部文件泄漏：谷歌、OpenAI都没有护城河，大模型门槛正被开源踏破

2023-05-09
【盘点】眼动追踪在XR中的八大应用，注视点渲染仅是“前菜”-环球热讯

2023-05-09
这个AI，还能一键生成测试用例

2023-05-09
「冷门歌手」AI翻唱大爆发，整个华语乐坛都「复兴」了

2023-05-09
世界快消息！谷歌慌了！想发论文得审批，优先开发产品，让OpenAI没得看

2023-05-09
支付宝决定「抖音化」，可行吗？天天实时

2023-05-08
百事通！日本自卫队拟扩编网络防御部队

2023-05-08
在云上搭建“新房子”：数据空间会成为Game Creater吗？_每日报道

2023-05-08
币安再次暂停比特币提取

2023-05-08
排名前 12%!店匠科技荣获威比奖(The Webby Awards)提名

2023-05-08
刘兴亮丨谷歌担心步柯达后尘？_每日头条

2023-05-08
通用人工智能即将到来？环球时快讯

2023-05-08
全球热门:IDC：2022年中国IT安全硬件市场规模同比下降3.3%

2023-05-08
焦点速递！讯飞“星火”抢夺AI话语权

2023-05-08
微软否认与AMD合作开发自研处理器“雅典娜”-全球最资讯

2023-05-08
【全球报资讯】微软Bing Chat全面开放，所有人可用！官宣多项重大升级，日活用户超过1亿

2023-05-08
全球热讯:【新闻资讯】蚂蚁集团数字科技开发者大会探讨Web3.0发展趋势和跨链技术应用

2023-05-08
IBM加入战局！任意大模型低成本变ChatGPT方法开源，个别任务超GPT-4

2023-05-08
OpenAI没有护城河：当我们能把世界塞进一块显卡里|当前速看

2023-05-08
大模型物种进化图转疯了：8位华人打造，一眼看懂“界门纲目”，原来BERT后代已绝种|当前看点

2023-05-08
只限今日免费，Midjourney 5.1震撼更新！逼真到给跪，中国情侣细节惊艳，3D视频大片马上来简讯

2023-05-08
国产大模型又添一把“火”，烧起来了！-环球时讯

2023-05-08
热议：【视眼界】OpenAI竟诞生于这个饭局！38岁ChatGPT之父还想让两个男人怀上孩子

2023-05-08
最强跨模态AI守护者！AIGC内容风险挑战不容忽视！

2023-05-08
全球微动态丨【陀螺对话】智能汽车开启人类“第三空间”，智能座舱如何结合VR/AR/MR

2023-05-08
【天天速看料】秘史公开！当年，马斯克离开 OpenAI 的真相

2023-05-08
Midjourney 5.1 来了，使用更丝滑，网友已经玩嗨了_世界实时

2023-05-08
人工智能在风控中的应用|热闻

2023-05-08
天天即时看！候选人公示！中国广电5G USIM卡项目

2023-05-06
消息称技术中台CTO线完成架构调整，阿里大中台彻底结束世界讯息

2023-05-06
天天热消息：2023，工具行业增长与变现逻辑变了

2023-05-06
【新闻资讯】人工智能正在改变我们的互联网工作方式和生产力

2023-05-06
第六届数字中国建设峰会回顾，华为有哪些不容错过的亮点？

2023-05-06
拼多多总部迁至爱尔兰？京东60亿元建4000套公寓；五粮液一季度营收311.39亿元；星巴克上线“沿街取” | 营销周鉴

2023-05-06
虚拟数字人平台商业化模式

2023-05-06
用户数已达 870 万与三大运营商抢用户广电 5G到底行不行

2023-05-06
Bing AI 聊天现已向所有人开放，并且功能将变得更加强大

2023-05-06
AI投资思路再梳理|焦点资讯

2023-05-06
OpenAI首席科学家揭密GPT探索过程中不为人知的技术细节

2023-05-06
速递！中国联通与腾讯成立合营公司“云宙时代”

2023-05-06
全球播报:中国联通携手腾讯官宣新公司，云宙时代正式成立

2023-05-06
【天天新视野】从华为CIO陶景文2020年11月的公开演讲中，探究华为自研ERP产品的研发策略与市场意义（三）

2023-05-06

冉雄飞：中甲假球再次查到神秘经纪人Y，很可能涉及到高洪波

2023-05-09
“AI教父”Hinton离职谷歌最新访谈视频_世界观速讯

2023-05-09
ChatGPT自己会选模型了！微软亚研院+浙大爆火新论文|环球时讯

2023-05-09
立夏后别只盯着阔腿裤了！今年流行这4条，显高显瘦不说，还洋气_全球热讯

2023-05-09
上项目增投资优环境大厂：奋勇争先跑出高质量发展加速度

2023-05-09
一季度业绩爆表，证券ETF大涨5%领涨市场

2023-05-09
竞逐国产大模型，谁能最先落地？

2023-05-09
陇南森林消防开展实战化训练

2023-05-09
云赏江苏，共赴13城锦绣之约|全球简讯

2023-05-09
新资讯：DNV预测2050年交通运输业石油需求将减少一半

2023-05-09
世界即时：“星舰”爆炸背后：马斯克与美国官僚体制的战争

2023-05-09
投资笔记：规避五类风险

2023-05-09
美元兑瑞郎汇率走势分析：美元兑瑞郎证实了下行期权市场信号回落至0.8900的合理性每日快讯

2023-05-09
世界讯息：国产AI大模型酣战，科大讯飞打响“智慧涌现”第一枪

2023-05-09
焦点快报!思必驰明日科创板上会：对话式AI赋能汽车、家电等场景，营收复合年增长54%

2023-05-09
乌媒：基辅市及周边响起爆炸声防空系统正在工作每日头条

2023-05-09
科大讯飞等在马鞍山成立大数据公司# 注册资本1亿

2023-05-09
环球时讯：舒畅和宋祖儿_宋祖儿父母

2023-05-09
登录淘宝显示网络崩溃了怎么回事？优酷怎么突然显示网络崩溃了？

2023-05-09
快影怎么使视频里的声音变声？快影录视频怎么全屏？

2023-05-09
突发！大众软件公司高管集体被炒，CEO也未能幸免，仅人事主管留任

2023-05-09
空间看过的视频会保存到哪里?网上的视频怎么保存到相册里?

2023-05-09
马力刺客｜仰望U9+兰博基尼Revuelto+路特斯ELETRE 上海车展10000匹大挑战-今日报

2023-05-09
2022年十大增员行业

2023-05-09
焦点短讯！中国假发征战全球简史

2023-05-09
怎么把群里的视频发到抖音里?抖音群群主怎么把别人消息撤回?

2023-05-09
可乐大战背后：元气森林走到十字路口

2023-05-09
抖音同步头条上的视频能删除吗?头条怎么关闭同步功能?

2023-05-09
监控通道不在同一网段怎么添加?监控视频怎么添加通道?

2023-05-09
防诈骗视频宣传片?qq视频诈骗不给钱就群发?

2023-05-09
视频显微镜的用法?内窥镜组装好做吗?

2023-05-09
美国即将重登全球石油霸主宝座？-焦点播报

2023-05-09
谷歌内部文件泄漏：谷歌、OpenAI都没有护城河，大模型门槛正被开源踏破

2023-05-09
火山小视频怎样拒收火苗?火山小视频播放量过万怎么办?

2023-05-09
天津佳源兴创新能源科技有限公司校园招聘公告

2023-05-09
焦点热讯:中国电信粤港澳大湾区一体化数据中心（一期）项目开工

2023-05-09
【盘点】眼动追踪在XR中的八大应用，注视点渲染仅是“前菜”-环球热讯

2023-05-09
水质总磷的快速测定仪提升水环境监测效率_世界简讯

2023-05-09
这个AI，还能一键生成测试用例

2023-05-09
2023华为中国合作伙伴大会：数字未来如何共赢？动态

2023-05-09
苹果新专利显示正在为未来HMD研究光栅显示器；和光微获近千万元融资

2023-05-09
热推荐：5月9日西乌珠穆沁旗金田氢氟酸价格暂稳

2023-05-09
苹果siri怎么用苹果Siri使用方法讲解

2023-05-09
“浪姐4”美依礼芽人气断层，下一个“王心凌”为何是国际姐姐？

2023-05-09
今日要闻!卖爆了！黄金首饰每克直逼600元销售：“有时一天涨7元”！百克金条回购收益近万

2023-05-09
「冷门歌手」AI翻唱大爆发，整个华语乐坛都「复兴」了

2023-05-09
世界快消息！谷歌慌了！想发论文得审批，优先开发产品，让OpenAI没得看

2023-05-09
广东未来三天降雨连连粤西等局地有大雨或暴雨-天天日报

2023-05-09
速递！降息预期下调美债收益率周初继续回升

2023-05-09
全球快看点丨MathGPT来了！专攻数学大模型，解题讲题两手抓

2023-05-09
OpenAI再获百亿融资估值近300亿美元红杉资本、PayPal创始人旗下基金等知名风投参投

2023-05-09
南阳开工重大项目46个，总投资564.8亿元

2023-05-09
35亿收购成最大败笔，Lululemon的「心头肉」变成「拖油瓶」

2023-05-09
“沉迷”兼职的年轻人

2023-05-09
别让大模型重蹈“全民造芯”的覆辙-天天新动态

2023-05-09
天天日报丨今豫言丨把握项目建设的辩证法

2023-05-09
葛洪乳腺易主任揭晓为什么这么多人都患有乳腺增生?

2023-05-09
苹果公司抢在美国CPI和PPI数据发布前于美国蓝筹债券市场发行52.5亿美元债券信息

2023-05-09
馆长被区长辱骂推倒？吕梁市政府通报：没有任何肢体接触_热消息

2023-05-09
奕东电子：截止2023年4月28日，公司股东户数为24508户-环球新消息

2023-05-09
魅族MX2_关于魅族MX2简述|当前快讯

2023-05-09
喀喇沁旗科协开展 “专家下基层助力乡村振兴” 活动|环球热消息

2023-05-09
全球今日讯！双一流大学是什么意思_镇静的意思是什么

2023-05-09
游戏Hentai_hentai8游戏全球今日报

2023-05-09
全球速递！诛仙2在线观看完整版2_诛仙2免费完整版

2023-05-09
湖南机电职院电气工程学院：多措并举促就业 “职”引未来谱新篇_环球时快讯

2023-05-08
5月8日汤姆猫发布公告，其股东减持2384.2万股

2023-05-08
“中特估”概念持续爆发！当前资讯

2023-05-08
特斯拉涨价，惹怒了谁？

2023-05-08
每日头条!中天科技：公司完成400G光模块研发试产且已开始向关键客户批量发货

2023-05-08
天天看热讯：派斯林(600215.SH)拟出售六合房产100%股权及转让经开物业100%股权交易价达10.68亿元

2023-05-08
宅男财经|李宇嘉谈淄博房地产：经济增速超房价，非常理想的发展路径_每日信息

2023-05-08
【全球新要闻】华明装备: 2022年年度权益分派实施公告

2023-05-08
为什么有人希望陈梦退役？深度分析：中国女乒还不能缺了她-环球热文

2023-05-08
居然之家：全资子公司为控股孙公司提供9000万元担保

2023-05-08
商丘古城：一块廉洁文化的沃土

2023-05-08
支付宝决定「抖音化」，可行吗？天天实时

2023-05-08
热点聚焦：中国中铁: 中国中铁第五届董事会第二十八次会议决议公告

2023-05-08
指导市民科学健身！南京柔力球社会体育指导员进基层教学

2023-05-08
天天热文：医生年度个人工作总结精选多篇_医生年度个人工作总结

2023-05-08
当前播报:3dmax中如何调整渲染清晰度

2023-05-08
环球播报:火车上被持刀杀害男子表哥发声：凶手有前科，工作人员错过抢救时机

2023-05-08
4k纸长多少厘米宽多少厘米 4k纸

2023-05-08
融资丨「启英泰伦」完成数千万元B++轮融资

2023-05-08
世界速读：融资丨「Tiamat」获数百万美元A+轮投资，线性资本领投

2023-05-08
融资丨「通甪科技」获数千万投资，东方富海领投

2023-05-08
融资丨优控智行完成数千万A轮融资，元禾控股领投

2023-05-08
五月来了，古人都怎么过？全球今热点

2023-05-08
全球热门:融资丨「泰楚生物」完成A轮融资，IDG资本领投

2023-05-08
观察：华安基金：对黄金投资价值保持中性偏乐观态度

2023-05-08
世界最资讯丨健脾胃的中成药有哪些_健脾胃的中成药

2023-05-08
国家知识产权局印发《系统治理商标恶意注册促进高质量发展工作方案（2023—2025年）》_世界动态

2023-05-08
苹果为何做不好AI？

2023-05-08
为什么革命性技术总出现在小公司？-焦点快报

2023-05-08
古茗奶茶一店员上班偷吃西瓜！公司回应：正在核查，网友：这是真上班吃瓜啊

2023-05-08
币安再次暂停比特币提取

2023-05-08
在云上搭建“新房子”：数据空间会成为Game Creater吗？_每日报道

2023-05-08
当前快看：ST华英（002321）5月8日主力资金净卖出201.14万元

2023-05-08
百事通！日本自卫队拟扩编网络防御部队

2023-05-08
美能能源: 关于参加2023年陕西辖区上市公司投资者集体接待日暨2022年度业绩说明会的公告_全球新要闻

2023-05-08