热议：微软亚研院：Language Is Not All You Need_中国智能在线

鱼羊发自凹非寺量子位 | 公众号 QbitAI

还记得这张把谷歌AI搞得团团转的经典梗图吗？

现在，微软亚研院的新AI可算是把它研究明白了。

(相关资料图)

拿着这张图问它图里有啥，它会回答：我看着像鸭子。

但如果你试图跟它battle，它就会改口：看上去更像兔子。并且还解释得条条是道：

图里有兔子耳朵。

是不是有点能看得懂图的ChatGPT内味儿了？

这个新AI名叫Kosmos-1，谐音Cosmos（宇宙）。AI如其名，本事确实不小：图文理解、文本生成、OCR、对话QA都不在话下。

甚至连瑞文智商测试题都hold住了。

而具备如此能力的关键，就写在论文的标题里：Language is not all you need。

多模态大语言模型

简单来说，Kosmos-1是一种把视觉和大语言模型结合起来的多模态大语言模型。

在感知图片、文字等不同模态输入的同时，Kosmos-1还能够根据人类给出的指令，以自回归的方式，学习上下文并生成回答。

研究人员表示，在多模态语料库上从头训练，不经过微调，这个AI就能在语言理解、生成、图像理解、OCR、多模态对话等多种任务上有出色表现。

比如甩出一张猫猫图，问它这照片好玩在哪里，Kosmos-1就能给你分析：猫猫戴上了一个微笑面具，看上去就像在笑。

又比如让它看一眼MSRA用来高效训练大模型的TorchScale工具包的主页，Kosmos-1也能快速get这个库是用来干啥的。

Kosmos-1还能理解图像上下文。发一张食物的照片给它，这个AI不仅能回答你这是什么，还能在你追问如何烹饪时，给出食谱和烹调小建议。

Kosmos-1的骨干网络，是一个基于Transformer的因果语言模型。Transformer解码器作为通用接口，用于多模态输入。

用于训练的数据来自多模态语料库，包括单模态数据（如文本）、跨模态配对数据（图像-文本对）和交错的多模态数据。

值得一提的是，虽说“Language is not all you need”，但为了让Kosmos-1更能读懂人类的指示，在训练时，研究人员还是专门对其进行了仅使用语言数据的指令调整。

具体而言，就是用（指令，输入，输出）格式的指令数据继续训练模型。

实验结果

研究人员在5大类共10个任务中，测试了Kosmos-1的效果，包括：

语言任务：语言理解、语言生成、无OCR文本分类

跨模态迁移：常识推理

非语言推理：IQ测试（瑞文递进矩阵）

感知-语言任务：图像说明、视觉QA、网页QA

视觉任务：零样本图像分类、带描述的零样本图像分类

从实验结果上来看，Kosmos-1基本都hold住了。

零样本图像说明：

零样本视觉QA：

无OCR文本理解：

研究人员还提到，Kosmos-1是第一个能完成零样本瑞文智商测试的AI。

不过，跟成年人类的平均水平相比，AI的“智商”还差得有点远。随机选择的正确率为17%，而Kosmos-1经过指令调教之后，准确率为26%。

研究人员认为：

但Kosmos-1证明了多模态大模型有潜力将感知和语言结合起来，进行零样本的非语言推理。

另外，研究人员还展示了Kosmos-1处理复杂问答和推理任务的过程。关键在于多模态思维链提示。

研究人员将感知-语言任务分解为两个步骤。第一步，给定一个图像，引导模型对图像进行分析。

第二步，把模型子集分析出来的结果再喂给它，并给出任务提示，以生成最后的答案。

这项新研究来自MSRA的韦福如团队。韦福如是微软亚洲研究院自然语言计算研究组主管研究员。

三位一作分别是Shaohan Huang、董力和Wenhui Wang。

推荐内容

热议：微软亚研院：Language Is Not All You Need

2023-03-06
科技部部长十天两提ChatGPT

2023-03-06
当前看点!聚观早报 |京东百亿补贴今日上线；微软推出全能型人工智能模型

2023-03-06
今日看点：软件巨头Salesforce掌舵人敲响衰退警钟强调公司战略转向

2023-03-06
新动态：硅谷哪一点最值得中国创业者们学习？

2023-03-06
物联网网络安全中容易忽视的几大问题

2023-03-06
全球观察：6G、人工智能、低碳转型，三位部长这样说→

2023-03-06
天天要闻：为什么协议会销毁代币？ BNB使用回购和销毁，冲进全球市值前5名

2023-03-06
环球热点评！奥普光电：禹衡光学的产品在工业机器人领域已成为大型企业稳定供货商

2023-03-06
一周热门项目动态: ZigZag空投等（0227-0305）

2023-03-06
即时看！在文心一言出生地，百度悄悄燃烧AI小宇宙

2023-03-06
1003家中国公司被美国列入黑名单

2023-03-06
一座海上营业厅，一个女孩独自守望的十九年

2023-03-06
全球头条：美国发布《人工智能风险管理框架》

2023-03-06
当前速看：Stable Diffusion读你大脑信号就能重现图像，研究还被CVPR接收了

2023-03-06
头条：杀疯了，AIGC，太牛逼了吧！

2023-03-06
天天时讯：科技部部长用梅西解释ChatGPT；欧盟或将批准微软收购动视暴雪｜产业周报

2023-03-06
今日播报!被ChatGPT带飞的AIGC，能为垂直产业做些什么？

2023-03-06
PC的时代与时代的PC（上）——7000字长文解读PC的发展历史与VR的发展阶段

2023-03-06
环球微动态丨一文了解边缘计算与云计算

2023-03-06
焦点速看：亿田智能：密织销售网点，信息化手段赋能终端销售

2023-03-06
看热讯：谷歌高管回应员工的质疑：AI聊天机器人Bard不仅仅是搜索而已

2023-03-06
全球热点评！ChatGPT会给创投行业带来哪些影响？

2023-03-06
【环球新要闻】周鸿祎称大学生可做人工智能训练师

2023-03-06
环球百事通！中国移动：与产业伙伴通力合作5G商用

2023-03-03
百度集团首席战略官余正钧辞任

2023-03-03
【新闻资讯】下一个十年，互联网发展趋势，互联网升级方向在哪里

2023-03-03
世界快资讯：电信运营商智慧社区机遇与挑战

2023-03-03
短讯！七朋元宇宙办公对于传统办公减少时间耗资成本

2023-03-03
OpenAI挖了近100位大佬！谷歌、Meta等大厂沦为「后备人才库」

2023-03-03
OneGame：中国移动的算网赋能雄心

2023-03-03
百事通！AI，在音乐领域继续狂飙

2023-03-03
环球观速讯丨“家门口”体验未来生活！像航无接触电梯终端落地国内首个社区沉浸式生活体验馆

2023-03-03
AI落地的范式创新，比一个ChatGPT更激动人心

2023-03-03
快播：ControlNet star量破万！2023年，AI绘画杀疯了？

2023-03-03
当前信息：腾讯发布承诺书，明确“重视女性员工价值”

2023-03-03
全球消息！软通智慧科技注册资本增加约5.9%至约2.51亿元

2023-03-03
IDC：2022年中国VR一体机首破100万台年出货量大关；Avalon融资1300万美元打造数字世界

2023-03-03
热点评！ChatGPT 开放 API接口，游戏行业要变天了？

2023-03-03
每日速看!AI时代的漫谈

2023-03-03
焦点快播：高通发布全球首个可商用部署的iSIM卡

2023-03-03
【全球新要闻】Win11支持连接iPhone，可实现PC端接打电话

2023-03-03
天天短讯！苏州立法禁止大数据“杀熟”,注重保护数据安全

2023-03-03
ChatGPT丨AIGC与真伪鉴别AI的猫鼠游戏

2023-03-03
全球讯息：Omdia观察：专网和多样化是沃达丰发展边缘网络的关键

2023-03-03
世界看热讯：玫琳凯华丽转身：中国市场已全面实现数字化转型升级

2023-03-02
环球观速讯丨昆仑万维回应Opera浏览器接入ChatGPT：目前仅在国外测试

2023-03-02
天天观热点：江苏神通：全资子公司核能装备获得高新技术企业证书

2023-03-02
腾讯类ChatGPT保密项目爆出，17级首席科学家-张正友带队研发

2023-03-02
支付宝口碑10万蚂蚁铁军创始人王志坚先生助力打造星瞳推手铁军

2023-03-02

科技部部长十天两提ChatGPT

2023-03-06
热议：微软亚研院：Language Is Not All You Need

2023-03-06
世界观焦点：十首最好老歌_我踩着不变的步伐是什么歌

2023-03-06
苏宁易购官网和京东哪个好？京东和苏宁哪个靠谱？

2023-03-06
今日热文：硅谷哪一点最值得中国创业者们学习？

2023-03-06
新动态：硅谷哪一点最值得中国创业者们学习？

2023-03-06
物联网网络安全中容易忽视的几大问题

2023-03-06
全球观察：6G、人工智能、低碳转型，三位部长这样说→

2023-03-06
路由器都有哪些牌子？路由器面板哪个牌子好？

2023-03-06
winter中文意思是什么？winterboard教程是什么？

2023-03-06
今日看点：软件巨头Salesforce掌舵人敲响衰退警钟强调公司战略转向

2023-03-06
当前看点!聚观早报 |京东百亿补贴今日上线；微软推出全能型人工智能模型

2023-03-06
tplink无线路由器设置步骤是什么？tp路由器如何设置网速快？

2023-03-06
魔兽世界裂齿如何驯服？魔兽世界掘地鼠怎么抓？

2023-03-06
环球热点评！奥普光电：禹衡光学的产品在工业机器人领域已成为大型企业稳定供货商

2023-03-06
天天要闻：为什么协议会销毁代币？ BNB使用回购和销毁，冲进全球市值前5名

2023-03-06
天天观察：word文档方框里打对号_Word怎么方框中打对号、错号

2023-03-06
两弹一星是什么

2023-03-06
即时看！在文心一言出生地，百度悄悄燃烧AI小宇宙

2023-03-06
一周热门项目动态: ZigZag空投等（0227-0305）

2023-03-06
每日快讯!融资丨打造专业康复机器人矩阵，司羿智能获近亿元A轮融资

2023-03-06
daemontools设置虚拟光驱？daemonto虚拟光驱教程？

2023-03-06
一座海上营业厅，一个女孩独自守望的十九年

2023-03-06
qq飞车白羊为什么这么厉害？qq飞车怎么才能得到绵羊？

2023-03-06
英雄联盟男枪打野出什么装备？英雄联盟男枪上单出装？

2023-03-06
当前速看：Stable Diffusion读你大脑信号就能重现图像，研究还被CVPR接收了

2023-03-06
全球头条：美国发布《人工智能风险管理框架》

2023-03-06
1003家中国公司被美国列入黑名单

2023-03-06
当前热文：玉米纤维面料的优缺点_什么是玉米纤维毛巾布玉米纤维毛巾有哪些特点及用处

2023-03-06
全球观热点：首发丨质肽生物完成亿元级B轮融资，蓝驰创投领投

2023-03-06
win32启动失败怎么办？win11不能运行exe程序？

2023-03-06
魔兽世界怀旧服dk输出循环介绍？魔兽世界怀旧服dk怎么出新手村？

2023-03-06
每日聚焦：融资丨AR新锐企业雷鸟创新完成首轮过亿元融资

2023-03-06
融资丨虚拟人底层技术公司奥丁科技完成Pre-A轮融资，毅达资本独家投资

2023-03-06
天天时讯：科技部部长用梅西解释ChatGPT；欧盟或将批准微软收购动视暴雪｜产业周报

2023-03-06
今日播报!被ChatGPT带飞的AIGC，能为垂直产业做些什么？

2023-03-06
头条：杀疯了，AIGC，太牛逼了吧！

2023-03-06
PC的时代与时代的PC（上）——7000字长文解读PC的发展历史与VR的发展阶段

2023-03-06
环球微动态丨一文了解边缘计算与云计算

2023-03-06
看热讯：谷歌高管回应员工的质疑：AI聊天机器人Bard不仅仅是搜索而已

2023-03-06
全球热点评！ChatGPT会给创投行业带来哪些影响？

2023-03-06
世界百事通！扫描文件保存到电脑是什么格式_扫描文件保存在哪里

2023-03-06
【环球新要闻】周鸿祎称大学生可做人工智能训练师

2023-03-06
焦点速看：亿田智能：密织销售网点，信息化手段赋能终端销售

2023-03-06
全球热门:沉香曲的作用和功效_沉香的作用和功效

2023-03-06
全球快看点丨小红书的本质：一个完美的算法男友

2023-03-06
从日咖夜酒到咖啡炸鸡，哪个才是咖啡发展的终极形态？

2023-03-06
环球微资讯！年轻人“抠”出来的200亿市场，没有未来？

2023-03-06
ChatGPT创业:狮子和土狼一起奔向光明

2023-03-06
世界看点：手机丢失微信怎么登_手机丢失微信怎么找回

2023-03-06
安徽交通厅厅长_安徽交通厅

2023-03-06
焦点日报：价值数万元的玉石掉进列车便池，动车组机械师：掏！

2023-03-05
每日头条!玉皇大帝和如来佛祖有什么不同

2023-03-05
快报：李白与厉以宁

2023-03-05
中国锂电企业，为何钟爱去瑞士上市

2023-03-05
京东“百亿补贴”提前20小时上线，价格战开打

2023-03-05
资金入市积极ETF资产净值再创新高金十数据3月5日讯，截至3月5日，今年以来ETF总规模增加超154亿元；ETF资产净值再创新高，相比去年3月的低点增长近20%

2023-03-05
拍企业宣传片

2023-03-05
北大团队搞出ChatExcel，说人话自动处理表格，免费且不限次使用

2023-03-05
当前短讯！北京烤鸭哪里好吃_各自有什么特色

2023-03-05
2020情人节祝福语简洁

2023-03-05
分成91亿，B站UP主真的赚翻了？

2023-03-05
环球热点评！张兰、董明珠……女企业家的抖音方法论

2023-03-05
今日看点：ChatGPT带来的巨大范式转移，意味着什么

2023-03-05
热门看点：抖音卷美团：流量掘金，意在广告

2023-03-05
世界看热讯：四线城市开社区咖啡店，真是一门好生意吗？

2023-03-05
老牌跨境电商Wish CEO 严峻：现在没法坐在中国看全球了，必须本地化

2023-03-05
工信部部长金壮龙：今年工业经济有望回升，这些地方要挑大梁

2023-03-05
每日头条!高宠岳飞谁厉害

2023-03-05
[综漫]全家就我一个纯种人类

2023-03-05
速递！别计较，有些人根本不重要！

2023-03-05
今热点：修身衬衫，让你的身材好到爆表

2023-03-05
【世界聚看点】4位谷歌Al绘画大牛携手创业，天使估值7个亿

2023-03-04
小红书出海，打不过“小黄书”

2023-03-04
为什么矿泉水越卖越贵？

2023-03-04
天天观察：药理学博士创业研发抗癌创新药，68岁收获IPO

2023-03-04
头条：如何添加qq空间背景音乐_如何操作

2023-03-04
天天亮点！姚明退役是因为什么

2023-03-04
天天观察：随着全球气候变暖、冰层融化_随着全球气候变暖

2023-03-04
天天观热点：餐饮“入殓师”：二手餐饮设备的隐秘江湖

2023-03-04
全球球精选！天龙八部演员表_大家一起来看看吧

2023-03-04
天天速讯：5元咖啡，“逼疯”瑞幸

2023-03-04
天天视点！2亿美元融资落空，40万中小餐饮商家“意外摔倒”

2023-03-04
世界速讯：当你感觉“拿捏”了拼多多

2023-03-04
诞生第一家喜茶的小城，正在被咖啡店包围

2023-03-04
每日简讯：拼多多冷对价格战？

2023-03-04
李佳琦流水一样的助播里，终于捧出一位“爽文大女主”？

2023-03-04
周杰伦演唱会有多火，“代抢”的生意就有多野

2023-03-04
天天要闻：融资丨「金智维」获得5亿元C轮融资，国开金融领投

2023-03-03
全球今日讯！走进启赋资本，洞察最新产业趋势，把握融资逻辑丨璀璨计划

2023-03-03
环球百事通！中国移动：与产业伙伴通力合作5G商用

2023-03-03
每日快看：卖气球日赚千元后，我选择了辞职

2023-03-03
肯德基，玩梗比炸鸡在行

2023-03-03
世界视讯！年入5亿，毛利率三连降，瑞幸供应商要上市，能“躺赢”吗？

2023-03-03
【新闻资讯】下一个十年，互联网发展趋势，互联网升级方向在哪里

2023-03-03
世界快资讯：电信运营商智慧社区机遇与挑战

2023-03-03
百度集团首席战略官余正钧辞任

2023-03-03
全球热头条丨特斯拉讲了很多新故事，但投资者认为还不够

2023-03-03
迷你世界打不了字应该怎么办？迷你世界打不了字了怎么办？

2023-03-03
焦点短讯！把公司做到世界500强，他却觉得太小了

2023-03-03