大数据文摘授权转载自夕小瑶的卖萌屋

作者: 天于刀刀

当我们在抱怨搜索引擎的时候我们具体在说些什么?


(资料图片)

也许是饱受诟病的广告?或者是不合理的网页排序?又或是一种最直观的感觉——不好使。

但是从来没有人抱怨过搜索引擎这一个模式。

尽管这些年,也诞生一些诸如Magi这样让人眼前一亮的新型搜索产品,试图颠覆旧的搜索形式,但无一例外宣告失败。

直到这几天,一个重磅看似与搜索无关的AI模型的诞生,却大有撼动谷歌搜索地位的趋势...

这是一个在Twitter上特别火的帖子,目前已获得3千多次转推:

Google is done. 谷歌时代结束了。

这条Twitter的博主搜索了一些它日常请教谷歌的问题(query),却发现OpenAI刚刚发布的“AI对话模型ChatGPT”的回答,完爆了谷歌搜索结果。。。

博主问谷歌的问题是:

In Latex, how do I represent a different equation? (在Latex中,如何书写微分方程)

谷歌给出的搜索结果:

尽管谷歌给出的结果也看起来很智能了,搜索首位直接贴出来了回答。

但我们再看一下ChatGPT的回答:

真的是没有对比,就没有伤害哇!

在没见过ChatGPT的回复的情况下,笔者已经觉得谷歌的回答够好了。但看了ChatGPT的回答,立刻感受到了“优秀学生”与“年级第一”的区别。

这条推特的博主,还贴出了大量的搜索问题,发现相当多的问题,谷歌搜索被ChatGPT完爆了。

感兴趣的小伙伴可以去看原推,非常精彩:

https://twitter.com/jdjkelly/status/1598021488795586561

这里就不一一搬运了。

看完后,笔者只能感叹,谷歌、百度这些老牌搜索引擎,这次可能真的“摊上事儿”了。

接下来,我们再简单看一眼这个ChatGPT模型的官方定义:

根据其官网上的介绍,目前它们推出的 ChatGPT 支持和用户通过对话的形式“回答问题”,并且赋予了一些简单的智能化行为,例如“承认自己的不足、识别一些错误的假设和拒绝一些不合理的请求”。

ChatGPT模型Demo测试地址:

https://chat.openai.com/chat

推特用户@jdjkelly的推文[1] 还表示,它发现对于代码开发类的搜索query,ChatGPT的回答强势的完爆了谷歌——ChatGPT除了给出了代码方案外,他还非常详细地给出了相应的解释!

该用户测试的搜索query是:

How do I mark a solidity function as callable only by the contract creator? (如何将solidity函数标记为只能由合同创建者调用?)

谷歌的回答:

ChatGPT的回答:

不仅贴代码,还附带解释真是太秀了。。。

对比搜索步骤,ChatGPT 为我们节省了大量的(无效)阅读时间和检索时间!其生成的解释性文字也十分地清晰和易读,能够很好地帮助回答客户的疑问。

最重要的是,它可以 直接生成可供复制的代码 诶!(打工人泪目)

目前该项目链接已经被免费开放 [2],不少外网开发者在试用中声称 ChatGPT 针对他们的技术问题提供了非常详细的解决方案。此外还在多个领域的知识问答和闲聊场景下,ChatGPT 同样表现出了不俗的智能。

笔者忍不住做了进一步的测试:

首先第一条测试数据,咱们中国人给 ChatGPT 直接上点难度,用中文进行输入,让它先介绍一下自己:

嗯。。。中规中矩的结果,看不出来什么太多情况。唯一能够得到的结论是 ChatGPT 支持中文输入,这个对于中文开发人员和研究者来说可以说是一个好消息。

那么我们再尝试将他和其他搜索引擎相比呢?

学术软件使用问题:

谷歌:在LaTex中,我应该如何输入一个偏微分方程?

ChatGPT :在LaTex中,我应该如何输入一个偏微分方程?

产品推荐问题:

谷歌:Say I have 1000 dollars, recommend me a pinarello bike (假如我有一千美元,请推荐一款 pinarello 的自行车)

ChatGPT:Say I have 1000 dollars, recommend me a pinarello bike (假如我有一千美元,请推荐一款 pinarello 的自行车)

闲聊问题:

ChatGPT:我最近肚子不舒服,有什么药能推荐一下吗

ChatGPT:你知道夕小瑶的卖萌屋吗?

知识问答问题:

ChatGPT:什么是世界杯?

ChatGPT:自行车蹭碟后怎么维修?

可以看到 ChatGPT 在一些问题中普遍表现出了远超预期的效果,对于问题的回复和解答基本上还是有意义的。

对于一些存在隐私限制的搜索结果,ChatGPT 也会很谨慎地表示自己只是一个机器,我们更应该遵循专业人士的建议。

在和 ChatGPT 进行交互的过程中,笔者感觉 与其说是自己主动地在寻找信息,不如说是在和一个“智慧长老”进行互动 :它会针对你的问题进行合理地回答,只要它知道。

这个特点让笔者想起了“第五范式:数据工程”的 reStructured Pre-training [3] 。

这篇文章的作者将预训练大模型类比为人脑和传统的数据库,都是数据储存的一个媒介。而在进行数据检索的时候,人脑依靠的是思考,数据库依靠的是 SQL 语言,而预训练大模型则依靠的是 prompt。

短短2个月前学界还在质疑 prompt 是否能够完全达到“所查即所得”的效果,也就是说,下游任务并不知道使用何种 prompt 可以更好地从大模型中获取想要的结果。

1个月前,在大众层面人们们逐渐习惯了 AI 绘画的“关键字” prompt 概念,开始绞尽脑汁想着自己独特的“魔法咒语”。

而在 2022 年的最后一个月,我们突然发现也许不用多么复杂的“咒语”也能呼唤出我们真正想要的信息结果。

NLP 技术的快速爆发让所有人都猝不及防,也许在不知不觉间中一个全新的时代已经来临。

目前 ChatGPT 没有通过互联网检索信息的能力 ,因此在一些边界问题上略显无知。此外 ChatGPT 可能因为语料缺失的原因导致了它对于中文语料的陌生。

(关二爷:俺是俺儿子?!?)

推荐内容