Hugging Face 基于 300 亿参数的开 源模型构建了聊天机器人 HuggingChat。


(资料图片仅供参考)

ChatGPT 的问世改变了聊天机器人领域的格局,它强大的功能令人惊叹,但 OpenAI 几乎不可能将其开源。为了追赶 ChatGPT,开源社区做了很多努力。包括 Meta 开源的 LLaMA 系列模型及其二创等等。一些开源模型在某些方面的性能已可与 ChatGPT 媲美。

现在,构建了大型开源社区的 AI 初创公司 Hugging Face 宣布推出开源聊天机器人 HuggingChat。与 ChatGPT 类似,HuggingChat 可以完成一些复杂的生成任务,包括编写代码、起草电子邮件、创作歌词等等。

HuggingChat 地址:https://huggingface.co/chat/

英伟达 AI 科学家 Jim Fan 称赞道:「HuggingChat 是 ChatGPT 的开源替代品」,并表示「如果后续开发成应用程序,Hugging Face 比 OpenAI 更具优势」。

HuggingChat 本质上是一个用户界面,其背后由非营利组织 LAION 开发的对话模型 OpenAssistant/oasst-sft-6-llama-30b 作支撑,可以借助 Hugging Face 的 API 与现有应用程序和服务集成。oasst-sft-6-llama-30b 是 Open Assistant 团队基于 Meta 的 LLaMA-30B 微调的语言模型,拥有 300 亿参数。

OpenAssistant 项目地址:https://github.com/LAION-AI/Open-Assistant

OpenAssistant 项目最初是 2022 年 12 月创建的,其目标不只是复制 ChatGPT,研究团队还希望 OpenAssistant 能发展成一个可在消费级硬件上运行的工作助手,小巧而高效。此外,该团队还构建了一个 OpenAssistant Conversation 语料库,支持 35 种语言。

我们来看一下基于 OpenAssistant 的 HuggingChat 有哪些具体功能。

HuggingChat功能测试

我们从基本问答、数学计算、代码生成等方面测试了 HuggingChat 的能力。

首先,我们询问 ChatGPT 对内容生产有哪些影响,HuggingChat 从三个方面给出了回答:提高内容生产效率;信息检索与摘要;处理简单的工作。这个回答条理清晰,语言流畅。

然后我们询问其模型有多少参数,HuggingChat 非常谨慎,表示「不能透露技术细节,但是可以提供 API」。

在数学计算方面,我们测试发现 HuggingChat 不仅可以计算出正确结果,还能清楚地用自然语言描述计算过程,符合逻辑:

编程方面,我们用一个简单的例子 —— 判断一个数是否为奇数,测试了 HuggingChat 生成代码的能力。结果表明,HuggingChat 不仅可以生成符合要求的代码,还对代码给出了详尽正确的解释。

总体来看,HuggingChat 具备与 ChatGPT 类似的能力,并且生成结果可以在一定程度上媲美 ChatGPT。

当然,与所有文本生成模型一样,HuggingChat 生成的回答是随机的,可能会出现错误或者虚假信息。例如,当我们询问推特的 CEO 是谁,它只答对了一半:伊隆・马斯克的确是现任 CEO,但上一任 CEO 并不是 Jack Dorsey。

看来,想让模型生成的回答准确、高质量,HuggingChat 等聊天机器人还有很长的路要走。

HuggingChat 现已开启线上测试,感兴趣的读者快去试试吧。

推荐内容