17 May

谷歌在生成式AI领域发起了全方位反击。


(相关资料图)

来源 | 头号AI玩家( AIGCplayer )

作者丨卷毛 卡子

谷歌在生成式AI 领域发起了全方位反击。

5月11日凌晨,在一年一度的谷歌I/O开发者大会上,谷歌发布了全新的大语言模型PaLM 2、搭载PaLM 2的Bard、AI应用Duet AI以及一系列产品升级,涵盖搜索、办公、云服务、安卓系统等场景。

面对OpenAI和微软的步步紧逼,谷歌不再像以往那样采取谨慎策略,而是大胆拥抱新趋势,让生成式AI技术全面渗透至“谷歌全家桶”,“重新塑造包括搜索在内的所有核心产品”。

这意味着,数十亿用户的生活、工作会因此改变。

大模型PaLM 2首次亮相,可在移动端使用

在本次大会上,谷歌宣布正式推出全新一代的大语言模型PaLM 2,对标GPT-4。

据介绍,PaLM 2提供四种size的模型,以动物大小来形容的话,从最小到最大分别为:壁虎、水獭、野牛和独角兽。

其中壁虎版本非常轻巧,它可以在移动设备上工作,即使在离线时也能运行,并且速度足够快,每秒可处理20个token。

谷歌并未透露其参数规模,但相比前一代,PaLM 2体积虽小,在多语言、推理和编码功能上却有了大幅提升。

多语言性:PaLM 2在多语言文本方面接受了更多的训练,涵盖100多种语言。这显着提高了它在多种语言中理解、生成和翻译细微差别文本(包括成语、诗歌和谜语)的能力。PaLM 2还通过了“精通”级别的高级语言能力考试。

推理能力:PaLM 2的广泛数据集包括科学论文和包含数学表达式的网页。因此,它在逻辑、常识推理和数学方面有所改进。

编码能力:PaLM 2在大量公开可用的源代码数据集上进行了预训练。这意味着它擅长Python和JavaScript等流行的编程语言,但也可以生成Prolog、Fortran和Verilog等语言的专用代码。

除此之外,PaLM 2还支持多模态理解,可以在医疗专业领域发挥作用。谷歌展示了Med-PaLM 2,一个专注医疗领域的微调模型,能看懂和分析X光照片,据说是第一个在美国医疗执照考试类问题上表现出“专家”水平的大语言模型。

目前,PaLM 2已经开放预览。本次大会提到的大多数产品也是在PaLM 2基础上实现更新的。

另外,谷歌CEO桑德尔·皮查伊还剧透了谷歌下一代大模型Gemini的信息,他称Gemini旨在实现多模态、高效和为未来创新而构建。

Bard开放使用,与Adobe合作生成图片

谷歌旗下AI聊天产品Bard,首先借助PaLM 2大模型进行了升级。

在编码功能方面,现在的Bard支持20多种编程语言,可以生成、解释和调试代码,并轻松导出至Google Colab。

输入“此代码无效,请修复”,Bard就能进行调试

值得注意的是,Bard升级后支持多模态对话,在回答中会附带图片;

提问“新奥尔良有哪些必看景点”

同时Bard也能读懂图片,比如上传两只狗的照片要求它写一个有趣的标题,Bard会结合Google Lens的能力,一步步分析照片、检测狗的品种并起草一些创意说明。

Bard还能接入来自整个网络的各种服务,比如Adobe创意生成AI工具Firefly、音乐流媒体网站Spotify、视频网站Youtube等等。

这意味着虽然Bard本身暂时不能直接生成图片,但可以与外部工具合作生成。据现场演示,向Bard输入指令“在儿童派对上制作独角兽和蛋糕的图像”,Adobe Firefly的创意图片生成功能就会联动反应,在几秒钟内生成对应图像。

目前Bard已取消候补名单,向180多个国家和地区开放使用,但暂时仅提供英语、日语和韩语版本,未来将支持40种语言,包括中文。

搜索、办公、地图等产品全面融入AI

SGE:全新的谷歌搜索引擎

谷歌的王牌产品搜索引擎在生成式AI技术加持下,推出了全新的SGE(Search Generative Experience)。

对于品牌广告商来说,借助SGE,搜索广告将继续出现在整个页面的专用广告位中,仍有机会接触到潜在客户。

比如当用户使用谷歌SGE搜索一款自行车时,AI会给出多款产品描述、评论、价格和展示图。

Duet AI:谷歌版的微软Copilot协同办公

对标微软的Copilot协同办公服务,谷歌推出了新品牌Duet AI,涵盖一系列适用于谷歌生产力应用程序的生成式AI工具。

Duet AI+Gmail邮箱:支持移动端,在手机上,只需几句话作为提示,就可以起草完整的邮件回复。

Duet AI+Docs文档:只需输入想撰写的主题,Docs就会立即生成草稿,其中包括提供位置和状态等信息。

Duet AI+PPT演示文稿:可以直接在谷歌幻灯片中从文本创建原始图像。

Duet AI+表格:帮助分析和处理表格中的数据。

不过,要访问这些新工具,用户需要注 Workspace Labs并加入候补名单。谷歌表示,该产品会在“在未来几周内将服务扩展到更多的用户和国家”。

Google maps:沉浸式路线地图

谷歌地图结合AI功能推出全新的沉浸式路线视图,使用Aerial View API和3D Tiles构建身临其境的体验,用户将以新的交互方式查看空气质量、天气和交通情况。谷歌称该功能将在今年夏天推出,并在年底前向15个城市推出。

Google photos:Magic Editor魔法编辑

Google photos宣布将上线全新图片编辑功能Magic Editor,通过AI技术感知图片内的内容,检测并移动物体,同时还可以用生成的视觉效果补全空白。

——

除了以上主要的AI更新之外,谷歌还宣布了专为安卓系统开发的AI编码机器人Studio Bot,AI学习工具Project Tailwind,面向企业的AI平台VertexAI。在基础设施方面,谷歌还宣布将和英伟达合作,搭建基于H100的下一代A3图形处理器超级计算机,以及基于它的虚拟机,并且PaLM模型的API也将在不久开放。

可以预见,谷歌此番更新将影响数十亿用户,人工智能正在愈加渗透进我们的日常生活。正如谷歌在大会上多次提到的关键词“大胆而负责任(bold and responsible)”,我们在大胆拥抱AI的同时,如何承担起社会责任也是需要各方深思和共同探索的。

推荐内容