Agent开发的一小步，大模型应用的一大步_中国智能在线

Chat GPT带起飞的大模型无疑是上半年最火热的赛道，随着GPT-4的发布，各大互联网巨头、科技公司等纷纷入局。而在国内市场，过去几个月间大模型就已密集“涌现”。

不得不说，ChatGPT是大模型发展的重要里程碑，它将 AI 重新推向了时代中心，成为了新一轮数字技术竞争的制高点。

(相关资料图)

在“百模大战”愈演愈烈的同时，OpenAI创始成员Andrej Karpathy却将目光转向了另一端——Agent

“

每当有新的Agent论文出来的时候，团队都会很兴奋并且认真地讨论。

你们（开发者们）都正站在Agent开发的最前沿，这个领域OpenAI也没什么积累。

”

OpenAI创始成员Andrej Karpathy就在黑客马拉松演讲中表示，相比大模型训练，OpenAI内部目前更关注Agent领域。

什么是Agent？

在大模型语境下，可以理解成能自主理解、规划、执行复杂任务的系统。

以AutoGPT和BabyAGI为代表的技术演示型项目，今年4月短暂的火了一阵，但离真正应用到业务中还有一段距离。

现在，Agent第二轮爆发正在酝酿中，标志就是新一轮应用与场景结合更紧密了。

不出意外，先行动起来的又是编程开发行业。

最近的热门开源项目Sweep，直接与GitHub的Issue和Pull Request场景整合，自动“清扫”bug报告和功能请求，直接完成对应代码。

创业公司中，也有OpenAI支持的Cursor代码编辑器，把生成代码抬到了一句话生成整个项目框架的高度。

接下来，Agent也将成为新的起点，

成为各行各业构建新一代AI应用必不可少的组成部分。

对此，初创公司Seednapse AI创始人提出构建AI应用的五层基石理论，受到业界关注。

★Models，也就是我们熟悉的调用大模型API。

★Prompt Templates，在提示词中引入变量以适应用户输入的提示模版。

★Chains，对模型的链式调用，以上一个输出为下一个输入的一部分。

★Agent，能自主执行链式调用，以及访问外部工具。

★Multi-Agent，多个Agent共享一部分记忆，自主分工相互协作。

创业先锋之外，

连AI基础设施的巨头也已经开始在Agent上发力。

比如亚马逊云科技纽约峰会上宣布的Amazon Bedrock Agents新功能，便是这种趋势最有代表性的体现。

Amazon Bedrock Agents在全托管基础模型服务的基础上，又把开发、部署和管理多个Agent的能力打包集成在一起。

如果按照前面的五层基石理论，这类服务相当于直接从第五层开始，大大降低开发门槛。

正如亚马逊云科技在发布会上所形容：

☞只用几次点击，搞定能执行任务的生成式AI应用。

可以预见的是，降低了门槛的Agent应用也将在各行各业全面爆发。

Agent，AI应用新时代的起点

怎样才算一个Agent应用？OpenAI华人科学家翁丽莲给出直观的“配方”：

☞Agent = 大模型+记忆+主动规划+工具使用

以亚马逊云科技平台为例，开发Agent应用首先要根据具体任务场景给Agent选择合适的基础模型。

Amazon Bedrock上除了自家的Amazon Titan大模型，还集结了擅长安全可控的Anthropic、擅长检索汇总信息的Cohere、以及专攻文生图的stability.ai等各家模型。

选好后，把要执行的任务指令直接用文字描述出来，让Agent明白要扮演的角色和要完成的目标。

指令可以是包括一系列“问题-思考步骤-行动步骤-示例”的结构化提示词，在ReAct（协同推理和行动）技术支持下，基础模型可以通过推理和决策找出相应的解决方案。

接下来的重头戏便是Add Action Group（添加动作组）。

Agent要完成的具体任务，以及能使用的工具如企业系统API、Lambda函数等都是在这里设置。

官方演示中是一个保险索赔管理场景，Agent通过提取未结索赔的列表、确定每个索赔的未完成文书工作并向保单持有人发送提醒来管理保险索赔。

所有动作组设置好后，创建Agent和部署都是几次点击就能完成。

部署完成后，在测试中就可以看到Agent理解用户请求、将任务分解为多个步骤（收集未结保险索赔、查找索赔ID、发送提醒）并执行相应的操作。

Amazon Bedrock通过向导式交互界面，减少了配置基础模型所需的编码工作量。

动作组提供调用API实现特定功能，以及使用自己的数据构建差异化应用程序，又让基础模型能够完成更复杂的实际业务任务。

在整个流程中，还可以配合亚马逊云科技平台上的各种安全服务。比如使用PrivateLin建立基础模型和本地网络之间的私有连接，所有流量都不会暴露给互联网。

又通过提供完全托管的服务，让开发者不需要管理底层系统就能发挥基础模型的能力。

最终缩短从基础模型到实际应用的周期，加速基础模型为业务创造的价值。

加速大模型应用，还应关注什么

有了Amazon Bedrock的Agent能力，我们得以快速将大模型投入实际业务，为企业实现降本增效或创新。

但要真正利用生成式AI的全部价值、发挥全部潜力，并与其他竞争对手拉开潜力，私有数据才是其中根本。

换言之，大模型应用落地的关键，是企业自己宝贵的行业数据。

如何集成这些丰富的资源到我们的Agent之中，保证我们的大模型应用在执行任务时能够高效访问到正确的信息——是当下每一个企业都要面对的问题。

当然，这一切都必须以保证隐私为前提。

除了私有数据的集成和调用，在大模型应用落地的路上，最为底层的支撑，算力，也始终是一个百说不厌的话题。

众所周知，当下的显卡资源异常稀缺，且价格不菲。

譬如有调查就发现，像英伟达的H100，今年4月中旬在海外电商平台就已炒到超4万美元，甚至标价6.5万美元的也不算罕见。

无论是购买还是租用，这都成了全球各企业在探索生成式AI应用上的一大笔支出。

如何让这一笔花销更为经济实惠？这也是每个企业的思虑所在。

值得关注的是，以马逊云科技为代表的领先供应商，正在针对生成式AI落地过程中的这些挑战和痛点提供系统性的解决方案，对上述问题一一破解。

针对个性化数据问题，亚马逊云科技宣布为三款数据服务提供向量引擎，用来助力生成式AI应用与业务整合。

我们知道，在生成式AI爆发之后，向量数据库也实在火爆不已。因为相比传统的关系数据库，它能给予与模型上下文更相关的响应（如下图所示）。

亚马逊云科技这一最新服务，就是将我们的私有数据存储到具有向量引擎的数据库中，在进行生成式AI应用时，通过简单的API调用就能方便地查询企业内部的数据。

而根据当前数据存储位置、对数据库技术的熟悉程度、向量维度的扩展、Embeddings的数量和性能需求等不同需求，亚马逊云科技提供了3个选项来满足：

-Amazon Aurora PostgreSQL兼容版关系型数据库，支持pgvector开源向量相似性搜索插件；

-分布式搜索和分析服务 Amazon OpenSearch，带有k-NN（k最近邻）插件和适用于Amazon OpenSearch Serverless的向量引擎；-兼容 PostgreSQL的Amazon RDS（Amazon Relational Database Service）关系型数据库，支持pgvector插件。

当然，最值得说道的是这次最新推出的Amazon OpenSearch Serverless服务，它最大的优点就是让企业只关心向量数据的存储和检索，而不用背上任何底层运维的负担。

解决完数据集成问题，在底层支撑上，亚马逊云科技这次也直接推出H100支持的全新Amazon EC2 P5实例，这一曾经对于大多数企业都相当难得的算力资源，现在也变得“唾手可得”了。

据了解，该实例包含8个英伟达H100 Tensor Core GPU，640GB高带宽GPU内存，同时提供第三代AMD EPYC处理器、2TB 系统内存和30TB本地NVMe存储，以及3200Gbps的聚合网络带宽和GPUDirect RDMA支持，可实现更低延迟和高效的横向扩展性能。

相比上一代基于GPU的实例，Amazon EC2 P5可以让训练时间最多可缩短6倍（从几天缩短到几小时），降低高达40%的训练成本。

再加上亚马逊云科技之前基于自研芯片发布的Amazon EC2 Inf2和Amazon EC2 Trn1n等性能也表现不错的实例，我们在算力需求这一问题上，可以说是有了非常多的按需选择空间。

除了以上这些基础支持，各种开箱即用的AI服务也不“缺席”：

如针对开发环节的AI编程助手Amazon CodeWhisperer，现在它与Amazon Glue实现集成，将AI代码生成的场景又扩展到一个新人群：数据工程师，只需自然语言（比如“利用json文件中的内容创建一个Spark DataFrame”），这些开发人员即可搞定各种任务；

再如针对商业智能（BI）的Amazon QuickSight，也能够让业务分析师们使用自然语言执行日常任务，在几秒钟内创建各种数据可视化图表；

还有Amazon HealthScribe，可以用于医疗行业生成临床文档，节省医生时间。

这些工具都是主打让企业专注于核心业务，提高生产效率。

最后，简单总结，我们能够发现：

从今年4月起，亚马逊云科技就结合自身定位并基于真实用户需求出发，正式宣布进军生成式AI市场，为一切想要利用生成式AI技术加速或创新业务的企业提供服务。

在短短的4个月期间，亚马逊云科技已推出了各类底座资源，从基础模型到算力支撑，从私人数据存储到高效开发工具，应用尽有。

而这次在纽约峰会释出的最新动向，则是继续加码生成式AI应用开发所需的一切。

从Amazon EC2 P5实例代表的算力层、到Amazon OpenSearch Serverless向量引擎、Amazon Bedrock Agents代表的工具层、再到Amazon QuickSight等代表的应用层，一项端到端的解决方案已然形成。

在这之中，亚马逊云科技不断降低生成式AI的门槛，无论是初创企业还是传统行业，无论是处于生成式AI进程的哪一层，都能在这里找到合适的工具，无需耗费太多精力在底层逻辑之上，便可快速投入实际业务。

如亚马逊云科技数据库、数据分析和机器学习全球副总裁Swami Sivasubramanian所说：

“

我相信生成式AI将改变每一个应用程序、行业和企业。

”

事实上，随着AI模型大战的不断升级，也让生成式 AI进入聚光灯下。一批在AI领域有所积累的企业也在探索适合自己的应用方向，试图从这场前所未有的变革中，找到自己的新机会。

而亚马逊云科技的众多服务，无疑为企业降低开发成本、加速商业化落地赢得了更多的发展空间。

推荐内容

Agent开发的一小步，大模型应用的一大步

2023-08-03
AI大模型之花，绽放在鸿蒙沃土

2023-08-03
微信内测朋友圈置顶功能，隐藏着微信的什么思考？

2023-08-03
让iPhone匹敌量子计算机，超火的“室温超导体”是个啥？

2023-08-03
DeepMind首提「统一智能体」！大模型做推理，赋能终身学习，AI王者加冕

2023-08-03
英特尔发行绿色债券，募集到了12.5亿美元资金，第1年内投资了4.25亿美元。

2023-08-03
数据云平台DataSimba最新LTS版，限定免费升级

2023-08-03
Meta Connect 2023定档；苹果、Adobe、皮克斯、Nvidia、Autodesk组建OpenUSD联盟

2023-08-03
世界首次！华科团队复现室温超导材料 LK-99，目前已验证迈斯纳现象，网友：超导时代即将来临？

2023-08-03
讨论：广电或许会被三大运营商干得头破血流

2023-08-03
区政府与广东广电网络达成战略合作

2023-08-03
为什么现在没什么人谈「区块链」了？

2023-08-03
用友荣获信通院“铸基计划”iPaaS系列标准突出贡献单位

2023-08-03
非洲数字经济潜力巨大

2023-08-03
千帆大模型平台接入LLaMA2等33个模型

2023-08-03
推动虚拟与现实的融合，微美全息（NASDAQ:WIMI)开发多数据源集成数字孪生建模技术

2023-08-03
硅谷AI创业复兴：热钱涌入AI领域，重点投资基础大模型、中间层和垂直应用

2023-08-03
如何选择纸箱ERP？艾云ERP怎么样？

2023-08-02
马斯克推特改名，打造美版AI微信

2023-08-02
媒体报道 | 工信部推动5G消息普及新入网手机需支持

2023-08-02
基于YonGPT 的智能生单，让业绩达成更轻松！

2023-08-02
2023用友五洲行，共话“数智服务智慧运营”之道

2023-08-02
采访调研了9家RPA厂商，终于搞清RPA与大语言模型融合现状

2023-08-02
2023中国未来独角兽TOP 100

2023-08-02
【新闻资讯】2023年上半年中国互联网业务持续增长，利润创新高

2023-08-02
图灵奖获得者专辑|图灵奖得主 Yann LeCun：AI 仅仅学语言走不远

2023-08-02
在ChinaJoy里，看见数字经济“供给创造需求”新范本

2023-08-02
逛完2023ChinaJoy，感觉未来已来

2023-08-02
重磅！趣链科技牵头的ITU-T首个"区块链+分布式电力交易"国际标准F.751.13获批结项

2023-08-02
讯飞星火App被苹果应用商店下家，科大讯飞：原因还不清楚

2023-08-02
从声通科技的发展来看，AI行业如何回答可持续盈利这一命题？

2023-08-02
端到端的生成式AI领导者亚马逊云科技加速企业创新！

2023-08-02
广电月租29元“双百套餐”，三大运营商“跟不跟”？

2023-08-02
拒绝网络谣言清朗网络环境 | 整治网络谣言须亮出法治重拳

2023-08-02
用chatGPT预测股价，指日可待？

2023-08-01
微信推出“小绿书”，挑战小红书地位

2023-08-01
政策支持加大5G投入力度，微美全息（WIMI.US）推进5G+规模化应用助企降本增效

2023-08-01
传蚂蚁集团短期内上市可能性不大！被罚70亿后，这家巨头都干啥了

2023-08-01
6.35 亿！中国广电5G核心网二期工程项目（标包1：网络云和核心网）

2023-08-01
大模型破局之战：赛点走到“产业应用”

2023-08-01
数据存储需求骤变，联想凌拓多招齐发推动数以致用

2023-08-01
黑格这十年，不止是“落地更牛”

2023-08-01
数据、算法和算力：人工智能时代的三要素

2023-08-01
InfiniBand，到底是个啥？

2023-08-01
微信“小绿书”，能成为下一个小红书吗？

2023-08-01
微信灰度测试小绿书

2023-08-01
比特币生态项目Ordi未来价值如何？｜疑问解答

2023-08-01
深兰与韩国EVERYBOT集团签署服务机器人出口订单

2023-08-01
和妙鸭相机学，怎么打造爆款

2023-07-31
前景不妙鸭

2023-07-31

Agent开发的一小步，大模型应用的一大步

2023-08-03
AI大模型之花，绽放在鸿蒙沃土

2023-08-03
雨后敦煌别样美

2023-08-03
华利集团：上半年净利润14.55亿元同比降6.82%

2023-08-03
有机玻璃能耐多少温度（黄腊管能耐温度多少）

2023-08-03
鸿博股份8月3日打开涨停

2023-08-03
公安部：我国机动车保有量已达4.3亿辆，驾驶人总量达5.1亿人

2023-08-03
社评：美国为何提出想跟中国“长期共存”？

2023-08-03
微信内测朋友圈置顶功能，隐藏着微信的什么思考？

2023-08-03
定安雷鸣镇：提升农户种植技术打造“一镇一品”花生产业

2023-08-03
河北，防汛救灾进行时

2023-08-03
DeepMind首提「统一智能体」！大模型做推理，赋能终身学习，AI王者加冕

2023-08-03
英特尔发行绿色债券，募集到了12.5亿美元资金，第1年内投资了4.25亿美元。

2023-08-03
巴黎球迷落泪梅西赛后再次带领全队向球迷谢场

2023-08-03
让iPhone匹敌量子计算机，超火的“室温超导体”是个啥？

2023-08-03
神威药业(02877)发盈喜，预计中期股东应占溢利同比增加约45%至50%

2023-08-03
洁牙好不好呢_洁牙好不好

2023-08-03
数据云平台DataSimba最新LTS版，限定免费升级

2023-08-03
2023年8月3日石英砂价格最新行情预测

2023-08-03
世界首次！华科团队复现室温超导材料 LK-99，目前已验证迈斯纳现象，网友：超导时代即将来临？

2023-08-03
Q+(qplus)是什么（Q+是什么意思）

2023-08-03
Meta Connect 2023定档；苹果、Adobe、皮克斯、Nvidia、Autodesk组建OpenUSD联盟

2023-08-03
埃安为因暴雨受损车辆提供关怀服务

2023-08-03
北京昌平发布十三陵水库泄洪风险提示

2023-08-03
痛心！4人身亡，遇难者皆为学生

2023-08-03
为什么现在没什么人谈「区块链」了？

2023-08-03
港股开盘拉升，港股科技ETF（513020）涨超1%，小鹏汽车涨超5.4%

2023-08-03
讨论：广电或许会被三大运营商干得头破血流

2023-08-03
区政府与广东广电网络达成战略合作

2023-08-03
剪映怎么剪辑音乐起点（剪映怎么剪辑音乐）

2023-08-03
全球连线 | “中国军医给了我第二次生命”——记中国援埃塞军医专家组的白衣天使

2023-08-03
报告：7月中国65城新房找房热度环比涨4.1% 购房者信心指数回升

2023-08-03
明月镜片：8月2日获融资买入439.19万元

2023-08-03
蝠鲼的吃法_蝠鲼能吃吗

2023-08-03
非洲数字经济潜力巨大

2023-08-03
千帆大模型平台接入LLaMA2等33个模型

2023-08-03
用友荣获信通院“铸基计划”iPaaS系列标准突出贡献单位

2023-08-03
整顿多家购物店，定期发布“红黑榜”……云南重拳打击“不合理低价游”

2023-08-03
7月财新服务业PMI54.1 预期52.4

2023-08-03
英特科技公布2023半年度分配预案拟10派7元

2023-08-03
推动虚拟与现实的融合，微美全息（NASDAQ:WIMI)开发多数据源集成数字孪生建模技术

2023-08-03
和而泰（002402）：8月2日北向资金增持21.71万股

2023-08-03
本市部分纳税人税负明显下降

2023-08-03
8月3日A股避雷针：不涉及“室温超导”相关业务，多只连板股澄清！杭州园林、科拓生物等披露减持信息

2023-08-03
河北应急预案响应提升！直击涿州救援！最新进展

2023-08-03
乙酰螺旋霉素片成人一次吃多少（乙酰螺旋霉素片治牙疼吗）

2023-08-03
一种能杀死所有癌瘤而不伤害正常细胞的药物诞生了？美国顶级癌症研究机构宣布重大突破！

2023-08-03
阿里云大模型产品再升级 “通义听悟”上线“自动提取PPT”等三大功能

2023-08-03
硅谷AI创业复兴：热钱涌入AI领域，重点投资基础大模型、中间层和垂直应用

2023-08-03
人民子弟兵为人民

2023-08-03
稳增长“组合拳”释放四大政策信号

2023-08-03
7月份超8成QDII上涨嘉实霸屏涨幅榜华泰柏瑞等领涨

2023-08-03
诉讼管辖依据材料填写模板（诉讼管辖）

2023-08-03
WNBA球员托马斯砍下21分20板12助0失误的超级三双

2023-08-03
暑假如何避开“只游不学”的坑

2023-08-03
dnf装备图鉴（地下城装备图鉴）

2023-08-03
孩子压岁钱怎么理财（压岁钱怎么存银行比较划算？）

2023-08-03
vivo Y77e切换成4G模式教程介绍

2023-08-03
大学生假期生活总结假期生活总结

2023-08-03
遮天，两大家族争夺妖帝坟冢，颜如玉登场，叶凡看背影断美丑？

2023-08-03
小鹏汽车自动驾驶核心人物吴新宙离职，何小鹏：为这场交接已准备了近一年

2023-08-03
小鹏汽车自动驾驶副总裁吴新宙将离职加入英伟达

2023-08-03
贵阳市2023年新闻发言人培训班正式开班

2023-08-02
美国能源信息署

2023-08-02
这是中国游戏？因赚钱超预期，逆水寒手游宣布给部分玩家退钱

2023-08-02
联合利华冰淇淋业务集团全球总裁马特•克洛斯：对中国市场充满信心

2023-08-02
面对“王霜之问” 中国足球应该如何作答？

2023-08-02
外媒：埃尔多安与普京通电话，敦促后者勿采取加剧紧张局势的措施

2023-08-02
周琦揭晓真正原因！内线防守+进攻核心作用重要性！

2023-08-02
中国西南深层煤层气勘探再获突破

2023-08-02
成都大运会川剧变脸蓉宝吉祥物多少钱？（盲盒+手办）

2023-08-02
丰台2大区域“更新”规划同时获批！一旧改地块公示完成，用途明确！

2023-08-02
萧县凤城街道：化解矛盾纠纷共筑和谐乡村

2023-08-02
我国规模最大高铁盾构管片预制工厂投产

2023-08-02
南京莫愁湖美术馆揭牌，艺术之光照亮莫愁湖畔

2023-08-02
C站日报 | 瑞幸咖啡公布2023年第二季度财报；东方甄选抖音号重新开播

2023-08-02
大返还，内马尔突爆争议采访！大巴黎很意外，难怪姆巴佩瞧不上他

2023-08-02
针对与纵贯公司约2.38亿元纠纷珠江股份提起上诉

2023-08-02
广期所发布关于同意工业硅期货交割厂库的公告

2023-08-02
特海国际发盈喜预期中期收入至少3.21亿美元同比增加约30.6%

2023-08-02
Steam七月Linux平台使用率升至近 2%，市场份额首次超过苹果macOS

2023-08-02
一步热解法制备钒酸铋光阳极中制约水氧化性能的关键因素被揭示

2023-08-02
中石油打通辛烯-POE弹性体产业链全流程！

2023-08-02
如何选择纸箱ERP？艾云ERP怎么样？

2023-08-02
测绘股份：我公司拥有乙级城乡规划编制资质

2023-08-02
点读机哪个牌子好用_点读机哪个牌子好

2023-08-02
我家乡的美食有什么(家乡的美食有哪些?)

2023-08-02
联合利华冰淇淋业务集团全球总裁马特•克洛斯：对中国市场充满信心

2023-08-02
两部门：延续小规模纳税人增值税减免政策至2027年底

2023-08-02
ST深天：深投控拟减持公司不超2%股份

2023-08-02
马斯克推特改名，打造美版AI微信

2023-08-02
动漫动态头像（qq炫舞动态动漫头像）

2023-08-02
痛心！北京房山蓝天救援女队员王宏春在救灾中牺牲

2023-08-02
腾景科技股东龙耀投资减持期满合计减持245.9万股

2023-08-02
童鞋们，如果你有话对“集邮之家”说，请来留言吧！

2023-08-02
宜春市开展检验检测机构能力验证活动

2023-08-02
媒体报道 | 工信部推动5G消息普及新入网手机需支持

2023-08-02
绿色氢塑料开启循环经济之路

2023-08-02
多款产品进入量产阶段，北极芯微完成Pre-A+轮融资

2023-08-02
男子因撑伞羞耻被晒伤医生：晒伤不止晒黑那么简单

2023-08-02