人工智能要想持续发展,算力必须快速提上去,空间和机会不言而喻。
文/每日财报 刘锋
世界经济论坛发布的最新报告显示,未来五年内,由于人工智能、数字化以及绿色能源转型和供应链回流等其他经济发展,全球近四分之一的工作岗位将发生变化。
(相关资料图)
当然,不同的国家会因为人工智能技术的差异,取代速度也会有所差异。而目前这种取代趋势的快慢,并不受制于人工智能技术本身的发展,而是受制于算力。
所以AI要想继续发展,算力是第一位。
ChatGPT的总算力消耗大约为3640PF-days(每秒计算一千万亿次,需要计算3640天),且随着持续进化迭代,GPT所需的算力规模还在呈指数上升。据OpenAI首席执行官Sam Altman透露,GTP-5的参数量将是GTP-3的100倍,需要的计算量则是GTP-3的200-400倍。
千亿美金GPU
TrendForce 预计 ,2023 年全球 AI 服务器(推理)出货大约在 14.4 万台,到 2026 年预计实现出货量 20.0w 台。假设训练 AI 服务器和推理 AI 服务器的比例为 1:4,则可以得到 2023/2026 年训练服务器的数量大约为 3.60/5.00 万台。
GPU 在 AI 服务器中价值量占比接近 50%。
以 Nvidia DGX A100 为例,其搭载了 8 张 Nvidia A100 Tensor GPU,根据新浪科技数据,Nvidia DGX A100 售价约为 19.9w 美金;Nvidia A100 Tensor 价格为 1.00~1.20w 美金。按照 1.20w 美金售价计算可 得出 GPU 在 Nvidia DGX A100 价值量占比约为 48.24%。
GPU 是图形处理器的简称,它是一种专门用于处理图形、视频、游戏等高性能计算的硬件设备。GPU 相对于传统的中央处理器(CPU)而言,其拥有更多的计算核心和更快的内存带宽,能够大幅度提高计算效率和图形渲染速度。现阶段,随着例如英伟达 A100、H100等型号产品的发布,GPU在算力方面的优势相较于其他硬件具有较大优势,GPU 的工作也从一开始的图形处理逐步转化为计算。
游戏和娱乐市场一直是GPU市场的主要驱动力,因为这些领域需要高性能的 GPU来支持更高质量的游戏画面和娱乐内容。同时人工智能和机器学习的发展对GPU市场也有 着巨大的影响,因为这些技术需要大量的计算能力,而 GPU可以提供比CPU更高的效率。此外,科学和研究领域的需求以及新兴市场(如游戏机和数据中心)也对 GPU 市场的规模产生了影响。根据 Verified Market Research 数据,2021 年全球 GPU 市场规模为 334.7 亿美金,预计到 2030年将达到 4473.7 亿美金,期间 CAGR 33.3%。
在集成电路中,Intel 创始人之一戈登摩尔曾今提出:集成电路上的可容纳晶体管数量大约在 24 个月就会增加一倍,后续这个 时间被更新为 18 个月。目前在 GPU 领域,英伟达创始人之一黄仁勋也给出了自己的理 解:GPU 性能提升一倍所需的时间约为 1 年,这相较于摩尔定理在集成电路中的速度提升了 1.5 倍左右。
根据英伟达总裁 Bill Dally 表示,自 2012 年开始直到 2021 年的 A100 产品面世,GPU 单芯片推理性能提升了约 317 倍,而其中工艺制程仅由 28nm 提升至 7nm。
国产替代,势在必行
全球范围内,人工智能、云端计算和独立 GPU主要为英伟达主导,旗下深度学习旗 舰 GPU 产品 A100 和 H100 最高浮点算力分别实现 19.5 TFLOPS 和 67 TFLOPS;PC GPU由于涵盖集成 GPU,英特尔由于为全球 CPU 龙头,使其在 PC GPU 中份额最高。根据 Jon Peddie Research 数据,2022 年四季度 PC GPU中,英特尔、英伟达、AMD 份 额分别为 71%、17%、12%;2022Q4 独立 GPU 中,英特尔、英伟达、AMD 份额分别为 6%、85%、9%。
2022 年 8 月,美国政府通知英伟达,其需要获得许可才能够向中国和俄罗斯出口任何基于最新架构的 A100 GPU 或 DGX/HGX 等系统,同时该项规定也同时适用于最新发布的 H100 GPU 或者实现类似功能的产品。
国产替代,势在必行。
国产 GPU 厂商近几年不断涌现,其中景嘉微是国内首家成功研制国产 GPU 芯片并实现大规模工程应用的企业,掌握了包括芯片底层逻辑/物理设计、超大规模电路集成验证、模拟接口设计、GPU 驱动程序设 计等关键技术,在GPU体系结构、图形绘制高效处理算法、高速浮点运算器设计、可复用模块设计、快速大容量存储器接口设计、低功耗设计等方面有深厚的技术积累,先后研制成功 JM5系列、JM7 系列、JM9 系列等具有自主知识产权的高性能 GPU 芯片,为国内GPU的突破发展做出了突出的贡献。
寒武纪成立于 2016 年,专注于 AI 芯片的研发和创新。云端产品线方面,公司已先后推出了思元 100、思元 270、思元 290 和思元 370 芯片及相应的云端智能加速卡系列产品、训练整机。与互联网行业、金融领域及多个行业客户展开了合作。边缘产品线方面,公司面向边缘计算场景推出的思元 220 芯片和边缘智能加速卡已落地多家头部企业,自发布以来累计销量突破百万片。
沐曦集成电路于 2020 年 9 月成立,核心成员平均拥有近 20 年高性能 GPU 产品端到端研发经验,其打造全栈 GPU 芯片产品,推出 MXN 系列 GPU(曦思)用于 AI 推理,MXC 系列 GPU(曦云)用于 AI 训练及通用计算,以及 MXG 系列 GPU(曦彩)用 于图形渲染,满足数据中心对“高能效”和“高通用性”的算力需求。沐曦的产品均采用完全自主研发的 GPU IP,拥有完全自主知识产权的指令集和架构,配以兼容主流 GPU 生态的完整软件栈(MXMACA),具备高能效和高通用性的天然优势,能够为客户构建软硬件一体的全面生态解决方案。
壁仞科技首先聚焦云端通用智能计算,逐步在人工智能训练和推理、图形渲染等多个领域赶超现有解决方 案,实现国产高端通用智能计算芯片的突破。
2022 年,壁仞科技推出旗下首款旗舰 GPU 芯片BR100,其采用 7nm 制程,支持 PCIe 5.0 接口,根据壁仞科技发布会,BR100 16 位浮点算力达到 1000T 以上,8 位定点算力达到 2000T 以上,单芯片峰值算力达 PFLOPS 级别。
由于算力紧缺,ChatGPT近期频繁下调提问限制次数,GPT-4的提问上限次数先后从每4小时100次下调到50次。4月5日,OpenAI一度暂停了Plus付费会员的申请。人工智能要想持续发展,算力必须快速提上去,空间和机会不言而喻。