(相关资料图)

英特尔今天宣布了其第三代至强可扩展处理器(意指金牌和白金牌)处理器,以及新一代的Optane持久存储器(阅读:极低延迟,高耐久性SSD)和Stratix AI FPGA产品。

目前,AMD在几乎所有可以想到的性能指标上都击败了英特尔, 除了硬件加速的AI外,这还不是新闻。对于英特尔来说,这显然也不是什么新闻,因为该公司对至强可扩展处理器的性能与竞争对手的Epyc Rome处理器没有任何要求。更有趣的是,英特尔根本没有提到通用计算工作负载。

要找到所示的唯一非AI代代改进的解释,需要跳过多个脚注。有了足够的决心,我们最终发现概述幻灯片中提到的“ 1.9倍平均性能提升”是指“估计或模拟” SPECrate 2017基准测试,将四路铂金8380H系统与使用五年的四路铂金系统进行了比较E7-8890 v3。

公平地说,英特尔似乎确实在AI领域引入了一些非同寻常的令人印象深刻的创新。以前只是为AVX-512指令集打上商标的“深度学习增强”现在也包含了全新的16位浮点数据类型。

借助较早的Xeon可扩展级处理器,英特尔率先并大力推动使用8位INT8整数(通过其OpenVINO库进行推理处理)。对于推理工作负载,英特尔认为,INT8在大多数情况下,较低的精度是可以接受的,同时可以极大地加速推理流程。但是,对于培训而言,大多数应用程序仍需要更高的FP3232位浮点处理精度。

新一代增加了16位浮点处理器支持,英特尔称之为bfloat16。将FP32 模型的位宽减半可以加快处理速度,但更重要的是,将模型保留在内存中所需的RAM减少了一半。对于使用FP32 模型的程序员和代码库,利用新数据类型也比转换为整数更简单。

推荐内容