花生壳是什么-英特尔至强处理器在AISBench测试中表现卓越

近期,第五代英特尔®至强®可扩展处理器经过了中国电子技术标准化研究院安排的人工智能服务器系统功能测验(AISBench)。英特尔成为第一批经过AISBench大言语模型(LLM)推理功能测验的企业。
image.png
中国电子技术标准化研究院赛西实验室根据国家标准《人工智能服务器系统功能测验规范》(征求意见稿)相关要求,运用AISBench 2.0测验东西,完成了第五代英特尔至强可扩展处理器的AI大模型推理功能和精度测验。测验中,第五代英特尔至强在ChatGLM V2-6B(60亿参数)以及 Llama2-13B(130亿参数)两个模型上均展示出卓越推理功能,能够满意轻量级大言语模型的实时推理要求。
image.png
测验成果:此次单机功能测验中,在满意人类正常阅读速度要求(生成延迟小于100毫秒)的情况下,在封闭测验场景中构造数据集,根据第五代英特尔至强的服务器可完成:
•在60亿参数的ChatGLM V2模型通用推理中,当输入输出序列为256时可达每秒 2493 token的功能,当输入输出序列为2048时可达每秒926 token。
•在130亿参数的Llama2模型通用推理中,当输入输出为256时可达每秒513 token,当输入输出序列为2048时可达每秒 132 token1。
(花生壳是什么?)作为通用处理器,第五代英特尔至强在人工智能、网络、存储、数据库等关键作业负载均能供给出色功能。AISBench 2.0的测验成果验证了英特尔至强在运行轻量级大言语模型时展示出的优异推理功能,使得客户可以运用根据至强的服务器,构建一个通用AI系统进行数据预处理、模型推理和布置,然后获得兼具AI功能、功率、准确性和可扩展性的组合。这也显示了英特尔至强可以为企业供给“开箱即用”的功能,即可以在通用系统上布置一部分AI作业负载,然后为客户带来更佳的总体具有本钱(TCO)优势。
软硬结合,至强展示AI优势
英特尔至强的内置AI加快器使其成为在通用处理器上运行部分AI作业负载的理想解决方案,不仅如此,英特尔还装备了经过优化的、易于编程的敞开软件,可降低客户和生态伙伴在数据中心布置从云到智能边际各种根据AI的解决方案的门槛。
•第五代英特尔至强可扩展处理器充分发挥了系统级优势(包含缓存、内存等),因此推理速度完成了大幅提高。
•其内置的AI加快器——英特尔®高级矩阵扩展(AMX),经过供给专用的矩阵运算加快模块(TMUL),以及支撑INT8和BF16这类低精度数据类型,可完成对核算资源的充分利用,然后大幅提高运算功率。
• xFasterTransformer(简称xFT)是英特尔供给的在CPU平台上布置大言语模型的深度优化敞开解决方案,经过C++和Python两种API接口,更易于用户运用和将其集成到自有事务框架中。
关于AISBench
AISBench基准是一套应用于人工智能核算产品的功能测验基准,由中国电子技术标准化研究院牵头研发。与MLPerf等国际先进核算基准类似,该基准用于测验多种人工智能核算产品形态,并支撑丰富的测验场景、形式、类型和指标。
产品与功能信息
1.服务器:在搭载第五代英特尔®至强®处理器的Quanta Cloud Technology 服务器 QuantaGrid D54Q-2U上测量,CPU:英特尔至强铂金8592+、64核,超线程敞开、睿频敞开、NUMA 4,内存:1.5 TB、硬盘:Intel P5800X 3.2TB NVME ,、操作系统:Ubuntu 22.04、测验软件:AISBench、深度学习框架:PyTorch 2.3.1、模型数据精度:BF16。英特尔于2024年6月26日至7月26日进行测验。
客户端:第十一代英特尔®酷睿™ i7-1185G7:在戴尔Latitude 7420上测量,内存:16.0 GB、硬盘:256 GB、操作系统:Microsoft Windows 11Enterprise、测验软件:MobaXtermPersonalEdition v22.0 Build 4858。英特尔于2024年6月26日至7月26日进行测验。
测验东西:功能测验东西AISBench 2.0。

共有 0 条评论

发表评论

邮箱地址不会被公开。 必填项已用*标注