英特尔代表取笑用于未来AI和HPC应用的新PonteVecchio计算GPU
在HotChips34期间,英特尔再次详细介绍了其在SapphireRapidsHBM服务器平台上运行的PonteVecchioGPU。在英特尔院士兼首席GPU计算架构师HongJiang的演讲中,我们从蓝队获得了有关即将到来的服务器强国的更多详细信息。PonteVecchioGPU具有三种配置,从单一OAM到配备XeLinks的x4子系统,可以单独运行,也可以使用双插槽SapphireRapids平台。
OAM支持4GPU和8GPU平台的all-to-all拓扑。补充整个平台的是英特尔的oneAPI软件堆栈,它是一个零级API,提供低级硬件接口以支持跨架构编程。oneAPI的一些主要功能包括:
oneAPI和其他工具与加速器设备的接口
精细的增益控制和低延迟加速器功能
多线程设计
对于GPU,作为驱动程序的一部分提供
因此,在性能指标方面,2-StackPonteVecchioGPU配置(如单一OAM上的配置)能够提供高达52TFLOP的FP64/FP32计算、419TFLOP的TF32(XMXFloat32)、839TFLOPBF16/FP16和1678TFLOPs的INT8马力。
英特尔还详细说明了其最大缓存大小和每个缓存提供的峰值带宽。PonteVecchioGPU上的寄存器文件大小为64MB,提供419TB/s的带宽,L1缓存也为64MB,提供105TB/s(4:1),L2缓存为408MB并提供13TB/s带宽(8:1),而HBM内存池高达128GB并提供4.2TB/s带宽(4:1)。PonteVecchio中有一系列计算效率技术,例如:
英特尔解释说,更大的二级缓存可以为2D-FFT案例和DNN案例等工作负载带来巨大的收益。显示了完整PonteVecchioGPU与配置为80MB和32MB的模块之间的一些性能比较。
免责声明:本文由用户上传,与本网站立场无关。财经信息仅供读者参考,并不构成投资建议。投资者据此操作,风险自担。 如有侵权请联系删除!
-
【120kg是多少斤】在日常生活中,我们经常会遇到重量单位的转换问题。尤其是在购买商品、健身锻炼或进行物流运...浏览全文>>
-
【120g流量能用多久】在如今手机使用频繁的时代,流量消耗已经成为用户关注的焦点。很多人在办理套餐时都会关...浏览全文>>
-
【120g固态硬盘和256g比较快】在选择固态硬盘(SSD)时,很多用户会纠结于容量与性能之间的关系。尤其是对于“...浏览全文>>
-
【120g固态硬盘多少钱】在选购电脑配件时,固态硬盘(SSD)是一个非常重要的组成部分。对于预算有限的用户来说...浏览全文>>
-
【12080违章代码代表什么意思】在日常驾驶过程中,驾驶员可能会收到交通管理部门的违章通知,其中涉及各种违章...浏览全文>>
-
【12015年:内蒙古财经大学在内蒙古省内排名第7】2015年,内蒙古财经大学在内蒙古自治区内的高校排名中位列第...浏览全文>>
-
【12:30用英语怎么说】在日常生活中,时间的表达方式多种多样,尤其是在跨文化交流中,掌握正确的时间说法非常...浏览全文>>
-
【110米栏世界纪录排名】在田径运动中,110米栏是一项极具观赏性和技术性的项目,选手需要在110米的跑道上跨越...浏览全文>>
-
【110米栏奥运会纪录保持者介绍】在田径项目中,110米栏是一项兼具速度与技巧的高强度比赛。自该项目成为奥运...浏览全文>>
-
【110级男气功护石符文选择】在《地下城与勇士》(DNF)中,110级男气功作为高爆发、高机动性的职业,其护石和...浏览全文>>