发布时间:2021-07-05
近日,国际权威AI基准测试MLPerf公布了最新一期榜单。公开信息显示,此次测试中,七家公司对至少十几款市售系统进行了测试。除NVIDIA之外,搭载NVIDIA A100 Tensor Core GPU的戴尔、富士通、技嘉、浪潮、联想、宁畅、超微也参与了测试,均提交了神经网络测试结果。结果显示,NVIDIA及其合作伙伴提供的GPU加速系统实现了全球最快的AI模型训练速度。
霸榜MLPerf
MLPerf是一个由来自学术界、研究实验室和行业的AI领导者组成的行业基准测试组织,旨在“建立公平且有用的基准”,并提供公正的评估。
MLPerf基准测试基于当今最常用的AI工作负载和场景,涵盖计算机视觉、自然语言处理、推荐系统、强化学习等。其训练基准测试所关注的是最目前行业内最关心的问题——训练一个全新AI模型需要多长时间。
在MLPerf 1.0测试中,与之前相比增加了会议识别RNN-T和医学图像划分UNet-3D两种,共有8种工作负载。其余6种工作负载为自然语言处理网络BERT、深度学习推荐模型DLRM、对象检测网络SSD和Mask R-CNN、强化学习网络MiniGo和用于图像分类的ResNet-50。
测试结果显示,NVIDIA AI平台在最短的时间内完成了模型训练,在商用提交类别的所有八项基准测试中都创下了性能纪录。
基于 NVIDIA DGX SuperPOD 的Selene在商用系统类别的所有八项测试中均创下纪录。
据悉,NVIDIA在Selene上进行了大规模测试。根据最新全球TOP 500榜单,Selene是全球最快的商用AI超级计算机。这台超级计算机与榜单上的其他十几台系统均基于NVIDIA DGX SuperPOD架构。
性能持续提升
据悉,此次是NVIDIA生态系统第四次参加MLPerf的训练测试,也是NVIDIA A100 GPU第二次参与MLPerf测试。与去年相比,基于英伟达DGX SuperPOD和DGX A100的系统测试表现均有较大提升。
NVIDIA AI 通过全栈的改进,持续带动性能提升。
提及数据提升原因,NVIDIA表示:“工程师找到了一种使用CUDA Graphs启动完整神经网络模型的方法。CUDA Graphs是一个涵盖NVIDIA CUDA操作及其依赖项的软件包,它消除了过去的测试中,AI模型由大量独立的内核组成而导致的CPU瓶颈。此外,在大规模测试中使用的是NVIDIA SHARP,该软件能够在网络交换机内整合多项通信工作,从而减少网络流量和等待CPU的时间。”
NVIDIA强调:“CUDA Graphs和SHARP的结合,使数据中心能够使用更多的GPU进行训练。在诸如自然语言处理等多种领域里,这样的组合恰好能提供AI模型参数量级增加所需的强大能力。此外,最新A100 GPU上的内存带宽增加了近30%,达到2TB/s以上,这也带来了其他许多方面的提升。”
另外,MLPerf的测试结果展现了众多全新创新系统中各种基于NVIDIA 技术的AI平台的性能。这些系统范围广泛,涵盖了从入门级边缘服务器到可容纳数千个GPU的AI超级计算机,速度的提升均来自于GPU、系统、网络和AI软件方面的进步。
据悉,戴尔、富士通、Gigabyte、浪潮、联想、Nettrix和Supermicro等7家厂商采用了英伟达A100 GPU,推出了12套商用系统,占所有提交作品的3/4,英伟达及其合作伙伴是唯一进行了全部8项测试的企业。
赋能多领域
MLPerf的基准测试对于提升科研效率、完善医疗服务、提高制造领域产品性能和效率均有促进作用,一些业内人士对此发表了相关看法。
德国癌症研究中心DKFZ医学影像计算负责人Klaus Maier-Hein表示:“我们与NVIDIA开展了密切的合作,将3DUNet等创新技术引入医疗市场。作为行业标准的MLPerf基准测试提供了相关的性能数据,能够帮助IT机构和开发者找到合适的解决方案,以加速特定项目和应用。”
台积电OPC部门总监Peng Danping表示:“MLPerf基准测试是我们决策流程中的一个重要环节。”并表示台积电正在与NVIDIA工程团队合作,将Maxwell模拟和逆向光刻技术引擎移植到GPU上,以充分实现机器学习在模型训练和推理方面的潜力,实现了速度的显著提升。”
三星电子的一位发言人表示:“我们必须拥有最强大的计算平台,才能将这些AI技术进步转化为产品。MLPerf基准测试简化了我们的选择流程,为我们提供了一种公开、直接的评估方法,让我们能够对各家平台供应商进行统一标准的评估。”
瑞典查尔姆斯大学的研究领域包括纳米技术、气候研究等。谈到MLPerf基准测试对于科研设备选择的重要性,一位发言人表示:“MLPerf基准测试是多个AI平台之间透明、公平的对比,能够展示其在不同真实应用场景中的实际性能。”他认为,基准测试可帮助高校找到高性能的AI产品。