计世高科官网

近日，国际权威AI基准测试MLPerf公布了最新一期榜单。公开信息显示，此次测试中，七家公司对至少十几款市售系统进行了测试。除NVIDIA之外，搭载NVIDIA A100 Tensor Core GPU的戴尔、富士通、技嘉、浪潮、联想、宁畅、超微也参与了测试，均提交了神经网络测试结果。结果显示，NVIDIA及其合作伙伴提供的GPU加速系统实现了全球最快的AI模型训练速度。

霸榜MLPerf

MLPerf是一个由来自学术界、研究实验室和行业的AI领导者组成的行业基准测试组织，旨在“建立公平且有用的基准”，并提供公正的评估。

MLPerf基准测试基于当今最常用的AI工作负载和场景，涵盖计算机视觉、自然语言处理、推荐系统、强化学习等。其训练基准测试所关注的是最目前行业内最关心的问题——训练一个全新AI模型需要多长时间。

在MLPerf 1.0测试中，与之前相比增加了会议识别RNN-T和医学图像划分UNet-3D两种，共有8种工作负载。其余6种工作负载为自然语言处理网络BERT、深度学习推荐模型DLRM、对象检测网络SSD和Mask R-CNN、强化学习网络MiniGo和用于图像分类的ResNet-50。

测试结果显示，NVIDIA AI平台在最短的时间内完成了模型训练，在商用提交类别的所有八项基准测试中都创下了性能纪录。

基于 NVIDIA DGX SuperPOD 的Selene在商用系统类别的所有八项测试中均创下纪录。

据悉，NVIDIA在Selene上进行了大规模测试。根据最新全球TOP 500榜单，Selene是全球最快的商用AI超级计算机。这台超级计算机与榜单上的其他十几台系统均基于NVIDIA DGX SuperPOD架构。

性能持续提升

据悉，此次是NVIDIA生态系统第四次参加MLPerf的训练测试，也是NVIDIA A100 GPU第二次参与MLPerf测试。与去年相比，基于英伟达DGX SuperPOD和DGX A100的系统测试表现均有较大提升。

NVIDIA AI 通过全栈的改进，持续带动性能提升。

提及数据提升原因，NVIDIA表示：“工程师找到了一种使用CUDA Graphs启动完整神经网络模型的方法。CUDA Graphs是一个涵盖NVIDIA CUDA操作及其依赖项的软件包，它消除了过去的测试中，AI模型由大量独立的内核组成而导致的CPU瓶颈。此外，在大规模测试中使用的是NVIDIA SHARP，该软件能够在网络交换机内整合多项通信工作，从而减少网络流量和等待CPU的时间。”

NVIDIA强调：“CUDA Graphs和SHARP的结合，使数据中心能够使用更多的GPU进行训练。在诸如自然语言处理等多种领域里，这样的组合恰好能提供AI模型参数量级增加所需的强大能力。此外，最新A100 GPU上的内存带宽增加了近30%，达到2TB/s以上，这也带来了其他许多方面的提升。”

另外，MLPerf的测试结果展现了众多全新创新系统中各种基于NVIDIA 技术的AI平台的性能。这些系统范围广泛，涵盖了从入门级边缘服务器到可容纳数千个GPU的AI超级计算机，速度的提升均来自于GPU、系统、网络和AI软件方面的进步。

据悉，戴尔、富士通、Gigabyte、浪潮、联想、Nettrix和Supermicro等7家厂商采用了英伟达A100 GPU，推出了12套商用系统，占所有提交作品的3/4，英伟达及其合作伙伴是唯一进行了全部8项测试的企业。

赋能多领域

MLPerf的基准测试对于提升科研效率、完善医疗服务、提高制造领域产品性能和效率均有促进作用，一些业内人士对此发表了相关看法。

德国癌症研究中心DKFZ医学影像计算负责人Klaus Maier-Hein表示：“我们与NVIDIA开展了密切的合作，将3DUNet等创新技术引入医疗市场。作为行业标准的MLPerf基准测试提供了相关的性能数据，能够帮助IT机构和开发者找到合适的解决方案，以加速特定项目和应用。”

台积电OPC部门总监Peng Danping表示：“MLPerf基准测试是我们决策流程中的一个重要环节。”并表示台积电正在与NVIDIA工程团队合作，将Maxwell模拟和逆向光刻技术引擎移植到GPU上，以充分实现机器学习在模型训练和推理方面的潜力，实现了速度的显著提升。”

三星电子的一位发言人表示：“我们必须拥有最强大的计算平台，才能将这些AI技术进步转化为产品。MLPerf基准测试简化了我们的选择流程，为我们提供了一种公开、直接的评估方法，让我们能够对各家平台供应商进行统一标准的评估。”

瑞典查尔姆斯大学的研究领域包括纳米技术、气候研究等。谈到MLPerf基准测试对于科研设备选择的重要性，一位发言人表示：“MLPerf基准测试是多个AI平台之间透明、公平的对比，能够展示其在不同真实应用场景中的实际性能。”他认为，基准测试可帮助高校找到高性能的AI产品。

MLPerf基准测试揭榜，NVIDIA创多项记录