环球资讯:Nvidia:通过软件优化 H100 AI 性能提升高达 54%
时间:2023-04-06 16:03:30
【资料图】
Nvidia 刚刚在MLPerf 3.0中发布了其 H100 计算 GPU 的一些新性能数据 ,MLPerf 3.0 是深度学习工作负载的重要基准测试的最新版本。Hopper H100处理器不仅在训练时间测量方面超过了其前身 A100,而且由于软件优化,它的性能也在不断提升。此外,Nvidia 还透露了其紧凑型 L4 紧凑型计算 GPU 与其前身 T4 GPU 的早期性能比较。
Nvidia 首次公布了 在 MLPerf 2.1 基准测试中获得的H100 测试结果 早在 2022 年 9 月,就表明其旗舰计算 GPU 在各种推理工作负载中的性能最高可达其前身 A100 的 4.3-4.4 倍。在 MLPerf 3.0 中获得的新发布的性能数据不仅证实了 Nvidia 的 H100 比其 A100 更快(不足为奇),而且再次证实它也明显快于英特尔最近发布的 Xeon Platinum 8480+(Sapphire Rapids)处理器以及 NeuChips 的大量工作负载中的 ReccAccel N3000 和高通的 Cloud AI 100 解决方案
这些工作负载包括图像分类 (ResNet 50 v1.5)、自然语言处理 (BERT Large)、语音识别 (RNN-T)、医学成像 (3D U-Net)、对象检测 (RetinaNet) 和推荐 (DLRM)。Nvidia 指出,它的 GPU 不仅速度更快,而且在整个 ML 行业都有更好的支持——一些工作负载在竞争解决方案上失败了。
不过,Nvidia 公布的数字有一个问题。供应商可以选择提交两类 MLPerf 结果:封闭式和开放式。在封闭类别中,所有供应商都必须运行数学上等效的神经网络,而在开放类别中,他们可以修改网络以优化其硬件性能。Nvidia 的数字仅反映封闭类别,因此英特尔或其他供应商可以引入以优化其硬件性能的优化并未反映在这些组结果中。
正如 Nvidia 自己的例子所示,软件优化可以为现代人工智能硬件带来巨大好处。该公司的 H100 在 MLPerf 3.0 和 MLPerf 2.1 中的推荐工作负载增加了 7%,对象检测工作负载增加了 54%,这是一个相当大的性能提升。
相关稿件
环球资讯:Nvidia:通过软件优化 H100 AI 性能提升高达 54%
陕汽一季度汽车销量同比增长23% 出口订单同比增长超170% 每日快报
全球快播:19岁张子枫素颜有夸张?不惧镜头怼脸拍,剪辑师担心杨紫被比下去
开银行保函需要什么条件?银行保函有哪些作用?企业为什么要开保函?
环球动态:镇洋发展(603213),股价成功突破年线压力位-后市看多(涨)(2023年04月06日)
苏州工业园区公积金比例甲类是什么?园区甲类和乙类有哪些区别?
王启蒙: 黄金今日行情还会跌吗?黄金最新行情策略分析操作建议|环球观热点
天天快资讯:【视频】26年老司机开车误挂倒挡,引发两车相撞?交警调查后揭开真相
java -- Stringbuild、Date和Calendar类 世界微速讯
教育频道