首页 > 新闻 > 国际权威 MLPerf 存储基准测试发布 焱融存储斩获多项世界第一
2024-09-29

国际权威 MLPerf 存储基准测试发布 焱融存储斩获多项世界第一

近日,全球权威 AI 基准测评组织 MLCommons® 公布了 MLPerf® v1.0 存储性能基准测试的结果。焱融科技在此次测试中表现出色,焱融全闪存储产品在 3D-Unet、ResNet50 和 CosmoFlow 三种 AI 深度学习模型的评估中均展现了卓越的性能和效率。

国际权威 MLPerf 存储基准测试发布 焱融存储斩获多项世界第一-第1张-新闻-传卓科技

焱融科技作为中国自主研发的高性能存储领导者,与 DDN、Nutanix、Weka、Hammerspace、Solidigm 和 Micron 等众多国际优秀厂商同场竞技,测试结果显示,在带宽、模拟 GPU 数量以及 GPU 利用率等关键性能指标上,焱融科技的产品获得了多项世界第一。

国际权威 MLPerf 存储基准测试发布 焱融存储斩获多项世界第一-第2张-新闻-传卓科技

在 MLPerf® Storage v1.0 的基准测试中,焱融全闪存储显著提升了 GPU/ML 工作负载的处理速度,这表明焱融高性能存储产品具备支持各种 AI 模型训练和高性能计算场景的能力。在 AI 领域,尤其是在大规模模型训练方面,焱融全闪存存储解决方案发挥着至关重要的作用,为 AI 技术的发展和应用提供了强有力的支持。

MLPerf® Storage 全球首个且唯一的 AI/ML 存储基准测试

MLPerf 是由图灵奖得主大卫·帕特森(David Patterson)联合谷歌、斯坦福大学、哈佛大学等顶尖学术机构共同发起的国际权威 AI 性能基准测试,被誉为全球 AI 领域的“奥运会”。MLCommons 组织在 2023 年首次推出了 MLPerf 存储基准测试(MLPerf Storage Benchmark),这是首个也是目前唯一一个开源、公开透明的 AI/ML 基准测试,旨在评估存储系统在 ML/AI 工作负载中的表现。这一基准测试为 ML/AI 模型开发者选择存储解决方案提供了权威的参考依据,帮助他们评估合适的存储产品。

MLPerf Storage 基准测试目前有两个版本:v0.5 和 v1.0。2023 年发布的 v0.5 版本初步包含了 Unet-3D 和 BERT 两个模型,并仅支持模拟 NVIDIA v100 GPU。而今年最新发布的 v1.0 版本进行了重大更新,引入了更具代表性的测试模型,这些模型在业界具有广泛的应用,能够更好地代表实际工作负载。

国际权威 MLPerf 存储基准测试发布 焱融存储斩获多项世界第一-第3张-新闻-传卓科技

焱融存储是国内唯一全面参与所有模型测试的厂商 荣登多项世界第一

焱融科技参与 MLPerf 测试使用了最新发布的 F9000X 全闪分布式一体机产品。F9000X 每个存储节点搭载最新的英特尔® 至强® 第 5 代可扩展处理器,存储介质采用 10 块 Memblaze PCIE 5.0 NVMe 闪存 ,同时配备 2 块 NVIDIA ConnectX-7 400Gb NDR 网卡。

最全面最完整,国内唯一一家参加了全部模型测试的存储厂商

焱融科技是国内唯一一家参与了 MLPerf Storage 全部模型测试的存储厂商,包括 3D-Unet、CosmoFlow 和 ResNet 50。在测试环节中,焱融追光全闪存储一体机 F9000X 展现了卓越的性能,全面覆盖目前主流模型应用数据负载需求。F9000X 不仅能够处理大规模的数据集,还可以根据 AI 集群规模弹性扩展,完美匹配 GPU 算力性能。

在分布式训练集群场景,平均每个计算节点 ACC 数量最多,存储带宽最高

MLPerf Storage 基准测试规则定义可以采用单个计算节点(客户端)运行多个 ACC(Accelerator,GPU 加速器),进行相应模型应用测试,同时支持大规模分布式训练集群场景,多个客户端模拟真实数据并行的方式并发访问存储集群。其中平均每个客户端能够运行的 ACC 数量越多,则代表该节点的计算能力越强,能够处理任务的数量也就越多,而对于存储数据并发访问性能要求也就越高。测试结果显示,在分布式训练集群场景,焱融存储在所有三个模型的测试中,能够支撑的每个计算节点平均 ACC 数量和存储带宽性能均排名第一。

国际权威 MLPerf 存储基准测试发布 焱融存储斩获多项世界第一-第4张-新闻-传卓科技国际权威 MLPerf 存储基准测试发布 焱融存储斩获多项世界第一-第5张-新闻-传卓科技

存储性能随计算规模同步线性增长

随着计算规模的扩大,存储性能应实现线性增长以满足 AI 训练的需求。以 3D-Unet 三维图像分割模型为例,其单个图像样本大小约为 146MB,而在多节点集群环境中,每秒处理的训练样本数可超过 1100 个,这导致训练数据的读取带宽需求超过 160GB/s。

在针对三个模型的测试中,焱融全闪存储一体机 F9000X 展现了出色的性能。测试结果显示:随着并发计算节点(ACC)数量的增加,存储系统的带宽性能保持明显的线性增长能力。此外,存储的可用性(AU,Accelerator Utilization,GPU 加速器利用率)也始终保持在测试基准要求的范围内,确保了训练过程的高效和稳定。目前在 3D-Unet 模型应用的测试中,使用 3 个计算节点,共 60 个 ACC,可达到 160GB/s 的存储带宽性能。F9000X 3 节点存储集群实测最大可以达到 260GB/s 以上的带宽性能,这表明在实际业务环境中焱融全闪存可以支撑更多的 GPU 的计算节点。

焱融科技在AI和高性能计算领域,凭借其深厚的技术积累和持续创新,已成为推动行业发展的关键力量。在MLPERF Storage V1.0基准测试中,焱融科技首次参与便取得领先地位,标志着其数据存储技术达到行业新高度。焱融科技的全闪分布式存储一体机追光F9000X,以其卓越的性能满足了日益增长的高性能计算需求,实现了数据存储领域的重大突破。这一产品不仅提升了数据处理能力,还为人工智能、高性能计算、自动驾驶、生物信息分析和金融量化等前沿领域的发展提供了强大支持。