服务器性能基准测试是衡量和比较不同服务器配置的重要工具。通过执行一系列标准化测试,管理员可以获得有关服务器在不同负载和配置下的性能的客观数据。
过去,服务器性能基准测试主要依赖于算法可以消除人为错误,从而提高基准测试结果的准确性和可靠性。
在评估人工智能芯片的优劣时,软件评估工具如Accelergy和Timeloop扮演着关键角色。 Accelergy专注于功耗评估,允许用户自定义硬件参数,而Timeloop则通过模型映射和执行分析,提供性能、功耗和面积的综合评估,用于比较不同架构。 然而,要给出公平的性能评价,基准测试是不可或缺的,这包括CPU和GPU等通用处理器的传统基准,以及专为AI设计的如DeepBench和MLPerf等新出现的基准。 MLPerf,由谷歌、英伟达等顶级机构发起,是目前最具影响力的AI芯片基准。 它不仅考虑硬件性能,还衡量深度学习框架、芯片和平台的整体性能,分为训练和推理(数据中心、边缘侧、移动设备和Tiny)等多个场景。 训练基准的v1.1和v2.0收集了440多份性能结果,而推理基准v2.1有560多个,反映出训练芯片的高门槛。 在这些基准中,训练和数据中心推理是目前最流行的,而其他如HPC和Tiny则针对特定应用环境,衡量标准各异,如时延、每秒查询数和功耗等。 近年来,中国AI芯片在MLPerf上取得显著成绩,如阿里巴巴的含光800和壁仞科技的BR104,以及墨芯人工智能的S30计算卡,展现了本土芯片在全球市场上的竞争力。 这些成绩表明,通过标准化的基准测试,可以客观地评估人工智能芯片的性能,期待未来中国芯在国际舞台上持续绽放光彩。
近日,中兴通讯自主研发的新一代 R5300 G4X两路服务器在全球知名的 SPEC CPU 2017两项基准测试中,摘得桂冠。 在SPEC网站上公开的测试结果中,该服务器分别以489分和576分,刷新了SPECrate 2017_fp_base测试以及SPECrate 2017_int_base测试成绩,同时创造了浮点运算和整形运算性能测试成绩新的世界纪录。 SPEC测试结果是全球企业级客户进行服务器产品、方案选型的主要技术依据,参与SPEC测试的企业包含全球知名服务器厂家。 此次SPEC CPU测试成绩的刷新又一次证明了中兴通讯新一代服务器R5300 G4X具有业界领先的性能。 关于SPEC和SPEC CPU2017SPEC(Standard Performance Evaluation Corporation)成立于1988年,是由斯坦福大学、清华大学、微软等全球几十所知名大学、研究机构、IT企业组成的第三方应用性能权威测试组织,旨在确立、修改以及认定一系列服务器应用性能评估的标准。 该测试是目前业界标准的、权威的基准测试之一,得到众多国际软硬件厂商的支持和参与,被金融、电信、证券等关键行业用户作为选择IT系统一项权威的选型指标。 SPEC CPU2017于2017年6月发布,包含四个测试套件,即SPECrate 2017 Integer、SPECrate 2017 Floating Point 、SPECspeed 2017 Integer、SPECspeed 2017 Floating Point,分别用于测试CPU的整型运算性能和浮点运算性能。 中兴通讯新一代服务器R5300 G4X 数字化转型的核“新”动能中兴通讯R5300 G4X基于第三代英特尔®至强®第三代可扩展处理器,双路最大支持80核,提供超强通用算力;支持英特尔最新一代的傲腾TM 持久性内存200系列,提供32个内存插槽,最高速率3200MT/s。 更为重要的是,G4X服务器内置异构计算智能加速引擎,可根据不同应用场景,灵活调度各种异构资源,实现算力的最佳组合,如CPU+GPU、CPU+FPGA等,满足人工智能、图像处理、工业控制等场景,将计算潜能发挥到极致。 同时R5300 G4X服务器秉承中兴通讯服务器一贯的电信级高可靠以及绿色节能的优异品质。 在可靠性方面,该服务器基于电信级设备产品研制规范,通过电信级器件选型、100%降额设计、严苛的验证测试(高加速极限测试、100%高温老化测试等),充分满足电信、金融等行业的严格要求;在绿色节能方面,通过供电方案优化、散热设计优化、PID智能风扇调速、IEM(Intelligent Efficiency Management)智能功效管理等,整机节能达到15%。 万物互联时代下,全球信息数据总量爆炸式增长,算力,成为影响数字经济发展的核心要素,算力时代已经来临。 中兴通讯R5300 G4X服务器具备的极致性能、灵活扩展、稳定可靠和极简运维等特性,致力于为千行百业的数字化转型提供核“新”动能。 来源:C114通信网相关PMI印度尼西亚与中兴通讯签署战略合作协议,共创卓越项目管理和服务C114通信网 11/25全光接入,智能运维,长安大学携手中兴通讯打造POL全光高校网络C114通信网 11/24实践创新,江苏移动携手中兴通讯率先完成5G信令网技术成熟度外场试点C114通信网 11/24中兴通讯郭树波:构建品质算力,做东数西算主力军C114通信网 11/24网云数智 开启工业数字化革命 中兴通讯亮相5G+工业互联网大会C114通信网 11/23湖北移动联合中兴通讯推出VoNR EMI创新应用 共助5G网络语音高质量发展C114通信网 11/22测试中兴服务器微软转型评 论通信人家园账号:本评论 更新于:2022-11-27 0:18
当前人工智能领域的创新潮流中,评估和理解各种硬件平台功能至关重要。 并非所有人工智能任务都需要庞大的训练GPU集群,推理任务,尤其是边缘计算,通常需要较少的GPU能力。 本文评测了三款不同戴尔服务器上的多个NVIDIA L4 GPU,以及包括MLperf在内的各种工作负载,以深入了解L4的性能表现。 NVIDIA L4 GPU的核心性能令人印象深刻,提供30.3 teraFLOPs FP32性能,非常适合高精度计算任务。 其强大功能扩展至使用TF32、FP16和BFLOAT16 Tensor Core进行混合精度计算,对于深度学习效率至关重要。 L4规格表引用了60至121 teraFLOP的性能,在低精度任务中,L4在FP24.5和INT8 Tensor Core表现出色,实现8 teraFLOP,增强神经网络推理能力。 其24GB GDDR6显存辅以300GB/s带宽,使其能够处理大型数据集和复杂模型。 L4的能效尤其引人注目,72W TDP使其适用于各种计算环境。 高性能、内存效率和低功耗的结合,使NVIDIA L4成为应对边缘计算挑战的绝佳选择。 然而,值得注意的是,L4的定价接近2500美元,而A2的价格大约是其一半,T4的使用价格则不到1000美元。 这引发了一个问题:这三种推理GPU之间有何区别?在评估这三张卡时,重要的是要认识到它们并不完全是世代一对一的替代品。 这解释了为什么T4在多年后仍然是某些用例的流行选择。 A2作为T4的替代品问世,提供低功耗且兼容性更强的选项(x8与x16机械)。 从技术上讲,L4是T4的替代品,而A2则介于两者之间,在未来的某个时候可能会或可能不会更新。 MLPerf推理3.1性能MLPerf是一个由学术界、研究界和工业界的人工智能领导者组成的联盟,旨在提供公平且相关的人工智能硬件和软件基准。 这些基准旨在衡量机器学习硬件、软件和服务在各种任务和场景中的性能。 本文测试重点关注了两个特定的MLPerf基准:Resnet50和BERT。 这两项测试对于评估人工智能硬件在涉及图像和语言处理的现实场景中的能力至关重要。 使用这些基准评估NVIDIA L4对于帮助了解L4GPU在特定AI任务中的功能至关重要。 它还提供了不同配置(单、双和四设置)如何影响性能的见解。 这些信息对于寻求优化人工智能基础设施的专业人士和组织至关重要。 在边缘和数据中心的Dell Poweredge XR7620和Dell T560服务器上运行多个任务,包括MLPerf测试。 在两个平台上,NVIDIA L4都表现出同样出色的性能,没有瓶颈。 在Dell T4中的两个L560进行的测试中,Resnet50和BERT K99基准测试的性能接近线性扩展,证明了L4GPU的效率及其协同工作能力。 使用四个L4单元的配置也观察到了一致的线性扩展,这尤其值得注意,因为随着并行处理和资源管理的复杂性增加,每个添加的GPU保持线性性能增益变得更加具有挑战性。 这些结果揭示了NVIDIA L4 GPU在不同操作场景中部署的实际影响,例如,使用L4 GPU的所有配置的服务器和离线模式之间的性能一致性,展示了其可靠性和多功能性。 这对于运营环境差异很大的企业和研究机构尤其重要。 此外,对互连瓶颈影响最小以及多GPU设置中GPU同步效率的观察,为希望扩展AI基础设施的人提供了宝贵的见解。 这些见解超越了单纯的基准数据,可以更深入地了解如何在现实场景中最佳地利用此类硬件,从而指导人工智能和高性能计算基础设施中更好的架构决策和投资策略。 在比较NVIDIA L4与之前型号的性能时,我们使用了实验室的服务器内部署的全部三个型号,并利用了我们的GPU测试套件。 这三款企业级GPU进行了性能测试,显示了相对于过去型号的性能升级。 NVIDIA L4 GPU在多种应用程序中提供无与伦比的效率和多功能性,不仅在人工智能领域表现出色,还为视频应用开辟了可能性的领域。 它能够处理密集型人工智能任务、加速视频管道并优化图形性能,使其成为边缘推理或虚拟桌面加速的理想选择。 NVIDIA L4结合了高计算能力、先进的内存功能和能源效率,使其成为推动边缘工作负载加速的关键角色,尤其是在人工智能和图形密集型行业。
本文地址:http://www.hyyidc.com/article/40262.html