GB/T 41779-2022 高性能计算机系统能效测试方法.pdf

GB/T 41779-2022 高性能计算机系统能效测试方法.pdf
仅供个人学习
反馈
标准编号:
文件类型:.pdf
资源大小:2.6 M
标准类别:国家标准
资源ID:136080
免费资源

标准规范下载简介

GB/T 41779-2022 高性能计算机系统能效测试方法.pdf简介:

GB/T 41779-2022 是中国国家标准,全称为《高性能计算机系统能效测试方法》,它是一部关于高性能计算机系统能效评估的技术标准。该标准的发布,旨在对高性能计算机系统的能效进行科学、公正、客观的测试,以促进高性能计算机系统的能效提升,推动节能减排,提高信息技术的可持续发展。

该标准主要包括以下几个方面:

1. 测试对象:主要针对高性能计算机系统,包括超级计算机、云计算平台等,对其实现的计算能力、能耗、能效比等性能进行测量。

2. 测试方法:规定了能效测试的基准、测试流程、数据采集和处理方法,以及能效比的计算公式。这包括但不限于计算系统的吞吐量、功率消耗、能效比等。

3. 测试环境:对测试环境的温度、湿度、电源稳定性等进行了规定,确保测试结果的准确性。

4. 数据分析和报告:要求测试结果的详细记录和报告,以便于用户理解和使用,同时为系统优化和能效改进提供依据。

总体来说,GB/T 41779-2022 提供了一套科学的能效测试框架,对于高性能计算机系统的能效提升、节能减排以及智能化运维等领域具有重要意义。

GB/T 41779-2022 高性能计算机系统能效测试方法.pdf部分内容预览:

本文件按照GB/T1.1一2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规定 起草。 请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。 本文件由全国信息技术标准化技术委员会(SAC/TC28)提出并归口。 本文件起草单位:曙光信息产业(北京)有限公司、曙光数据基础设施创新技术(北京)股份有限公 司、中国计量科学研究院、兰州理工大学、中国电子技术标准化研究院、北京工翔科技有限公司、国家节 能中心、北京亦庄智能城市协同创新研究院有限公司、国家电网公司信息通信分公司、阿里云计算有限 公司、清华大学、中通服建设有限公司、山东省计算中心、北京大学、杭州万泰认证有限公司、国家发展和 改革委员会能源研究所、中国石油天然气股份有限公司勘探开发研究院、中科赛能(北京)科技有限公 司、北京节能环保中心、中国科学院电工研究所、中国科学院计算机网络信息中心、北京金茂绿建科技有 限公司、北京科计通电子工程有限公司、北京领智信通节能技术研究院、润和世联数据科技有限公司、中 国石油天然气股份有限公司吉林石化数据中心分公司、中国建设银行股份有限公司、北京纳源丰科技发 展有限公司、联想(北京)信息技术有限公司、曙光数创电子设备科技发展(青岛)有限公司、北京通和实 益电信科学技术研究所有限公司、建信金融科技公司、山东正云信息科技有限公司、北京林业大学。 本文件主要起草人:吉青、何继盛、武彤、林洁、刘宇、王力坚、韩孟之、郭志英、张鹏、孙健、欧阳述嘉 高书辰、常乾坤、闫金光、卢毅军、蒋忠伟、陆腾、范娟、柳晓雷、尚振阳、俞灵林、奉有泉、冯升波、熊涛、 樊春、潘京津、戴京训、潘景山、终钊、李震、金驰、杨绍鹏、钟杨帆、吕俊峰、刘艺斌、吕天文、区旸、关永芬 黄群骥、阮琳、于庆友、林立、韩美玲、周佳新、曹继业、赵勇祥、程振兴、赵宏晨、梁纲、刘巍、王也、张林锋 崔吉顺、冯剑超、刘晓旭、任凯、朱小舟、袁玉东、赵辉。

高性能计算机系统能效测试方法

本文件给出了高性能计算机系统能效的计算公式四层框架中学教学楼毕业设计,描述了高性能计算机系统能效测试的方法。 本文件适用于高性能计算机系统能效测试,可用于分析高性能计算机系统的能效状况,供高性能计 算机系统的研发、测试、生产等参考使用。本文件提出的高性能计算机系统能效值可作为评价高性能计 算机系统能效水平的参数。

GB/T 41779—2022

LU分解LUfactorization 在线性代数中矩阵分解的一种,将一个矩阵A分解为一个单位下三角矩阵L和一个上三角矩阵U 的乘积,其数学表达式为:A=LU。

LU分解LUfactorization 在线性代数中矩阵分解的一种,将一个矩阵A分解为一个单位下三角矩阵L和一个上三 的乘积,其数学表达式为:A=LU。

下列缩略语适用于本文件。 GPU:图形处理器(GraphicsProcessingUnit) MIC:多重整合核心架构(ManyIntegratedCore)

高性能计算机系统一般由计算子系统、存储子系统、网络子系统以及冷却子系统等组成。计算子系 统一般由管理节点、计算节点组成。计算节点包括普通计算节点(如刀片式服务器)和加速计算节点(如 含GPU、MIC等的服务器)。高性能计算机节点数应大于或等于10个节点,宜在50个节点以上,节点 总数无上限。 高性能计算机系统能效测试应包括该系统的计算能力测试和相应系统耗电量测试两部分。 高性能计算机系统计算能力通过FLOPS来衡量。计算能力应选取适当的软件测试程序对高性能 计算机系统的整体浮点运算性能进行测试。 高性能计算机系统能效通过HPCEE来衡量,HPCEE为系统计算能力与相应耗电量之比,其计算 公式见公式(1):

高性能计算机系统在进行能效测试时,应满足如下环境条件: a) 温度:18℃~40℃; b) 相对湿度:35%~80%(不应结露); c)大气压:86kPa~106kPa。

GB/T 417792022

高性能计算机系统的计算能力应通过采用高斯消元法求解一元N次稠密线性代数方程组的方法 进行测试。应选取适当的软件测试程序对高性能计算机系统的整体浮点运算性能进行测试。软件测试 程序应通过采用高斯消元法求解一元N次稠密线性代数方程组以评估整体浮点运算性能。 具体测试方案如下: a)使用随机数初始化得到一元N次稠密线性代数方程组Ax=b; b)指定方程组按公式(2)计算得出求解方程组总浮点运算次数; M=(2/3)×N²+2N2 式中: N一一元N次稠密线性代数方程组的次数; M一该方程组的总浮点运算次数。 c)按照7.2的架构设计要求编写程序对方程组求解,并记录总求解时间t; d)用总浮点运算次数M除以总求解时间t,即可得到系统的FLOPS。

7.2求解程序架构设计

高性能计算机系统计算能力测试程序可按照此框架设计要求自行编写。测试程序应包含如下 内容: a)初始化 测试程序应使用随机数初始化得到一元N次稠密线性代数方程组Ar=b,依据公式(2)计算 得到总浮点运算次数M并记录。 b)方程组求解 测试程序应采用高斯消元法,求解初始化后的一元N次稠密线性代数方程组Ar=b。求解过 程应分为两个步骤,分别是:将维度为N的矩阵A进行LU分解和求解三角系统。 1)LU分解应分为以下步骤: ·将矩阵A分解如公式(3):

Az1 A22 L21 loUzz

式中,矩阵A维度为NXN,矩阵A维度为NBXNB,矩阵A12维度为NB× (N一NB),矩阵A21维度为(N一NB)×NB,矩阵A22维度为(N一NB)X(N NB),L和L22为下三角矩阵,Un和U2为上三角矩阵。 将公式(3)进行分解计算得:

重复执行上述分解步骤,直至整个矩阵A全部完成LU分解。 注:测试程序设计可将矩阵A进行适当分块,并分布至高性能计算机系统的不同的计算节点,进行分布式 分解。 2)求解三角系统应分为以下步骤: ·矩阵A的LU分解完成之后,得到公式(11):

·求解三角系统公式(12),得到线性代数方程组的解,即完成一元N次稠密线性代 方程组Ar=b的整体求解过程。 2 测试时间记录与FLOPS结果输出 测试程序应记录高性能计算机系统对方程组求解的总时间t,用总浮点运算次数M除以总 解时间t计算得到系统的FLOPS并输出。

测试运行要求如下: a)进行高性能计算机系统能效测试应采用双精度浮点进行计算; b)计算能力测试应连续进行5轮,每轮测试结果及相关信息应按照8.2的要求进行记录; c) 一元N次稠密线性代数方程组计算规模N应使得每轮测试实际求解计算时间≥30min。 注:高性能计算机系统计算能力测试程序亦可选用TOP500高性能计算机排名所使用的线性系统软件包(Lin pack)。

高性能计算机系统能效测试是在系统运行计算能力测试程序的同时,使用电能计量仪表对高性能 计算机系统的能耗进行同步测量和记录 HPCEE测试方法含测试设备、测试点的选择、测试过程、测试结果记录4个部分,

测试设备要求如下: a) 2 电能测试仪表精度要求应符合GB/T32910.3—2016中7.2的要求; b) 温度计的测试精度不大于0.5℃,测试范围为一50℃~100℃; C) 湿度计的测试精度不大于2%,测试范围为0%~100%。

性能计算机系统总电能消耗测试点应位于图1中

高性能计算机系统电能消耗测试点

高性能计算机系统电能消耗测试过程如下。 a)测试准备阶段:调试电能表,启动高性能计算机系统,测量系统所在地室外大气环境温度和湿 度。判断测试环境是否满足测试条件。按照9.1的要求记录空载能耗。 b):计算能力测试:设定求解计算过程所需的方程组规模N并记录,执行计算能力测试程序对高 性能计算机系统FLOPS进行测量,记录测试开始及结束时间以及该时段内系统所消耗的 电能。 C )重复进行步骤b)计算能力测试5次镍矿采矿及井巷施工工程施工组织设计.docx,记录每轮相应测试结果

在HPCEE测试过程中,记录系统进行计算能力测试的计算时长和相应系统电能消耗。记录 见表A.1。 高性能计算机系统的公式(1)中参数R应为计算能力测试程序输出结果。 通过表B.1中平均功率P和实测值R,按照公式(1)计算可得HPCEE数值。 注:HPCEE测试记录表见附录A,HPCEE的能效分级见附录B。

在HPCEE测试过程中,记录系统进行计算能力测试的计算时长和相应系统电能消耗。记录的示 例见表A.1。 高性能计算机系统的公式(1)中参数R应为计算能力测试程序输出结果。 通过表B.1中平均功率P和实测值R,按照公式(1)计算可得HPCEE数值。 注:HPCEE测试记录表见附录A,HPCEE的能效分级见附录B。

披露HPCEE时应同时包含系统空载能耗信 成后,各进

一次时长为30min的系统空载能耗测试,空载功率记录表参照附录A进行记录。 注:空载待机状态是指参与计算能力测试的所有子系统都已全部开机,但不运行计算能力测试程序的状态。 命令Qstat或者Sinfo可查询到所有节点状态标识为idle

测试效率为实测值R与理论峰值Rmx之比,其中理论峰值按公式(13)计算: Rmx=芯片主频×单指令周期浮点操作数×核心数.…… *·.*·..*( 计算性能测试效率记录表参照附录A进行记录。

GB/T41779—2022附录A(资料性)测试记录表格示例HPCEE测试记录表、空载功率记录表、计算性能测试效率记录表示例见表A.1、表A.2和表A.3。表A.1HPCEE测试记录表实测电能测试程序开始结束计算时长平均功率PFLOPS测试次序消耗计算规模N时间点时间点实测值RHPCEE R/PSWkW ·h第1次第2次第3次第4次第5次注:计算时长为结束时间点与开始时间点的时间差。平均功率为系统电能消耗与计算时长之比。表A.2空载功率记录表开始结束空载时长系统能耗系统功率状态时间点时间点SkW·hW测试前系统空载测试后系统空载表A.3计算性能测试效率记录表测试次序实测值R理论峰值Rmx计算效率(R/Rmx)/%第1次第2次第3次第4次第5次

由表A.1得到5个HPCEE后,取其中的最低值《高压直流输电用油浸式换流变压器技术参数和要求 GB/T 20838-2007》,对照表B.1的规定范围,可对已测试的高性能 机系统的能效进行级别评定。

©版权声明
相关文章