标准规范下载简介
Q/GDW 11985-2019 信息系统自动化运维导则.pdf简介:
"Q/GDW 11985-2019 信息系统自动化运维导则.pdf" 是一份由中国电力科学研究院发布并由中国电力企业联合会归口的专业技术规范。这份导则主要针对电力行业的信息系统自动化运维进行指导,详细规定了信息系统运维工作的标准、流程、方法和要求,包括但不限于运维管理架构、运维服务、故障处理、性能优化、安全防护等方面。其目的是为了提升电力信息系统运维的效率和质量,保障电力系统的稳定运行,降低运维风险。它适用于电力行业的信息系统运维人员、管理人员和技术支持团队参考执行。
Q/GDW 11985-2019 信息系统自动化运维导则.pdf部分内容预览:
信息系统自动化运维导则
下列术语和定义适用于本文件
自动化运维automatedoperationandmaintenance 一种应用自动化探测、自动化分析、自动化处置、自动化展示等自动化技术的新型运维管理方式 降低运维管理复杂度DL/T 1870-2018标准下载,提高业务的安全性和稳定性
时序数据库timeseriesdatabase 种高性能、低成本、稳定可靠的在线时间序列数据库,提供高效读写,高压缩比存储、时序数 插值及聚合计算,提升写入和查询分析效率
运维对象operationandmaintenanceobject 运维人员管理维护的信息通信软硬件资源集合,可划分为基础资源、平台资源、网络资
Q/GDW119852019
Q/GDW119852019
6. 2. 1基本要求
应实现对主机设备、网络设备、安全设备、存储设备、计算资源、存储资源、网络资源、中目件 数据库等各类软硬件资源自动化管理
6. 2. 2资源分类
应对资源进行分类管理,划分为硬件资源及软件资源: a 硬件资源应包括机架、主机设备、网络设备、存储设备、安全设备、电源、空调、摄像头、传 感器等: b 软件资源宜划分为以下几类: 1)基础资源:计算资源、存储资源、网络资源、操作系统等; 2)平台资源:数据库、中间件、组件等; 3)应用资源:应用系统、应用组件、应用接口等
资源标准化治理要求如下: a)应参照6.2.2实现应用系统、操作系统、中间件等资源的标准化分类; )应按照标准化生产工艺要求实现各类资源的标准化命名、配置。
6.2.4资源台帐管理
6. 3. 1基本要求
应实现通过各类采集存储工具、策略对硬件、基础、平台、应用等各类软硬件资源数据的自动化 集和自动化存储。
6.2.2中运维对象的采集数据要求如下: 硬件资源的采集数据应包括设备名称、型号、配置、位置、编码、运行状态、责任人等: 基础资源的采集数据应包括: 1)计算资源的总量、分配量、 使用量、CPU运行状态等信息: 2)存储资源的总量、分配量、 使用量、磁盘运行状态等情况; 3)网络资源的总量、分配量、 网络流量情况等信息:
6.2.2中运维对象的采集数据要求如下: 硬件资源的采集数据应包括设备名称、型号、配置、位置、编码、运行状态、责任人等; 基础资源的采集数据应包括: 1)计算资源的总量、分配量、 使用量、CPU运行状态等信息: 2)存储资源的总量、分配量、 使用量、磁盘运行状态等情况; 3)网络资源的总量、分配量、网络流量情况等信息:
Q/GDW119852019
4)操作系统版本、用户数、端口开放情况、运行日志等信息。 c 平台资源的采集指标应包括: 1)数据库集群状态、实例状态、表空间使用率、会话连接数、数据库运行日志等; 2)中间件服务端口、承载的应用、账号权限、运行日志等信息。 d 应用资源的采集指标应包括应用名称、专职、厂商、通用业务指标、个性业务指标、数据接口、 运行日志等。
4)操作系统版本、用户数、端口开放情况、运行日志等信息 平台资源的采集指标应包括: 1)数据库集群状态、实例状态、表空间使用率、会话连接数、数据库运行日志等; 2)中间件服务端口、承载的应用、账号权限、运行日志等信息。 应用资源的采集指标应包括应用名称、专职、厂商、通用业务指标、个性业务指标、数据接口、 运行日志等。
采集方式要求如下: a)可采用有代理采集、无代理采集或自定义插件采集等方式进行数据采集; b) 应具备按需对数据采集频率、采集指标进行设置能力; c) 宜每日采集基础架构数据: d) 宜每5分钟采集应用监控数据; e) 数据采集组件占用设备CPU平均负载不应超过3%; f 数据采集组件占用设备CPU最大负载不应超过10%: 数据采集不应影响原有业务正常运行。
数据存储要求如下: a) 数据存储时间: 1)性能指标数据宜至少保存半年,超过半年的数据宜归档保存: 2)运行日志数据应至少保存半年,超过半年的数据宜归档保存 b) 数据库选型: 1)基础架构数据宜采用关系型数据库进行存储; 2)具备时间序列特征的监控数据宜采用时序性数据库进行存储。
应实现运行故障、运行状态、网络流量、性能等自动化运行分析能力和风险预警、预警分级等自 化预警能力。
应实现以下分析能力: a)运行故障自动化分析,包括自动化故障研判、定位、分类、处置方案匹配、处置方案生成等: 运行状态自动化分析,包括各类资源运行状态自动化巡检,自动分析巡检结果并形成分析报告 及处置建议等: ) 辅助自动化分析,包括: 1)网络流量分析:对各信息系统的网络流量进行自动化统计分析,实现网络流量智能监控 统计; 2) 性能分析:对信息系统全链条进行性能分析,实现性能问题预警、风险点定位等: 3) 数据流转监控分析:实现各业务系统之间的数据流转的及时性、完整性分析,对各信息系 统数据流转状态进行统计、分析。 d) 自定义分析报表生成;
Q/GDW119852019
Q/GDW119852019
e)自动生成拓扑关系,自动生成的拓扑 关系包括网络拓扑、应用系统架构拓扑等。
预警能力要求如下: a 应实现预警的分级管理,包括紧急预警、严重预警、重要预警、一般预警等: b 应实现风险自动预警,支持设备(系统)投运年限、网络流量、性能指数、关键参数、业务操 作、数据流转等风险预警,形成风险预警报告; C 应实现预警报表自动生成。
应实现监控巡检、资源部: 业的自动处置和故障应急处 置、故障处置结果验证、检修失败 处理时效性宜参考附录A
常规作业方面要求如下: a)监控巡检方面应实现: 1)自动化巡检:为各种软硬件资源提供运行指标及合规指标的检查,针对不同的巡检场景和 需求形成定制化的巡检任务,巡检对象涵盖操作系统、数据库、中间件、网络设备、安全 设备、存储设备、应用系统等,实现巡检指标的自动采集、自动分析和巡检报表的自动生 成; 2 弱口令检查:应包括主机、网络、数据库、中间件、应用与服务的的弱口令检查; 3) 实名制检查:信息系统相关运维账号的权限和实名制检查,对不合规项进行提示处理,并 输出检查报告。 资源部署方面应实现: 1)自动化部署:对信息系统运行基础设施等对象的自动化部署,包括对传统架构下物理主机 操作系统、中间件、数据库的安装,虚拟化架构下虚拟资源(如虚拟主机、虚拟网络、虚 拟存储等)的创建等; 2 自动化合规性检查:对存量在线系统的运行指标及合规性指标自动化进行检测,并能根据 检查结果自动形成分析报告: 3) 自动化更新:自动完成系统升级、配置变更等更新操作。 检修管理方面应实现: 1)检修结果自动化验证:实现对检修后的运维对象进行自动化健康性校验,包括运维对象的 运行状态、性能指标、集成关系、拓扑结构、数据接口、账号权限等; 2) 标准检修流程自动化:应实现部分标准检修流程自动化,如检修管理工作中检修时长评估, 应急处置方案生成等。 安全管理方面应实现: 配置自动备份:实现安全设备配置文件、配置参数自动备份; 2) 策略批量分发:实现IDS、IPS、WAF、漏洞扫描、防火墙、隔离装置等安全设备策略的批 量分发; 3) 特征库自动升级:实现IDS、IPS、WAF、漏洞扫描、防火墙、隔离装置等安全设备特征库 升级信息自动获取及升级:
Q/GDW119852019
4)策略分析:实现安全设备策略到期预警、自动去重和合规性分析等; 5)补丁自动更新:实现操作系统、中间件、数据库等软件版本的统一管理及补丁自动更新 e 备份管理方面应实现: 1 备份策略自动化管理:实现多种备份软件策略统一管理,应实现异构备份软件的备份策略 批量修改、统一下发和执行结果监控; 2) 备份自动化数据验证:实现自动化对备份环境和备份文件的有效性进行校验,保证备份数 据的完整性和可用性; 3)备份数据自动化恢复:实现自动化恢复备份数据,提高数据恢复效率
应实现状态总览、硬件资源总览及详情、基础资源总览及详情、平台资源总览及详情、应用资源总 览及详情的可视化展示,
a)状态总览: 1) 资源总览应显示硬件资源、基础资源、平台资源、应用资源的总体运行状态等,状态应包 括正常、检修、故障、隐患等; 2) 预警总览应显示各类预警数量实时变化情况; 3 预警种类应包括预警总数、紧急预警、严重预警、重要预警、一般预警等; 4)巡检总览应显示巡检资源统计与巡检任务统计。 b) 硬件资源总览及详情: 1) 资源总览应显示机房、机柜、服务器等资源统计信息,包括当前机房空间统计,各类设备 数量统计等信息; 硬件资源详情应展示机房、机柜、主机设备等资源的详细信息,包括设备型号、设备编码、 设备名称、设备位置、运行状态等。 C 基础资源总览及详情:
Q/GDW119852019
1)资源总览应显示计算、存储、网络、安全等资源统计信息,包括当前资源总量,分配量, 剩余量等信息: 2 基础资源详情应展示资源的运行状态数据与资源所支持的业务系统信息,包括操作系统版 本、用户数、端口开放情况、承载的业务系统等。 平台资源总览及详情: 资源总览应显示中间件资源、数据库等资源统计信息,包括当前中间件资源总量、中间件 资源使用量、数据库数量、数据库整体使用量等; 2 平台资源详情应展示中间件资源及数据库资源的运行状态数据,包括中间件的消息缓存大 小、应用个数等,数据库的表空间使用率、缓冲区信息、使用该资源的业务系统名称等。 应用资源总览及详情: 1 资源总览应显示各业务的统计信息GB∕T 39701-2020 粉煤灰中铵离子含量的限量及检验方法,包括业务总数量、正常业务数量、检修业务数量、故 障业务数量、隐患业务数量等: 2)应用资源详情应显示业务的运行状态及所依赖的各种资源,包括用户登录数、在线用户数 所依赖物理设备、操作系统、数据库、交换机等。
展示方式要求如下: )应支持运行概览及各资源的状态统计图形化展示方式: b)宜支持大屏、电脑桌面、移动终端等多种途径展示方式
Q/GDW119852019
附录A (资料性附录) 自动处置实效性要求
表A.1自动处置时效性要求
D/GDW 119852019
信息系统自动化运维导则
DB∕T 29-86-2020 天津市建设工程文件归档整理规程Q/GDW119852019