标准规范下载简介
DB14/T 2526-2022 工业互联网综合平台 数据质量管理要求.pdf简介:
DB14/T 2526-2022 是中国工业互联网综合平台的一项地方标准,它明确了数据质量管理在工业互联网平台中的具体要求。该标准旨在指导工业互联网平台在收集、存储、处理和分析数据时,如何确保数据的准确性、完整性、一致性、时效性和安全性。
主要内容可能包括:
1. 数据质量管理框架:规定了数据质量管理的组织结构、职责分工和流程,强调了数据质量管理在整个平台中的重要性。
2. 数据质量评估:要求平台具备对数据质量进行实时监控和定期评估的能力,以发现并解决数据质量问题。
3. 数据清洗和标准化:要求平台能够对收集的数据进行清洗,去除冗余、错误或不一致的数据,并进行标准化处理,以提高数据的可用性。
4. 数据安全保护:强调了数据保密、完整性、可用性和不可抵赖性的保护,防止数据泄露、篡改或丢失。
5. 数据生命周期管理:规定了数据从生成、存储、使用到废弃的全生命周期管理策略,确保数据在整个过程中的质量。
6. 数据质量监控和改进:要求平台有持续改进数据质量的机制,通过数据分析和反馈,不断优化数据处理和管理流程。
总的来说,DB14/T 2526-2022 标准旨在推动工业互联网平台实现高效、可靠和安全的数据管理,助力企业提升决策效率和运营水平。
DB14/T 2526-2022 工业互联网综合平台 数据质量管理要求.pdf部分内容预览:
山西省市场监督管理局 发布
山西省市场监督管理局 发布
DB14/T25262022
范围 规范性引用文件 术语和定义 缩略语 数据分类, 数据质量特性, 数据质量管理 7. 1 数据质量管理框架 7.2 数据质量管理流程 7.3 数据质量管理工具 参老文献
CJJ∕T 125-2021 环境卫生图形符号标准DB14/T25262022
DB14/T25262022
工业互联网综合平台数据质量管理要求
本文件规定了工业互联网综合平台数据的分类 质量特性以及质量管理的框架、流程和工具。 本文件适用于工业互联网综合平台数据质量的管理、检测、分析和提升。
下列缩略语适用于本文件。 App:应用程序(Application)
DB14/T25262022
SQL:结构化查询语言(StructuredQueryLanguage
工业互联网综合平台数据包括但不限于煤炭、制造、物流运输、电力、燃气、建筑、水务、现代服 化工、治金等各个行业领域产品和服务全生命周期产生和应用的数据,可分为以下类型: a 研发数据:包括研发设计数据、开发测试数据等; 生产数据:包括控制信息、工况状态、工艺参数、系统日志、生产质量数据、生产实绩数据 等; 供应链数据:包括供需计划数据、仓储物流数据等; d 营销数据:包括投标次数、订单数量、交易金额、客户异议数据等; 运维数据:包括产品运行状况数据、产品售后服务数据等: 管理数据:包括客户基本信息、业务合作数据、人事财务数据、系统设备资产信息、产品基 本信息、项目进度数据、业务统计数据(如资源量数据、能耗监测数据)等; g 金融服务数据:包括信贷服务数据、融资租赁服务数据、征信服务数据等; h)平台运营数据:接入的设备数据、工业模型库数据、工业App数据、平台运行数据等; i外部数据:与其他主体共享的数据
根据GB/T36344一2018中第3章和第5章,工业互联网综合平台数据质量特性包括: a 规范性:数据符合数据标准、数据模型、业务规则、元数据或权威参考数据的程度; 数据标准是数据的命名、定义、结构和取值规范方面的规则和基准; 2) 数据模型是对分析的图像和文本表述,该分析识别了组织为完成其使命、功能、目标、 目的和战略,以及管理和评价组织所需要的数据; 3) 业务规则是一种权威性原则或指导方针,用来描述业务交互,并建立行动和数据行为结 果及完整性的规则; 4)元数据是关于数据或数据元素的数据(可能包括其数据描述),以及关于数据拥有权、存取 路径、访问权和数据易变性的数据。 5) 权威参考数据是系统、应用软件、数据库、流程、报告或平台日志记录用来参考的特定 字段的有效数据集合。 6 完整性:按照数据规则要求,数据元素被赋予数值的程度。即数据信息是否存在缺失的状况, 包括数据元素完整性和数据记录完整性; 准确性:数据准确表示其所描述的真实实体(实体对象)真实值的程度,即数据记录的信息 是否存在异常或错误,包括数据内容正确性、数据格式合规性、数据重复率、数据唯一性、 脏数据出现率; d)一致性:数据与其他特定上下文中使用的数据无矛盾的程度,即数据是否遵循了统一的规范, 数据集合是否保持了统一的格式,主要体现在数据记录的规范和数据是否符合逻辑,包括相 同数据一致性和关联数据一致性; e 时效性:数据在时间变化中的正确程度,包括基于时间段的正确性、基于时间点及时性、时 序性; f 关联性:度量相关联的数据是否缺失或建立索引: 可访问性:数据能被访问的程度,包括可访问和可用性。
7. 1数据质量管理框
DB14/T25262022
构建数据质量管理工具,见图1。数据质量管理流程主要从数据质量描述、数据质量识别、数据质量评估 和数据质量控制四方面进行搭建;数据质量管理工具主要从数据标准管理、数据质量规则、质量检测任 务、数据质量监控、数据质量报警、质量检测报告、检测报告分析、数据质量整改、数据质量跟踪方面 进行规定。
7.2数据质量管理流程
7.2.1数据质量管理模型
GB/T39400—2020中4.
应符合GB/T39400—2020中4.2的要求。
7.2. 2数据质量描述
图1数据质量管理框架
数据质量描述要求包括但不限于: a)应根据平台企业管理的需求,参考外部监管的要求,确定平台企业数据质量管理目标; 应根据平台企业数据质量管理目标、数据标准规范和数据质量特性,确定平台企业数据质量 评估维度,
7. 2.3数据质量识别
数据质量识别要求包括但不限于: a)应根据平台企业业务发展的需求及常见数据问题,确定平台数据质量管理范围、各类数 优先级以及质量需求:
DB14/T25262022
b)应根据平台企业数据 平价指标、校验规则与方法; 则进行持续维护与升级。
7.2.4数据质量评估
7.2.4.1数据质量检查
应根据数据质量规则中的有关 指标、校验规则与方法,对平台企业的数据 进行实时监控,若发现数据质量间 员进行反馈
72. 4. 2数据质量分析
数据质量分析要求包括但不限于: a) 应对数据质量检查过程中发现的数据质量问题及相关信息进行分析,并找出影响数据质量的 原因; b)应定义数据质量问题的优先级
7.2.5 数据质量控制
数据质量控制要求包括但不限于: a)应根据数据质量分析的结果制定、实施数据质量改进方案,包括错误数据更正、业务流程优化、 应用系统问题修复等; b)应制定数据质量问题预防方案
7.3数据质量管理工具
7.3.1数据标准管理
数据标准管理要求包括但不限于: a)应支持根据国家标准、行业标准、山西省地方标准等进行数据标准制定,包括数据标准的编 制、审核、发布等; b) 应支持数据标准执行,包括将标准要求提供给数据质量管理、根据已录入的数据标准形成质 量检测规则等; c)应支持数据标准维护,包括标准内容变更和版本管理等; d)应对数据标准的执行情况、实施效果进行监控,及时发现问题; e)应根据执行情况、实施效果和存在的问题,修订或重新制定已不适用的数据标准
7.3.2数据质量管理规则
数据质量管理规则要求包括但不限于: a)应支持根据数据质量特性自定义质量维度; b)应支持关联数据标准规范,进行基础规则定义。包括但不限于空值校验、值域校验、格式校 验、长度校验、精度校验、唯一性约束校验、主外键校验等; c)应支持根据基础规则和平台应用场景自定义业务规则; d)应通过自定义SQL语句等方式完成对数据质量的检核,
7.3.3数据质量检测任务
数据质量检测任务要求包括但不限于: a)应支持质量检测任务的创建:
DB14/T25262022
b)应支持检测任务调度规则的设定; C 应支持手动执行与自动执行检测任务,支持手动、定时、轮询、每周、自定义等多种调度规 则; d 应支持质量检测任务运维,查看任务执行日志、任务调度次数等; e 应支持问题数据的查询与导出; f 应支持未达标数据的查询与导出。 注1:问题数据是指平台设置数据库表中合格率范围之外的数据。 注2:未达标数据是未达到平台设置的数据质量特性合格率的表中所有数据。
7.3.4数据质量监控
数据质量监控要求包括但不限于: a)应支持对数据进行监控,明确数据的来源和去向; b)应支持对规则校验的结果进行监控和分析,校验结果应定位到原始数据项。
7.3.5数据质量报警
7.3.6数据质量检测报告
数据质量检测报告要求包括但不限于: a)应支持对校验结果进行记录并生成检测报告,检测报告的内容包括但不限于: 1)历史检测记录的数据波动,以及本次质量检测执行时间、检测结果等基本信息; 2) 对应数据的动态质量变化情况: 3) 每项业务规则检测数据量、问题数据量、合格率等详细信息; b) 应支持在线查看每项业务规则问题数据的详情; 应支持打包下载对应的问题数据; d)应支持数据质量检测报告的查看和下载
7.3.7数据质量检测报告分析
数据质量检测报告分析要求包括但不限于: a)应具备对检测报告进行综合性分析的功能,包括但不限于以下内容: 1 应支持通过多维度的分析报告来展示质量检测总体结果,包含检测数据来源、检测时间、 综合得分、检测数据量、合格数据量、规则数目、检测资源数目等基本信息,和各个质 量维度下每项的得分,以及此次检测数据的短板问题所属维度 2 应支持展示每项业务规则的详细检测内容,如每项的检测数据总数、问题数据数目,合 格率、问题数据分布情况等; 3) 应支持通过评分报告详情展示每项规则对应的得分情况及对应的比分权重,体现不同规 则的重要程度,并对高权重质量规则进行着重分析处理; 4 应支持每个业务规则横向对比,提供宏观的检测报告分析,展示数据质量问题的分布。 b 应具备对检测报告进行统计分析的功能,包括但不限于以下内容: 应支持通过图表的形式展示数据质量概览信息; 应支持按照数据源目录层级,即分层分域原则,按照指定的业务层级如区域、部门、指定 表等多种维度进行统计分析,并生成对应的质量趋势图
GB∕T 40771-2021 城市不动产三维空间要素表达DB14/T 25262022
7.3.8数据质量整改
数据质量整改要求包括但不限于: a)应支持根据质量分析结果生成对问题数据的质量提升建议; b)应支持数据标准化、数据清洗、数据转换和数据整合等功能,对不符合质量要求的数据进行 处理,并纠正数据质量问题。
数据质量整改要求包括但不限于: a)应支持根据质量分析结果生成对问题数据的质量提升建议; )应支持数据标准化、数据清洗、数据转换和数据整合等功能,对不符合质量要求的数据进 处理DBJ51/T 5063-2018标准下载,并纠正数据质量间题。
7.3.9数据质量跟踪
DB14/T25262022