标准规范下载简介
DB32/T 4040.1-2021 政务大数据 数据元规范 第1部分:总则.pdf简介:
"DB32/T 4040.1-2021 政务大数据 数据元规范 第1部分:总则.pdf" 是一份江苏省地方标准,它详细规定了政务大数据领域中的数据元(Data Element)规范,特别是针对数据元的总体概念、定义、分类、命名规则、数据结构等方面。这份规范旨在统一政务大数据的收集、管理和使用过程中涉及的数据元素,以提升政务数据的互操作性、标准化和有效性。它适用于江苏省各级政府机构和相关企业,对于推动政务信息化和大数据应用的标准化进程具有重要意义。
DB32/T 4040.1-2021 政务大数据 数据元规范 第1部分:总则.pdf部分内容预览:
下列文件申的内容通过文申的规范性引用而构成本文件必不可少的条款。其中,注日 用文件: 仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本 文件。 GB/T18391.1一2009信息技术元数据注册系统(MDR)第一部分:框架 GB/T19488.1一2004电子政务数据元第1部分:设计和管理规范 GB/T35295—2017信息技术大数据术语
下列术语和定义适用于本文件。 3.1 数据data 信息的可再解释的形式化表示,以适应于通信、解释或处理。 注:数据可以由人工或自动的方式加工、处理。 [来源:GB/T18391.1—2009,3.2.6] 3.2 大数据bigdata 具有体量巨大、来源多样、生成极快、且多变等特征并且难以用传统数据体系结构有效处理的包含 大量数据集的数据。 注:国际上,大数据的4个特征普遍不加修饰地直接用volume、variety、velocity和variability予以表述,并 分别赋予了它们在大数据语境下的定义: a)体量volume:构成大数据的数据集的规模; b)多样性variety:数据可能来自多个数据仓库、数据领域或多种数据类型; c)速度velocity:单位时间的数据流量; d)多变性variability:大数据其他特征,即体量、速度和多样性等特征都处于多变状态。 [来源:GB/T 35295—2017,2.1.1] 3.3 数据元dataelement 由一组属性规定其定义、标识、表示和允许值的数据单元。 注:数据元在特定的语义环境中被认为是不可再分的最小数据单元。数据元一般来说由对象类、特性和表示三部分 组成:
a)对象类:思想、概念或真实世界中的事物的集合,它们具有清晰的边界和含义,其特征和行为遵循同样的 规则。对象类是人们希望研究、搜集和存储它们的相关数据的事物; 示例1:汽车、人、房屋、订单等。 b)特性:对象类中的所有成员共同具有的有别于其他的、显著的特征。特性是用来区分和描述对象的手段; 示例2:颜色、性别、年龄、收入、地址等, c)表示:描述了数据被表达的方式,表示与数据元的值域关系密切。一个数据元的值域指数据元的所有允许 值的集合。 示例3:对于“个人所得税金额”这个数据元,它的值域可以是一系列非负整数(带有货币单位),这是一种 非枚举型的值域,而“个人所得税比率”对收入进行分段划分,并给每一段赋予一个比率山区小别墅施工图,它的值域就 是这些比率的集合,此时称它的值域为枚举型值域。 [来源:GB/T18391.1一2009,3.3.8,有修改] 3.4 元数据 metadata 定义和描述其他数据的数据。 [来源:GB/T18391.1—2009,3.2.16] 3.5 属性attribute 某个对象或实体的一种特性。 [来源:GB/T18391.12009,3.1.1] 3.6 值域valuedomain 允许值的集合。 [来源:GB/T18391.1—2009,3.3.38] 3.7 注册registration 一个管理项与其管理部门的关系。 [来源:GB/T18391.1—2009,3.3.31] 3.8 政务部门administrativeorganization 政府部门及法律法规授权具有行政职能的事业单位和社会组织。 3.9 管理部门responsibleorganization 标准化行政主管部门授权对政务数据元实施注册、维护和管理功能的组织。 3.10 应用部门applicationsorganization 因履行职责需要使用其他政务部门(3.8)的政务信息资源和为其他政务部门(3.8)提供政务信 息资源的政务部门(3.8)
居元和代码集的表示规范
4.1数据元的属性概述
数据元的表示规范是通过对其一系列属性的描述来实现的,这些属性即是数据元的元数据。 出了数据元的六大类属性。
表1数据元的六大类属性
4.2数据元属性的描述方法
下面的描述符是对数据元属性的描述: a)名称 赋予数据元属性的标记,名称是唯一的,名称以字符型表示。 b)定义 属性的描述,可使一种属性与其他属性清晰地区别开来,定义以字符型表示。 C约束 显示一个属性是始终还是有时出现的描述符,该描述符有必选和可选两个取值,前者表示该属性必 须出现,后者表示该属性是否出现可选。 d)出现次数 显示一个属性出现多少次的描述符,该描述符有以下四种情况:0:1(表示不出现或出现1次) 0:n(表示不出现或出现多次),1:1(表示出现且仅出现1次),1:n(表示出现1次或多次)。 e)类型 描述属性的所有取值的类型。 示例:字符、数值、日期、时间、日期时间和二进制。 f)规则
约束:必选。 出现次数:1:1。 类型:字符型。 规则:
a)在一定语境下数据元的名称应唯一; 中文名称由一个对象类词、一个特性词和一个表示词组成,其顺序为:中文名称=对象类词十 特性词十表示词; b)中文名称中应只有一个对象类词、特性词和表示词; c)当表示词与特性词有重复或部分重复时,可将名称中穴余词省略: d)中文名称尽量与权威名称保持一致。 备注:无。
4.3.3名称:中文全拼
定义:数据元中文名称的汉语拼音。 约束:必选。 出现次数:1:1。 类型:字符型。 规则:数据元的中文全拼是用“”连接中文名称中的每一个汉字的拼音,全部用小写 备注:无。
4.3.4 名称:中文首拼
定义:数据元中文名称的汉语拼音的首字母。 约束:必选。 出现次数:1:1。 类型:字符型。 规则:中文首拼全部使用大写字母。 备注:无。
4.3.5名称:英文名称
定义:赋予数据元的单个或多个英文字词的指称。 约束:可选。 出现次数:0:1。 类型:字符型。 规则:英文名称优先采用权威来源。 备注:无。
定义:用于本文件在正式发布后和下次修订发布期间,数据元应用部门和管理部门内部版本管理的 标识。 约束:可选。 出现次数:0:1。 类型:字符型。 规则: a)版本是由阿拉伯数字字符和小数点字符组成的字符型,本文件实施后,版本定为1.0。
定义:用于本文件在正式发布后和下次修订发布期间,数据元应用部门和管理部门内部版本管理 标识。 约束:可选。 出现次数:0:1。 类型:字符型。 规则:
b)版本号变更的原则为: 1) 数据元的必选属性发生变化时,无论非必选属性是否变化,则小数点字符前的数字字符加 1,小数点字符后的数字归0; 2 数据元的必选属性不变而非必选属性发生变化时,则小数点字符前的数字字符不变,小数 点字符后的数字加1。 示例:某数据元的版本号为1.0,当数据元第一次修订时,其必选属性发生变化而非必选属性不变,则该数据元的 版本为2.0;当该数据元第二次修订时,其必选属性不变而非必选属性发生变化,则该数据元的版本为2.1; 当数据元第三次修订时,其必选属性和非必选属性同时发生变化,则该数据元的版本为3.0。 备注:无。
备注:无。 .7名称:同义名称 定义:一个数据元在不同应用环境下的不同称谓。 约束:必选。 出现次数:o:n。 类型:字符型。 规则:无。 备注:一个数据元可以有多个同义名称。 数据元定义类属性 1.1名称:定义 定义:是用描述性的短语或句子对一个数据元所作的解释。 约束:必选。 出现次数:1:1。 类型:字符型。 规则:无。 备注:无。 .2名称:对象类词 定义:数据元名称成分之一,表达了该数据元所属事物或概念的集合。 约束:可选。 出现次数:0:1。 类型:字符型。 规则:无。
4.3.7名称:同义名称
定义:一个数据元在不同应用环境下的不同称谓。 约束:必选。 出现次数:o:n。 类型:字符型。 规则:无。
4.4数据元定义类属性
定义:是用描述性的短语或句子对一个数据元所作的解释。 约束:必选。 出现次数:1:1。 类型:字符型。 规则:无。 备注:无。
定义:是用描述性的短语或句子对一个数据元所作的解释 约束:必选。 出现次数:1:1。 类型:字符型。 规则:无。 备注:无。
4.4.2 名称:对象类词
定义:数据元名称成分之一,表达了该数据元所属事物或概念的集合。 约束:可选。 出现次数:0:1。 类型:字符型。 规则:无。 备注:标识出数据元的对象类词,有助于实现对数据元的规范化命名、分析、类比和查询等功能
4.4.3名称:特性词
定义:用以表达数据元所属的对象类的某个显著的、有区别的特征。 约束:可选。 出现次数:0:1。 类型:字符型。 规则:无。 备注:标识出数据元的特性词有助于对数据元的规范化命名、分析、类比和查询。 45数据元关系类属性
4.5.1名称:分类方案
定义:根据数据元的来源、组成、结构、应用、功能等共同特性,将数据元排列或划分成组的模式。 约束:可选。 出现次数:0:n。 类型:字符型。 规则:本文件中的数据元的“分类方案”均遵照4.3.1给出的分类方案。 备注:数据元可使用多种分类方案进行描述,以便于使用者从不同的角度进行查询和使用。每种分 类方案有一个标识符,不同的标识符代表不同的分类方案;数据元的分类原则和方法见GB/T7027。
4.5.2名称:分类方案值
定义:某个数据元在一个分类方案中所处的位 约束:可选。 出现次数:o:n。 类型:字符型。 规则:本文件中的数据元的“分类方案值”均遵照4.3.1给出的分类方案值。 备注:分类方案和分类方案值之间存在一一对应关系《电气设备电源特性的标记 安全要求 GB17285-2009》,
4.5.3 名称:关系
定义:关系用以描述当前数据元与其他相关数据元之间的关系。 约束:必选。 出现次数::n。 类型:字符型, 规则:无。 备注:表3给出了数据元之间基本关系的数据格式,为更加通俗准确表示数据元的基本关系,其关 系数据格式采用中文描述和表3中的关系表示符共同表示
表3数据元基本关系的数据格式
4.6数据元表示类属性
4.6.1 名称:表示词
定义:表示词用于描述数据元值域的表示形式GB 5845.8-1986 城市公共交通标志 城市轮渡标志,表示词是数据元名称的组成成分之 约束:可选。 出现次数:0:1。 类型:字符型。 规则:无。 备注:标识出数据元的表示词有助于实现数据元的规范化命名、分析、类比和查询。国际范围内记 可的表示词见表4。
表4国际范围内认可的表示词