标准规范下载简介
TCHES 47-2020 非结构化水文资料数据库结构标准.pdf简介:
,由于我是一个的,我无法直接查看或提供PDF文件的内容介绍。但是,从文件名"非结构化水文资料数据库结构标准.TCHES 47-2020"来看,这应该是一个关于水文资料管理的标准化文件,可能由TCHES(可能是某个水文技术或组织的缩写)发布。"47-2020"可能是该标准的版本号,2020年发布。"非结构化水文资料"可能指的是不遵循固定模式或格式,能够灵活存储和管理的水文数据,如文本、图像、音频或视频等。这份标准可能定义了如何设计、组织和管理这种类型的数据,以确保数据的准确、完整和可访问性。具体内容可能涉及数据的采集、存储格式、存取策略、数据质量控制等方面。如果你需要了解更详细的信息,建议直接查阅该PDF文件。
TCHES 47-2020 非结构化水文资料数据库结构标准.pdf部分内容预览:
T/CHES 47=2020
4.1.1非结构化水文资料数据库结构设计应遵循完整性、一致性、准确性、实用性和 规范化、可扩展的原则。 4.1.2非结构化水文资料数据库结构应满足大规模、多种类型、多种格式的水文资料 非结构化数据存储的要求。 4.1.3非结构化水文资料数据库结构设计中,应对所管理的数据库按学科或业务需求 进行分类和编码。 4.1.4非结构化水文资料数据库结构应具有开放性和包容性,能与搜索引擎集成。 4.2要求 4.2.1非结构化水文资料数据库宜采用非关系型数据库。 4.2.2非结构化水文资料数据库应由记录组成,记录由字段组成,字段存储水文资料 非结构化数据和结构化数据。 4.2.3非结构化水文资料数据库结构内容应包括数据库名、数据库标识、字段描述。 4.2.4非结构化水文资料数据库名应使用简明抛要的文字表达该数据库所描述的内容 命名准确、无歧义。 4.2.5非结构化水文资料数据库标识由英文字母、数字和下划线“"组成,首字符应为 大写英文字母。 4.2.6字段描述应包括字段号、字段名、字段标识、字段类型及长度、是否允许空值 计量单位、是否索引等,并应符合以下规定: a)字段号采用数字表示; b)字段名采用中文字符表征字段的名称,命名准确、无歧义; C) 字段标识由英文字母、数字和下划线“”组成,首字符为大写英文字母; d 字段类型及长度描述该字段的数据类型和数据长度: e) 是否允许空值描述该字段是否允许空值; f 计量单位描述该字段数据的计量单位; 是否索引描述该字段数据是否进行索引。
5.1非结构化水文资料数据库应能创建不同类型的字段,存储多种类型、多种格式的 水文资料非结构化数据和结构化数据,并根据用途和需求变化对字段进行增加、删除 和修改。 5.2字段类型主要有字符、数值、日期、时间、文本、二进制等类型,使用规则按SL478 执行。 a)字符字段用于存储定长字符串和变长字符串,其类型长度描述为:C(d); b)数值字段用于存储整数和实数,其类型长度描述为:N(D[,d);
5.1非结构化水文资料数据库应能创建不同类型的字段,存储多种类型、多种格式的 水文资料非结构化数据和结构化数据,并根据用途和需求变化对字段进行增加、删除 和修改。 5.2字段类型主要有字符、数值、日期、时间、文本、二进制等类型,使用规则按SL478 执行。 a)字符字段用于存储定长字符串和变长字符串,其类型长度描述为:C(d); b)数值字段用于存储整数和实数,其类型长度描述为:N(D[GB∕T 28391-2012 建筑施工机械与设备 人力移动式液压动力站,d);
6.1非结构化水文资料数据库的记录可由任意多个字段组成,字段类型应按5.2规定 执行。每条记录的长度无限制。 6.2一条记录可有多个字符、数值、日期、时间的字段。 6.3一条记录可有多个文本字段,存储多个自由文本,包括从文本格式水文资料非结 构化数据中抽取的文字信息。 6.4一条记录可有多个二进制字段,存储多个水文资料非结构化数据,一条记录中多 个水文资料非结构化数据的格式可不同。 6.5同一非结构化水文资料数据库可存储多种格式的非结构化数据,不同记录的水文 资料非结构化数据的格式可不同。 6.6每条记录在数据库中应有唯一的记录号,记录号应自动生成。 3.7每个文本格式水文资料非结构化数据装入非结构化水文资料数据库时,应生成字 符、文本、二进制和数值等4个字段的数据,存储在一条记录中,并符合以下规定: a)水文资料非结构化数据名称存储在字符字段; b)从文本格式水文资料非结构化数据中抽取的文字信息存储在文本字段: c)水文资料非结构化数据存储在二进制字段; d)水文资料非结构化数据容量存储在数值字段。 3.8每个非文本格式水文资料非结构化数据装入非结构化水文资料数据库应生成字 符、二进制和数值等3个字段的数据,存储在一条记录中,并符合以下规定: 水文资料非结构化数据名称存储在字符字段; b)水文资料非结构化数据存储在二进制字段; C 水文资料非结构化数据容量存储在数值字段。
7非结构化水文资料数据库字段定义
7.1文本格式数据的字段定义
7.1.1存储文本格式水文资料非结构化数据的数据库字段类型应包括字符、数值、文 本和二进制字段。 Z.1.2应按照记录的字段内容建立字段
.1.2应按照记录的字段内容建立字段。
示例:水文测站考证簿数据库字段定义详见表
表1水文测站考证潼数据库字段定义
说明:各字段存储内容为: a) 考证簿名:数字(化)考证簿的名称; b) 电子文件容量:数字(化)考证薄容量: c) 文字信息:从数字(化)考证簿中抽取的文字信息 d)电子文件:数字(化)考证簿
7.2非文本格式数据的字段定义
7.2.1存储非文本格式水文资料非结构化数据的数据库字段类型应包括字符、数值和 二进制字段。 7.2.2应按照记录的字段内容建立字段
示例:流域图数据库字段定义详见表2
表2流域图数据库字段定义
说明:各字段存储内容为: a) 流域图名:数字(化)流域图的名称; b) 电子文件容量:数字(化)流域图容量 电子文件:数字(化)流域图。
7.3非结构化数据及结构化数据的字段定义
7.3.1存储水文资料非结构化数据及结构化数据的数据库字段可包括字符、数值、日 期、时间、文本和二进制字段。 7.3.2应按照记录的字段内容建立字段
表3水文测站测验资料数据库字段定义
说明:各字段存储内容为: a)档号:水文测站测验资料的档号: b)流水号:卷内水文测站测验资料的流水号: c)年度:水文测站测验资料形成的年度: d)站码:水文测站代码应符合SL502一2010的规定,8位(数字和字母); e)站名:水文测站的中文名称; f)题名:水文测站测验资料的名称: g)页数:每份水文测站测验资料的页数: h) 备注:水文测站测验资料内容的说明; i) 电子文件名:数字(化)水文测站测验资料的名称; j 电子文件容量:数字(化)水文测站测验资料容量 k)文字信息:从数字(化)水文测站测验资料中抽取的文字信息: 1) 电子文件:数字(化)水文测站测验资料。 注:可根据实际需求,增加或减少字段
表4水资源资料数据库字
示例2:水资源资料数据库字段定义详见表4。
T/CHES 47=2020
水资源资料数据库字段定义
说明:各字段存储内容为: a)档号:水资源资料的档号; 流水号:卷内水资源资料的流水号: c) 年度:水资源资料形成的年度: d) 题名:水资源资料的名称; 页数:每份水资源资料的页数; 备注:水资源资料内容的说明。 9)电子文件名:数字(化)水资源资料的名称; h) 电子文件容量:数字(化)水资源资料容量: 文字信息:从数字(化)水资源资料中抽取的文字信息: 1) 电子文件:数字(化)水资源资料。 注:可根据实际需求,增加或减少字段。 示例3:降水自记纸图像文件数据库字段定义详见表5。
T/CHES 47=2020
表5降水自记纸图像文件数据库字段定义
S) 背面图像文件容量:降水自记纸背面图像文件容量; 背面图像文件:降水自记纸背面图像文件。 注:可根据实际需求,增加或减少字段。
背面图像文件名:降水自记纸背面图像 文件的名称 S 背面图像文件容量:降水自记纸背面图像文件容量: t)背面图像文件:降水自记纸背面图像文件。 注:可根据实际需求,增加或减少字段。
8非结构化水文资料数据库设计
8.1库名和库标识编制
3.1.1编制数据库名,应符合数据库存储的内容。 8.1.2应根据数据库名编制数据库标识
8.2.1应选择数据库和索引文件的存储位置。 8.2.2数据库和索引文件的存储位置可不同。 8.2.3各数据库的存储位置可不同。 8.2.4各索引文件的存储位置可不同
8.3.1选择中文自动分词方法。 8.3.2各数据库的中文自动分词方法可不同。
T/CHES 47=2020
8.4.1存储文本格式水文资料非结构化数据的数据库字段类型应包括字符、数值、文 本和二进制字段,按照记录的字段内容建立字段。 3.4.2存储非文本格式水文资料非结构化数据的数据库字段类型应包括字符、数值和 二进制字段,按照记录的字段内容建立字段。 8.4.3存储水文资料非结构化及结构化数据的数据库字段类型可包括字符、数值、日 期、时间、文本和二进制字段,按照记录的字段内容建立字段
化水文资料数据库的拆分
9.1.1一个非结构化水文资料数据库可被拆分成若干个子数据库。 9.1.2非结构化水文资料数据库拆分应以记录为单位。 9.1.3非结构化水文资料数据库拆分的方法可包括: a) 建立若干个结构相同的子数据库,根据数据库的记录号从数据库中提取记录, 将相应的记录导入各子数据库; b 建立若干个结构相同的子数据库,按照记录的容量从数据库中提取记录DB45∕T 2532-2022 排水沥青路面设计与施工技术规范,将 相应的记录导入各子数据库; C) 建立若干个结构相同的子数据库,根据检索结果从数据库中提取记录,将相 应的记录导入各子数据库。
9.2.1若干个非结构化水文资料数据库可合并成一个数据库。 9.2.2非结构化水文资料数据库合并应以记录为单位。
9.2.1若干个非结构化水文资料数据库可合并成一个数据库。
T/CHES 47=2020
10水文资料文字信息索
10.2对非结构化水文资料数据库中的文字信息索引宜包括: a)对字符字段每个字、词、词干、整个字段内容进行索引; 示例:观测项目字段的文字内容包括“流量水位降水”,对流、量、水、位、降、水、流量、 水位、降水等字词进行索引,其中单字“水”出现了两次,都索引,对整个字段内容“流量水位降 水”进行索引; b)对文本字段每个字、词、词干进行全文索引DB3701∕T 24-2021 公路工程文明施工管理规范,包括从文本格式水文资料非结构 化数据中抽取的文字信息; c)对数值、日期、时间进行索引; d)对数据库的记录号进行索引。 10.3水文资料文字信息索引应存储在索引文件中。