GB/Z 33451-2016标准规范下载简介
GB/Z 33451-2016 地理信息 空间抽样与统计推断简介:
GB/Z 33451-2016 是中国的一项推荐性地理信息国家标准,全称为《地理信息 空间抽样与统计推断》。这项标准主要规定了地理信息空间抽样和统计推断的基本原则、方法和技术要求,旨在指导和规范在地理信息处理、分析和应用过程中如何进行有效的空间抽样和统计推断,以提高数据处理的精度和效率,保证数据的代表性和可信度。
具体来说,这项标准包括以下几个方面的内容:
1. 空间抽样方法:规定了各种抽样方法,如简单随机抽样、系统抽样、分层抽样、聚类抽样、多阶段抽样等,以及这些方法的适用场景和操作步骤。
2. 抽样设计:给出了如何根据研究目标和地理信息特性设计抽样方案,包括确定样本数量、抽样单元、抽样框等。
3. 统计推断:阐述了如何基于抽样结果进行统计推断,包括估计总体参数、检验假设、误差分析等。
4. 软件实现:虽然不是强制性的,但标准也提到了如何在软件中实现这些抽样和统计方法,以方便实际应用。
5. 质量控制:规定了评估抽样和统计推断质量的指标和方法,如抽样误差、置信度等。
这项标准适用于各种地理信息的处理和分析,如遥感图像、GIS数据、地理定位数据等,对于在自然资源管理、城市规划、环境监测、灾害预警等领域进行空间数据处理的科研人员和工程师具有重要的指导意义。
GB/Z 33451-2016 地理信息 空间抽样与统计推断部分内容预览:
B.1典型空间抽样和统计
以某县有林地覆被面积的抽样调查为例,介绍本指导性技术文件陈述的几种典型空间抽样和统计 方法(空间随机、空间分层和Sandwich)应用的主要过程。应用实例采用了该县有林地覆 披的栅格数据(2697460个栅格单元,空间分辨率是1km")作为抽样底图和抽样范围(图B.1)。其中, 空间数据描述了每个像元的坐标信息,属性数据为每个抽样单元(像元)的有林地面积值。由于本附录 中的应用实例所用数据均为栅格数据,故无需设置分辨率,总体量为像元个数2697460;取值类型均设 置为尺度值
图B.1某县有林地覆被的栅格数据抽样底图(栅格分辨率1km²)
B.1.1空间随机
抽样得到该县有林地面积的估计值T∕CECA 20008-2021 多雨地区低影响开发设施设计标准,使其当显著性水平为0.05时的绝对误差限不超过86
B.1.1.1第一阶段抽样设计
首先,对总体统计性质探索性分 根据以前的调查结采,该: km²栅格单元尺度有林地面积的离散棕准差约为1.5×10 km。结合本案例的需求说明.故参数设
GB/Z334512016
故实际总的样本量n。:84;扩大10%后抽取出的样本量:93。 最后,抽取样本点。利用计算机伪随机数生成方法从2697460个像元中随机抽取93个样本像元 (包括经纬度坐标),并按照经纬度坐标将其布局在抽样底图中(图B.2)
B.1.1.3第三阶段统计推断和结果报告
B.1.2空间分层
抽样得到该县有林地面积的估计值,使像元尺度林地平均面积估计值的期望方差为65,根据先 只和数据可估计出各分层单元的标准差、调查费用和相关系数
B.1.2.1第一阶段
基于知识经验、历史数据和辅助数据对研究区域或抽样底图进行空间分层(图B.3),图中不同颜 表了不同分层,共五层。
B.1.2.1.1探索性分析总体统计性质及相关参数设置
表B.2每个分层的参数
GB/Z334512016
结合本案例的需求说明,其他参数设置为:抽样(用户)期望精度为65.即V=65。
B.1.2.1.2计算样本量
样本量按最优分配方案(见附录A)计算总的最优样本量n。;随后,按各层内部单元数占总体全部 单元数比例W、各层离散标准差s、空间自相关系数c与总体全部单元数n。乘积占上述总量的比例 来将总的最优样本量n。分配到各个分层中,从而获得每个分层的样本量n(表B.3)。 总的最优样本量n。
各分层样本量n.为:
表B.3每层的样本量
表B.3每层的样本量
实际总的最优样本量n。为:72;扩大10%后抽取出的样本量:81
B.1.2.1.3抽取样本点
B.1.2.2第二阶段—数据采集和获取
基于样本点的布局图,通过野外调查或更高空间分辨率遥感影像获取每个位置的有林地面积数 包括时间、地点、坐标、数据类型和值)
B.1.2.3第三阶段统计推断和结果报告
根据所抽取的81个像元,计算其样本均值立,然后将样本均值立,乘以总体量2697460,即为材
B.1.3Sandwich空间
抽样得到该县有林地面积总量及各报告单元的估计值;总的调查费用不得超过20
得到该县有林地面积总量及各报告单元的估计值;总的调查费用不得超过20万元
B.13.1第一阶段抽样设讯
GB/Z334512016
首先,基于知识经验、历史数据和辅助数据对研究区域或抽样底图进行分层,构成知识层(图B. 仆,根据报告内容的要求,还需生成报告单元层(该县的10个镇,如图B.5,也可以是自然单元、格 其他用户感兴趣的报告单元)
然后,分析息 可以计出各不分层单的标推差,根据 以往的调查经验和成本能够估计调查的费用,结果如表B.5所示。其中,调查的基本费用约8000元 平均每个像元的调查费用为120元。结合本案例的需求说明,参数设置如下:总费用为200000元,即 =200000;基本费用投入8000元,即C。三8000;平均每个像元(样本单元)的调查费用为120元;各 层的离散标准差S和费用C,如表B.5所示
其次,计算样本量。样本量按最优分配方案(见附录A)计算知识层总的最优样本量n。;随后,按各 层内全部单元数占总体全部单元数比例W:、各层离散方差s、空间自相关系数c与总体全部单元数乘 积占上述总量的比例来将总的最优样本量no分配到各个分层中,从而获得每个分层的样本量n(表 B.6)。总的最优样本量n。和各分层样本量7n为:
实际总的最优样本量n。为:142;扩大10%后抽取出的样本量:159, 最后,抽取样本点。利用计算机伪随机数方法在每个分层内进行简单随机抽样,并布局在抽样底图 中,如图B.6所示
B.1.3.2第二阶段—数据采集和获取
基于样本点的布局图,通过野外调查或更高空间分辨率遥感影像获取每个位置的有林地面积数 括时间、地点、坐标、数据类型和值)
B.1.3.3第三阶段统计推断和结果报告
根据所抽取的159个像元,估算其知识层的样本均值yst,样本均值st乘以2697460,即为林地 总面积估计值Y
WaJ= 456.6m Y=Nyt=2697460X456.6=1231640819.7m²~1231.6km 知识层均值估计方差:
ZW.y=456.6m
Y=Nyst=2697460X456.6=1231640819.7m²~1231.6km 知识层均值估计方差:
GB/Z334512016
简单随机抽样与分层抽样均估计总体,后者 不同,用以估计多个报告单元
B.2.1.1第一阶段—统计推断
首先,基于知识经验、历史数据和辅助数据对研究区域或抽样底图进行分层。如按照气候区划将全 国划分为边缘热带、南亚热带、中亚热带、暖温带、北亚热带、高原温带、高原亚寒带、高原亚温带、高原寒 带、中温带、寒温带。 然后,输人分层数据和气象站点数据:上述气象分层数据和全国700多个国家级地面气象站点 1997年2007年的年平均气温数据。 其次,计算全局拟合半变异函数和各个分区的拟合半变异函数。用球状进行空间半变异函数 拟合,相应的参数如表B.8所示,其中高原寒带和寒温带由于点数过少,采用了全局的半变异函数的拟 合参数。
表B.8半变函数拟合结果
最后,依据表附录A计算全国平均温度及其估计方差,得到Msv=9.5℃,U(yMsN)=0.41。 注:上述步骤执行过程中,后台将分别计算各层和层际空间自相关系数,以及每个样本的最优权重(针对每个分层 的样本点和基于对总体无偏最优估计约束,可以得到一组线性方程,解此方程组即得每个样本的最优权重)。
最后,依据表附录A计算全国平均温度及其估计方差,得到Msv=9.5℃,U(yMsN)=0.41。 主:上述步骤执行过程中,后台将分别计算各层和层际空间自相关系数,以及每个样本的最优权重(针对每个分层 的样本点和基于对总体无偏最优估计约束,可以得到一组线性方程,解此方程组即得每个样本的最优权重)。
B.2.1.2第二阶段—样点优化
给定全国平均温度估计的目标偏 低到0.15;使用蒙特卡洛方法生成候选 站点位置,并依据粒子群优化算法在候选 搜索最佳采样点
B.2.1.3第三阶段结果报告
根据计算结果生成报告(表B.9)
GB/Z334512016
将某地2009年8月4日至2009年9月 传架纳发数作为全授盖的历更数据: 依据该区5个哨点医院2010年8月4日至2010年9月4日每天的该传染病发病数,估计该地2010年 8月4日至2010年9月4日每天的该传染病发病数
首先,基于历史数据和样本数据计算总量,并基于2009年的历史数据计算各个医院病例数之间的 协方差; 然后,按照无偏最优的约束条件,目标函数为估计方差最小,由此得到一组方程,从而求解获得在计 算总体病例数时,5个哨点医院权重和哨点医院该传染病病例数与总体病例数之间的比值; 最后,估计总体及其方差。依据公式XBSHADE w:y:(附录A)计算总体病例数,其中w:为哨 点医院权重,:为哨点医院病例数(2010年每天哨点医院病例数);依据附录A公式计算估计方差
B.2.2.2第二阶段—结果报告
DBJ50∕T-376-2020 老旧小区改造提升建设标准根据计算结果生成报告(表B.10)。
以某地2010年5月10日至2010年6月8日18个官方监测点每天的PM1.浓度数据为参照(数据 以CSV格式存储,每一列为18个监测站点的PM浓度值,每一行为某一天的PMi。浓度值),以某一个 监测点2010年5月10日至2010年6月8日每天的PM2.5的监测数据为样本,推断该时间段内该地每 天的平均PM浓度
B.2.3.1第一阶段一
首先,计算PM2s站点与每个PM1o站点监测数据的协方差,以及PM1o各个站点监测数据之间的协 方差; 然后,基于单点加权值来估计总体均值,加以估值无偏最优约束,目标函数为全区估值方差最小;由 此得到一组方程,从而求解获得单点PM2.5数据在估计总体中的最优权重估计; 最后,估计总体及其方差。依据公式ysPA=Woy(附录A)计算总体均值ysPA,其中W。为权重, V。为样本值:依据附录A中的公式计算估计方差(ysPA)。
B.2.3.2第二阶段结果报告
根据计算结果生成报告(表B.11)
《深圳经济特区技术规范《公共建筑节能设计规范》SJG 44-2018》表 B.11结果报告
GB/Z334512016