建筑物形状特征分析表达与自适应化简方法
晏雄锋1
1. 同济大学测绘与地理信息学院, 上海 200092;
2. 武汉大学资源与环境科学学院, 湖北 武汉 430079;
3. 华中师范大学城市与环境科学学院, 湖北 武汉 430079
基金项目:国家自然科学基金(42001415; 42071450; 42071455); 自然资源部数字制图与国土信息应用重点实验室开放研究基金(ZRZYBWD202101)
关键词:建筑物化简 形状表达 自适应化简 图卷积编码器
引文格式:晏雄锋, 袁拓, 杨敏, 等. 建筑物形状特征分析表达与自适应化简方法[J]. 测绘学 ,2022,51(2):269-278. DOI:
10.11947/j.AGCS.2022.20210302
YAN Xiongfeng, YUAN Tuo, YANG Min, et al. An adaptive building simplification approach based on shape analysis and representation[J]. Acta Geodaetica et Cartographica Sinica, 2022, 51(2): 269-278. DOI: 10.11947/j.AGCS.2022.20210302
阅读全文:
http://xb.sinomaps.com/article/2022/1001-1595/2022-2-269.htm
引 言
化简是矢量建筑物数据处理的基础性操作之一,其目的在于移除建筑物边界上的凹凸细节特征,从而满足制图表达的要求。在制图综合领域形状化简是建筑物尺度变换的主要算子之一,广泛应用于多比例尺地形图缩编、三维城市建模、导航地图生成与更新等诸多应用[1]。此外,该变换操作也是影像数据提取矢量建筑物的后处理环节之一[2]。从遥感影像中提取的建筑物轮廓通常难以直接用于制图表达,存在弱直角和冗余点等问题,需要运用化简方法进行去噪和规则化处理。
建筑物化简过程不仅需要控制位置偏移,而且要尽量保持目标原有的形状、大小、方向及正交性特征。对此,学者们设计了不同类型的建筑物化简算法。第一类算法注重局部特征的探测与简化处理,包括短边剔除法[3-4]、凹凸特征探测与渐进式删除法[5-7]、邻近四点法[8]等,还引入最小二乘[9-11]、整数规划[12]等优化技术提升短边或者局部凹凸特征处理的合理性。第二类算法强调建筑物化简前后整体结构的保持,包括迭代法[13]和模板匹配法[14-15],主要面向具有特殊形状的建筑物目标。此外,一些学者借助数学形态学[16-17]以及图像处理技术[18-19]设计建筑物化简方法。上述算法设计的角度或采用的策略不同,面向不同形状的建筑物具有各自的适应范围和局限性。由于同一区域建筑物在几何形态上往往存在多样性,单一算法难以合理地化简所有建筑物目标。
1 图卷积学习支持下的建筑物形状特征表达
建筑物的形状特征表达是化简动作实施的基础,主要包括两个部分:建筑物图结构构建及特征提取与建筑物形状的自编码学习模型。
1.1 建筑物图结构构建及特征提取
图 1 建筑物边界预处理与图结构表达 Fig. 1 Preprocessing and graph-based representation for building boundary
图选项
图 2 建筑物边界节点的上下文特征提取 Fig. 2 Feature extraction of building boundary nodes using shape context descriptor
图选项
1.2 建筑物形状特征表达的图卷积自编码模型
图 3 面向建筑物形状特征分析的自编码学习模型 Fig. 3 Graph-based autoencoding architecture for building shape representation
图选项
1.2.1 卷积运算
,其中X为图拉普拉斯矩阵L的特征向量χl组成的矩阵且满足L=XΛXT,Λ为特征值
组成的对角矩阵。逆变换为
, i={1, 2, …,n}。根据卷积定理,图函数f和卷积核g的卷积转化为频率域的点乘运算,即
。
为避免特征分解运算,将xTg表达为Λ的切比雪夫多项式
(1)
式中,σ(·)为非线性激活函数;fi(l)是(l)层的第i个图;θi,jk和bj[l]分别是可训练的Fin×Fout×K维多项式系数和1×Fout维偏置量,其中Fin和Fout分别是(l)和(l+1)层的图数量,即特征维度。
1.2.2 池化和上采样运算
,将n节点映射到m节点形成不同粒度的特征层输出,从而支撑池化和上采样层的设计。具体通过两次卷积运算实现,即:
和
。其中, Convembed为了生成新的节点特征,Convpool为了获得到节点之间的分配矩阵,并通过Softmax函数归一化。基于此,(l+1)层图的邻接矩阵和节点特征矩阵分别更新为
在上述过程中,图节点的数量和特征维度得到了调整。当m小于n时,节点数量减少,理解为对节点进行了聚类以得到粗化输出,即图的池化运算,以获取不同粒度的特征。当m大于n时,节点数量增加,即图的上采样运算,以恢复图的尺寸。
1.2.3 损失函数
该模型通过非监督方式进行训练,训练目标为最小化输入和输出之间的差异。考虑到池化运算中分配矩阵优化的困难性,文献[26]在损失函数中加入两组约束,分别是每层邻接矩阵差异最小化以及分配矩阵逐行的熵最小化。其中,前者保障邻接矩阵中边的稳定性,后者保障每个节点的分配概率接近一位有效向量(one-hot vector),以清晰地表达其与下一层输出之间的关系。最终损失函数定义为
(4)
2 形状自适应的建筑物化简算法选择模型
2.1 建筑物化简候选算法集
表 1 4种候选化简算法比较 Tab. 1 Comparison of four candidate building simplification algorithms
比较内容 | 矩形拟合法 | 模板匹配法 | 邻近四点法 | 迭代法 |
算法原理 | 将建筑物最小外接矩形缩放至与其面积相同并代替它,同时保持重心不变 | 根据建筑物群整体形态建立模板库;对于待化简建筑物,将所有模板按比例缩放至与其大小、方向、重心一致;计算各模板与其交集和并集的面积比,取最大面积比的模板作为化简结果 | 在原建筑物多边形的边界点上滑动一个窗口,窗口最初锚定在最长边的起始点,窗口恒定容纳四个相邻点,根据四点组成结构执行相应操作 | 旋转建筑物使其最小外接矩形边平行于坐标轴;按距离最小外接矩形顶点最近的四点将建筑物划分为四个弧段;计算每弧段的一元回归线及其标准差;当标准差小于阈值时以回归线表达该弧段;否则继续剖分 |
适用范围 | 适用整体形态接近矩形的建筑物,实现最大程度化简 | 适用典型形态特征建筑物,体现出局部一致性、规律性特征 | 适用局部凹凸结构复杂的建筑,对于整体面积保持较为良好 | 适用整体形态复杂的建筑物,可以最大限度地增强正交性特征 |
局限性 | 对于非近似矩形状的建筑物,可能在结构保持和位置控制方面处理失当 | 依赖于模板库的建立,完备的模板库是化简的前提条件 | 缺少整体视角,可能丢失边界特征点破坏结构特征;另外正交化能力不强 | 初始边依赖于最小外接矩形,在其与建筑形状差别较大时表现欠佳,甚至出现自相交 |
表选项
2.2 建筑物化简算法选择模型
图 4 基于监督学习的建筑物化简算法选择模型 Fig. 4 Selection model of building simplification algorithms using a supervised learning
图选项
很多机器学习分类模型可以完成上述任务,例如人工神经 络(backpropagation neural network, BPNN)、支持向量机(support vector machine,SVM)、随机森林(random forest, RF)等。在利用这些学习模型构建用于建筑物化简算法选择的分类器时,不需要建立特殊的数据组织方式或运算技巧,采用通用模型即可。因此,基于不同学习模型构建分类器的原理和过程不再赘述。
3 试验分析
3.1 化简质量评价指标
(1) 位置变化指标。设原始建筑物边界节点p1,p2, …, pn,n表示节点数量。节点pi的位置变化定义为该点到化简后多边形边界的最近距离d(pi)。化简前后整体位置变化通过所有节点位移平均值来描述,计算为
(5)
(2) 方向变化指标。方向变化指标通过最小外接矩形长边的方向变化值来度量,计算为
(6)
式中,Ob和Oa分别表示化简前后最小外接矩形长边与X轴方向的夹角。
(3) 面积变化指标。面积变化通过化简前后建筑物多边形的面积差值来度量,计算为
(7)
式中,Ab和Aa分别表示化简前后的面积。
(4) 形状变化指标。建筑物形状通过边界上的点沿参考方向(如x轴)切角变化情况来描述,即转交函数[27],表示方法为一维分段函数。形状变化则由化简前后建筑物多边形对应的转角函数组成的空间距离来表示,即
(8)
式中,fb(s)和fa(s)分别表示化简前后建筑物多边形的转角函数;θ代表建筑物多边形的旋转角度;t代表自起点沿多边形行进的弧长。如图 5所示,形状变化即两组转交曲线所围成的区域范围大小。
图 5 化简前后建筑物形状变化度量 Fig. 5 Shape change measurement of the building polygons before and after simplification using turning function
图选项
(9)
式中,αi表示化简后建筑物多边形相邻两边形成的夹角;n为多边形节点数。
3.2 建筑物形状编码结果与分析
图 6 形状特征表达的可视化 Fig. 6 Visualization of the shape representation using the proposed graph-based autoencoding architecture
图选项
3.3 分类结果与分析
表 2 不同机器学习方法支持下化简算法选择模型的分类精度 Tab. 2 Classification accuracies of the simplification algorithm selection using different machine learning models
模型 | 参数 | 数据集Ⅰ(住宅区) | 数据集Ⅱ(商业区) |
BPNN | 神经元数4 | 72.3 | 58.8 |
神经元数8 | 77.9 | 63.8 | |
神经元数12 | 78.2 | 63.7 | |
神经元数20 | 78.0 | 62.4 | |
神经元数30 | 76.1 | 60.2 | |
RF | 决策树数30 | 69.2 | 63.4 |
决策树数50 | 71.0 | 65.3 | |
决策树数100 | 70.7 | 65.5 | |
SVM | 线性核函数 | 56.5 | 43.3 |
高斯核函数 | 72.9 | 56.7 |
表选项
可以看到,BPNN模型在较少神经元时分类精度较低,随着神经元数据增加,精度有所提升且表现稳定;但神经元达到一定数量,精度略微下降,这可能与模型复杂程度以及训练数据量相关。综合两个数据集的结果,BPNN模型中神经元数量为12时表现较佳。RF模型在不同的决策树数量参数下分类精度变化并不大。但是对于SVM模型,采用线性核的分类精度远低于高斯非线性核。
对比3种模型,BPNN模型在数据集Ⅰ的最佳精度达到78.2%,相比SVM和RF模型有一定的优势,但是在数据集Ⅱ中的精度为63.7%,略逊于RF模型。RF模型在数据集Ⅰ精度低于BPNN及非线性SVM模型,但在数据集Ⅱ上精度达65%,优于其他模型。对比两组数据集,3种模型都是在数据集Ⅰ中的表现优于数据集Ⅱ。分析可能的原因是住宅区中建筑物面积一般较小、形态特征比较简单显著;并且局部范围内的建筑物往往呈现相似的形状、具备相近的尺寸,适合采用相同的化简算法进行处理。因此,在编码器将相似形状表征后,分类器能具备较好的区分能力。相比较之下,商业区中的建筑物形状和尺寸差别较大,形状较为复杂、相似性也不强,导致模型进行不同化简算法选择时难度系数提升。特别是针对都适合处理较为复杂形状的邻近四点法和迭代法,模型很难获得与人工一致性较高的判断知识。
3.4 建筑物化简结果与分析
图 7 建筑物数据及不同化简方法得到的结果 Fig. 7 Comparison of the simplified results produced by different methods
图选项
表 3 利用不同方法化简的结果评价指标 Tab. 3 Evaluation of the simplified results produced by different methods
方法 | 数据集Ⅰ(住宅区) | 数据集Ⅱ(商业区) | ||||||||
MD | OC | AC | SC | OR | MD | OC | AC | SC | OR | |
矩形拟合法 | 1.852 | 0 | 0.001 | 0.089 | 0 | 2.812 | 0 | 0 | 0.123 | 0 |
模板匹配法 | 1.301 | 0 | 0.046 | 0.1 | 0.016 | 2.548 | 0 | 0.014 | 0.155 | 0.003 |
邻近四点法 | 0.799 | 0.045 | 0.078 | 0.073 | 0.066 | 1.135 | 0.017 | 0.008 | 0.08 | 0.029 |
迭代法 | 0.988 | 0.035 | 0.043 | 0.081 | 0 | 1.487 | 0.018 | 0.042 | 0.096 | 0 |
0.813 | 0.007 | 0.012 | 0.071 | 0.02 | 1.211 | 0.011 | 0.006 | 0.092 | 0.005 |
表选项
可以看到,单一算法在某些指标上具有一定的优势。例如矩形拟合法在面积、方向保持以及正交性特征指标上最优,原因在于其化简时会缩放最小外接矩形使其面积和方向保持与原始形状一致,这是强约束,同时也能保证化简后多边形4个角都是直角。邻近四点法在位置保持指标上表现良好,原因在于其化简动作是通过移动或删除局部凹凸结构实现的,只会处理一部分结构点,因此其平均位置移动最小。但是单一算法很难兼顾全部的指标,例如矩形拟合法和模板匹配法的位置指标表现欠佳,表明其化简后存在较大的位置偏移;迭代法和邻近四点法在方向和面积保持方面欠优,表明这两种局部处理的策略,可能会造成整体形状特征出现失衡。
前文中指出由于数据集Ⅱ中的建筑物形态较为复杂、尺寸差异较大,算法选择时分类精度较低,因此也进一步影响了后续化简过程。例如表 3中,在数据集Ⅱ中化简指标整体较数据集Ⅰ略差。但差距不是很明显,同时从图 7(b)中也可以看到数据集Ⅱ中很多建筑物也能取得较好的化简效果。分析可能的原因是一个建筑物可能存在多种化简算法,其效果比较接近且都能满足化简需求。因此,在部分情况下,就算自动选择的算法与人工选择的算法不一致,但是其化简结果也是可以接受的。
4 结论
初审:张艳玲
复审:宋启凡
声明:本站部分文章内容及图片转载于互联 、内容不代表本站观点,如有内容涉及侵权,请您立即联系本站处理,非常感谢!