测绘学 | 高晓蓉:多尺度地图空间居民地语义相似度计算方法

多尺度地图空间居民地语义相似度计算方法

高晓蓉1,2,3

1. 兰州交通大学测绘与地理信息学院, 甘肃 兰州 730070;

2. 地理国情监测技术应用国家地方联合工程研究中心, 甘肃 兰州 730070;

3. 甘肃省地理国情监测工程实验室, 甘肃 兰州 730070

基金项目:国家自然科学基金(41930101);兰州交通大学优秀平台(201806);甘肃省教育厅: 优秀研究生”创新之星”项目(2021CXZX-549)

关键词:语义相似度 街区式居民地合并 地图综合 多尺度地图空间 匹配距离模型

引文格式:高晓蓉, 闫浩文, 禄小敏. 多尺度地图空间居民地语义相似度计算方法[J]. 测绘学 ,2022,51(1):95-103. DOI: 10.11947/j.AGCS.2022.20210074

GAO Xiaorong, YAN Haowen, LU Xiaomin. Semantic similarity measurement for building polygon aggregation in multi-scale map space[J]. Acta Geodaetica et Cartographica Sinica, 2022, 51(1): 95-103. DOI: 10.11947/j.AGCS.2022.20210074

阅读全文
http://xb.sinomaps.com/article/2022/1001-1595/2022-1-95.htm

引 言

相似是一种组织原则,人们在该原则指导下分类对象、形成概念、实施概括[1],相似也是地图综合的本质特征:无论从地理空间到地图空间,或从大比例尺地图空间到小比例尺地图空间,正确的地图综合须突出表现地理事物的规律性,在保证清晰易读的前提下将尽量丰富的内容容纳在有限地图空间内[2],其中包含的创造性分类、分级,抽象概括即为对相似关系的保持。因此,制图者无法脱离相似实施地图综合,读图者无法从缺少相似性的地图形成心象地图、重构现实世界。地图综合这一复杂的智能化过程[3],其本质是一种空间相似变换[4],空间相似关系是地图学领域至关重要且值得深入探讨的课题。

图选项

1 语义功能区约束下的街区式居民地合并

1.1 居民地的语义信息

图 2 不同比例尺地图上同一建筑物的语义信息 Fig. 2 Semantic information of the same building on different scale maps

图选项

1.2 大比例尺街区式居民地合并

图 3 语义功能区约束下的街区综合(试验区1) Fig. 3 City block generalization under the constraint of semantic function regions

图选项

图 4 基于基础地理信息分类标准和地理国情要素数据规定的语义层次结构 Fig. 4 Hierarchical structure based on topographic maps classification and national geographical survey specifications

图选项

2 基于匹配距离模型的语义相似度计算方法

2.1 MD(matching-distance)模型的原理

所谓本体,是对客观存在现象、事物的系统描述,在计算机和信息领域是指共享概念模型的明确的形式化规范说明[27]。MD模型基于本体论,它使用实体类(以下简称类)之间的语义关系和实体类的可区分特征两个组成部分来代表实体类,基于实体类语义间的相互关系组织实体类,并将实体类的集合及其语义关系描述为本体[11]。MD模型采用式(1)—式(3)计算语义相似度[13, 28-30]

(2)

(3)

之所以采用组成部分、功能和属性3个方面相似度,是因为实体类表示的目的在于获取关于类的足够知识,以便对它们进行区分[13],功能如教育(大学)、医疗(医院),组成部分和其他属性可以进一步提供类别间区别的细节。

使用Tversky基于特征的语义评价模型计算SpSfSa(式(2))[1, 29]t为类的某一特征(组成部分/功能/属性),C1C2分别为类c1c2的特征集,| |运算符用于计算集合的基数。

式(2)中函数α由式(3)计算。d(·)函数用于计算两个实体类在本体语义 中的距离,l.u.b.是类c1c2的最小上界(least upper bound)对应的超类。参数α(c1,c2)的确定不仅使用上位/下位关系,还使用组成关系[29]。落入功能区(定义见2.2节)的居民地属于该功能区的组成部分(图 5),但具有整体、部分关系的类的属性间不存在继承性。

图 5 语义功能区内的建筑物 Fig. 5 Buildings in a semantic function region

图选项

2.2 本体及模型参数的赋值方法

确定组成部分、功能、属性的依据如下。

(2) 功能:功能区为位于面内的居民地赋予功能属性。如图 5所示,功能区内的所有建筑物,即使其功能有差别,但从地图综合抽象的角度,均为其赋予医院的功能。该功能区“* *医院”的建筑物包括门诊楼、保健楼、体检中心、住院部,功能属性集Cf=functionhospital={医疗, 教学, 科学研究, 预防和社区卫生服务}。

(3) 属性:子类继承父类所有属性,并增加其特有的属性。父类“居民地”属性采用1∶5000基础地理信息数据RESA(面状居民地)的属性,子类“单幢房屋”采用1∶500—1∶2000基础地理要素数据字典属性,见表 1。图 5所示医院的属性采用地理国情要素城镇综合功能区属性项,Ca={名称, 等级, 类型, 归属, 建筑年代},增加其父类所有属性及合并时的有关属性。

表 1 实体类组成部分、功能、属性各分量构成 Tab. 1 Similarity values for parts, functions and attributes of the class two or more buildings and class single building

实体类型 组成部分 功能 属性
街区(两幢以上房屋) 单幢房屋/高层房屋/…
地基
屋顶
依据是否处于功能区确定 名称;面积;包含的单幢房屋数;包含各房屋的ID
单幢房屋 地基
屋顶
依据是否处于功能区确定 名称;面积;类型;(地上)层数;(地下)层数;结构类型
小区 单幢房屋/高层房屋/…
场院
与位于其中的居民地类相似度为1 等级;名称;面积;类型;归属;建筑年代;包含的单幢房屋数;包含各房屋的ID
居民地 单幢房屋/高层房屋/…
街道
绿地
作为整体的居民地与单幢房屋的功能差别较大 名称;面积

表选项

2.3 功能区约束下合并过程语义相似度计算

地图综合中,语义相似关系的比较具有不对称性,即以综合后图上某个居民地i为目标(记为ci_smallScale),以最原始比例尺图上的对应居民地为参照(记为ci_largeScale)计算。合并过程中,综合后与综合前居民地数目比为1∶mi(mi≥1),二者的相似度为si(ci_smallScale,ci_largeScale)。包含了n个居民地的原始街区,综合后街区与原街区的语义相似度S(csmallScale,clargeScale)采用式(4)计算

(4)

3 试验与分析

图 6 试验区2地图综合中的语义变化 Fig. 6 Semantic changes of experimental city block 2 in map generalization

图选项

图 7 试验区3地图综合中的语义变化 Fig. 7 Semantic changes of experimental city block 3 in map generalization

图选项

3.1 实体类相似度

表 1、表 2分别为实体类3个相似度分量赋值及各类之间的相似度。

表 2 街区与单幢房屋相似度计算分量 Tab. 2 Similarity values for two or more buildings and single building in Fundamental geographic information features-General survey of geographical condition data ontology

语义相似度分量 α(c1,c2) Sp(c1,c2) Sf(c1,c2) Sa(c1,c2) St(c1,c2)
c1(目标):街区
c2(参照物):单幢房屋(功能区内的)
0 1 1 0.333 3 0.770 0
c1(目标):街区
c2(参照物):单幢房屋(不位于功能区内的)
0 1 0.6 0.333 3 0.638 0
c1(目标):小区
c2(参照物):单幢房屋
0 0 1 0.500 0 0.495 0
c1(目标):居民地
c2(参照物):单幢房屋
0 0 0.3 0.333 3 0.209 0

表选项

3.2 综合前后街区相似度

以图 3(b)与图 3(a)比较为例,变化如图 8所示。原比例尺的20个单幢房屋,综合后成为9个单幢房屋和3个街区。西北侧小区,5个单幢房屋合并为1个街区(图 8①),东南侧4个单幢房屋合并为1个街区(图 8②)。两处语义变化均为单幢房屋—>街区。“街区”与“单幢房屋”相似度为0.770 0(表 2)。南侧不被功能区包含的2个单幢房屋合并为1个街区(图 8③)。综合前后,要素均不位于功能区之内,功能属性均为空值,此时虽然不清楚其具体功能(如教学楼的具体功能是教学),但同为建筑物,总的功能是“观赏性和私密性”,因此功能属性指定为0.6,“街区”与“单幢房屋”的相似度为0.638 0(表 2)。因此,图 3(b)与图 3(a)相比,语义相似度=

×0.770 0+

×0.638 0+

×1=0.860 3。

图 8 图 3(a)—图 3(b)综合后语义变化 Fig. 8 Semantic changes of buildings in Fig. 3(b) compared with buildings in Fig. 3(a)

图选项

3.3 试验结果分析

表 3为3个街区的语义相似度计算结果,图 9为折线图。由表 3、图 9可知:

表 3 试验街区语义相似度计算结果及变化率统计 Tab. 3 Semantic similarity values for experiment blocks at different scales and change ratio statistics

比例尺缩小倍数 街区1 街区2 街区3
语义相似度 变化率 语义相似度 变化率 语义相似度 变化率
1 1 1 1
3/4 0.860 3 0.974 4 0.903 8
1/2 0.791 3 20.87% 0.883 1 11.69% 0.840 6 15.94%
1/4 0.466 4 41.09% 0.431 4 51.15% 0.341 0 59.43%
1/8 0.209 0 55.19% 0.288 4 33.15% 0.275 19.36%
注:表3中语义相似度的变化率是以1、1/2、1/4、1/8为节点计算的。例如,街区3在1/2比例尺下的变化率为(1-0.840 6)/1=15.94%,在1/4比例尺下相对于1/2比例尺的变化率为(0.840 6—0.341 0)/0.840 6=59.43%等。

表选项

图 9 3个试验区不同比例尺节点的语义相似度 Fig. 9 Semantic similarities of the three experimental city blocks at different scales

图选项

(1) 比例尺从原始(横轴值1)缩小至原始的1/2(含1/2,横轴值1/2)时,3个街区相似度的变化率都是各自变化率(表 3中各街区的列方向)中最小的,分别为20.87%、11.69%和15.94%。因为在该比例尺范围,合并引起的语义变化主要是“单幢房屋/高层房屋/……”至“街区”,即两幢或两幢以上独立房屋合并为多幢房屋,建筑物间距是主要影响因素。3/4和1/2比例尺下,3个街区语义相似度:街区2>街区3>街区1,相似度变化率:街区2 < 街区3 < 街区1。度量结果与人的直观感受一致:街区2的建筑物间距较大,街区3次之,街区1的建筑物间距相对最小。

(2) 比例尺缩小至1/4(横轴值1/4)时,不再表示建筑物/街区,而表示出全部的功能区(图 3、图 6、图 7)。1/4比例尺下,3个街区语义相似度:街区1>街区2>街区3,相似度变化率:街区1 < 街区2 < 街区3。与原始比例尺相比发生的语义变化是“单幢房屋/高层房屋/……”至“小区/医院/……”或“单幢房屋/高层房屋/……”至“居民地”,功能区内的建筑物数占比是主要影响因素,如表 4所示,与3个街区语义相似度大小一致,符合人的直观感受:不再表示具体的建筑物形状时,将整个街区表示为“居民地”的地图表达,不如小区、学校、博物馆等功能区表达清晰,前提是在合适的尺度范围内。

表 4 试验街区功能区内建筑物数占比 Tab. 4 The proportion of building numbers in function units of whole experimental blocks

试验街区 功能区内建筑物数目占比
街区1 0.85
街区2 0.777 8
街区3 0.461 5

表选项

(3) 比例尺缩小至1/8(横轴值1/8)时,用选取算子对功能区实施取舍。保留该比例尺下面积大于图解尺寸的功能区,舍去其他较小的功能区,语义变化是“单幢房屋/高层房屋/……”至“小区/医院/……”或“单幢房屋/高层房屋/……”至“居民地”。此时,保留的功能区内的建筑物数占比是主要的影响因素,如表 5所示,3个街区语义相似度与占比呈正相关:街区2>街区3>街区1。又由于取舍主要取决于功能区的面积,因此街区内功能区的面积也间接影响了相似度的变化。街区1的功能区全部舍去(图 3(e)),与原始比例尺(图 3(a))相比,无法获得该处存在学校、小区这一信息,此时语义信息主要通过POI点、注记获得。

表 5 试验街区保留的功能区内建筑物数占比 Tab. 5 The proportion of building numbers in function units reserved in experimental blocks

试验街区 保留的功能区建筑物数目占比
街区1 0
街区2 0.277 8
街区3 0.269 2

表选项

(4) 最小相似度和最大相似度。图 9中,灰色、绿色虚线为各比例尺下相似度均最小、最大时的折线,对应街区不存在功能区及所有建筑物都在功能区内两种情况,两条折线构成的灰色范围是所有街区语义相似度的可能分布范围。可以看出,试验中3个街区各比例尺的相似度都大于等于最小相似度,是因为各街区都存在功能区,相比最小相似度的情形,即不以语义功能区为约束合并、选取的情况,提供了更多的语义信息。

图 10 试验街区符号的专题信息熵计算示例 Fig. 10 Examples for the calcuation of thematic information

图选项

在未加入功能区时,图 10中3个建筑物的邻居都是建筑物,此时专题信息熵为0(不考虑几何信息熵和拓扑信息熵)。加入功能区后(图 10),功能区中建筑物的直接Voronoi邻居包括了建筑物和功能区两个类型,各建筑物符号的专题信息熵如图所示,整个街区的专题信息熵是街区内所有建筑物符号及功能区符号专题信息熵的总和,大于未加入功能区的信息熵。这符合文献[33]的结论:如果某符号的邻居符号(由直接邻近Voronio区定义)都具有与该符号相同的专题类型,那么,从专题信息的角度看,该符号的重要性非常低;相反,如果一个符号具有不同专题类型的邻居符号,则该符号具有较高的专题信息量。

(5)

4 结语

初审:张艳玲

复审:宋启凡

终审:金 君

往期推荐

资讯

○ 关于申 2022年科技期刊第二批项目的通知

○ 室内定位是全社会数字化的重要基石——访中国电子科技集团首席科学家、卫星导航系统与装备技术国家重点实验室主任蔚保国

○ 人社部正式通知:降低注册测绘师等13项准入类考试工作年限要求,职业资格继续与职称对应!自2022年起实施!

会议

○ Geoinformatics 2022 暨CPGIS成立30周年年会(二号通知)

○ 会议通知 | 第三届IEEE地质、测绘与遥感国际学术会议

○ 关于召开大地测量与导航2022年综合学术年会的通知(第一轮)

○ 会议注册开始啦!第三届中国空间数据智能学术会议SpatialDI 2022

《测绘学 》

○ 测绘学 | 马天明:空间碎片激光测距微弱信号实时识别方法

○ 测绘学 | 屈进红:航空重力测 交叉点的非遍历逼近方法

○ 测绘学 | 董杰:超导重力数据检测到的2011年日本东北大地震(Mw 9.0)震前重力异常及同震重力变化

○ 《测绘学 》2022年第2期目录

《测绘通 》

○《测绘通 》2021年第12期目录

○ 《测绘通 》2022年第1期目录

○ 地市级实景三维城市建设及应用

○ 图残差神经 络支持下的建筑物群组模式分类

《北京测绘》

○《北京测绘》2022年第1期摘要推荐

○《北京测绘》2021年第12期摘要推荐

○《北京测绘》2021年第11期摘要推荐

○《北京测绘》2021年第10期摘要推荐

《测绘科学技术学 》

○ 摘要 |《测绘科学技术学 》2021年第2期摘要推荐

○ 摘要 |《测绘科学技术学 》2021年第4期摘要推荐

○ 摘要 |《测绘科学技术学 》2021年第5期摘要推荐

○ 摘要 |《测绘科学技术学 》2021年第6期摘要推荐

《地球信息科学学 》

○ 《地球信息科学学 》2022年第2期佳文推介

○ 龚健雅院士:全球位置信息叠加协议与位置服务 技术研究进展与展望

○ 佳文推介 | 大数据城市通勤交通模型的构建与模拟应用

○ 专刊征稿:社会感知与地理大数据挖掘(征稿中)

《测绘工程》

○ 摘要 |《测绘工程》2021年第5期摘要推荐

○ 摘要 |《测绘工程》2021年第6期摘要推荐

○ 摘要 |《测绘工程》2022年第1期摘要推荐

佳文推介 | 单目视觉技术在室内定位中的应用研究

《中国空间科学技术》

火卫二地形地貌探测综述

○《中国空间科学技术》2022年第1期摘要

○《中国空间科学技术》2021年第6期摘要

○《中国空间科学技术》2021年第5期摘要推荐

《卫星应用》

○《卫星应用》2021年第12期摘要

○《卫星应用》2021年第11期摘要

○《卫星应用》2021年第10期摘要

○ 摘要 |《卫星应用》2021年第9期摘要推荐

《Journal of Geodesy and Geoinformation Science》

○《测绘学 (英文版)》专刊征稿 | 地图学与地球空间信息教育:理论与实践

○ 《测绘学 (英文版)》专刊征稿 | 用于三维地理信息的摄影测量和计算机视觉

○ Kexian WANG et al. | 《测绘学 (英文版)》(JGGS)精选论文

○ Xiang LI et al. | 《测绘学 (英文版)》(JGGS)精选论文

《Satellite Navigation》

徐元博士:面向有色测量噪声下UWB/INS组合行人导航的分布式卡尔曼滤波| SANA佳文速递

○ 杨飞博士:GNSS天顶对流层精化模型的构建与分析| SANA佳文速递

○ 姚铮教授:北斗PPP服务信号调制复用方案设计与质量评估| SANA佳文速递

○ 2022征文| SatNav“普适定位、室内导航与基于位置服务”专题

《自然资源遥感》

《自然资源遥感》入驻“智绘科服”融媒体平台!

《自然资源遥感》征稿:“海岸带空间资源及生态健康遥感监测”专栏

摘要 |《自然资源遥感》2021年第3期摘要推荐

摘要 |《自然资源遥感》2021年第4期摘要推荐

Journal of Geovisualization and Spatial Analysis

○《Journal of Geovisualization and Spatial Analysis》入驻“智绘科服”融媒体平台!

○ JGSA国际期刊2021年第5卷第2期论文摘要

○ 高被引论文推荐 | Journal of Geovisualization and Spatial Analysis

声明:本站部分文章内容及图片转载于互联 、内容不代表本站观点,如有内容涉及侵权,请您立即联系本站处理,非常感谢!

(0)
上一篇 2022年3月8日
下一篇 2022年3月8日

相关推荐