地理知识图谱下的建筑群空间分布模式推理
Reasoning of Spatial Distribution Pattern of Building Cluster based on Geographic Knowledge Graph
通讯作者:
收稿日期: 2022-10-8 修回日期: 2022-12-7
| 基金资助: |
|
Corresponding authors:
Received: 2022-10-8 Revised: 2022-12-7
| Fund supported: |
|
作者简介 About authors
唐曾杨(1997— ),男,湖北恩施人,硕士,主要从事地理知识图谱,地图综合研究。E-mail:
以图结构表达的知识图谱不仅在语义网络的描述与推理中发挥着重要作用,对于空间实体的结构化抽象与空间推理也具有重要意义。空间实体的联系信息在知识图谱中以图的边记录,通过路径探测、子图对齐、模式发现等基于边的知识图谱计算推理,在空间场景认知可发挥重要作用。地理知识图谱是一种对地理概念、实体及其相互关系进行形式化描述的知识系统,既有通用知识的内涵与特点,也有地理知识特定的时空特征,能够将语义模型和时空模型联系起来,描述语义关系、空间关系和时间关系,在地理知识的表达、理解、获取与推理方面有巨大的应用潜力。现有地理知识图谱的研究工作多集中于语义方面,语义关系的抽取与表达比较丰富,可以支持进一步的地理知识语义搜索等功能;然而地理知识图谱在时空模型上的知识表达比较缺乏,现有的空间关系局限在要素之间,很少涉及空间认知中进一步的分布态势、空间格局等,地理知识图谱在空间语义知识方面有待增强。本文基于知识图谱构建原理,以建筑群地理知识图谱构建为例,实现格网型建筑物模式的识别。先将建筑物抽象成实体,表达为图的节点,基于几何邻近分析提取建筑物之间的空间邻域关系,以此构建建筑群地理知识图谱;在此基础上结合建筑物模式识别的领域知识,进一步推理构建其他的空间语义关系,完善地理知识图谱;再将建筑群场景的格网模式表达为知识图谱的规则,在知识图谱上基于NoSQL语言进行推理。结果表明,本文方法能有效提取建筑物格网模式,验证了地理知识图谱在空间推理上的作用和在领域问题研究中的良好适应性,为地理知识图谱在空间认知领域的应用提供了思路。
关键词:
The graph structure-based knowledge graph plays important roles not only in the description and reasoning of semantic network, but also in the structured abstraction and spatial reasoning of spatial entities. The relational information of spatial entities is recorded in edges in the knowledge graph. Through the edge-based knowledge graph computational reasoning such as path detection, sub graph alignment, pattern discovery, etc., it can play an important role in spatial scene cognition. Geographic knowledge graph is a knowledge system that formally describes geographic concepts, entities, and their interrelationships. It has both the connotation and characteristics of general knowledge and the specific spatiotemporal characteristics of geographic knowledge. It can connect semantic models with spatiotemporal models to describe semantic relations, spatial relations, and temporal relations, and has great application potential in the expression, understanding, acquisition, and reasoning of geographic knowledge. The existing research work of geographic knowledge graph is mostly focused on semantics, and the extraction and expression of semantic relations are very rich and comprehensive, which can support further functions such as semantic search and association analysis of geographic knowledge. However, the knowledge expression of geographic knowledge graph in spatiotemporal model is relatively lacking, and the existing spatial relationship is limited between elements, rarely involving the further distribution situation and spatial pattern in spatial cognition. Thus, the geographic knowledge graph needs to be strengthened in terms of spatial semantic knowledge. Based on the principle of knowledge graph construction, this paper takes the construction of geographic knowledge graph of buildings as an example to realize the grid-pattern recognition of buildings. Firstly, the buildings are abstracted into entities and expressed as nodes of the graph, and the spatial neighborhood relations between buildings is extracted based on geometric proximity analysis, so as to build the geographic knowledge graph of the building group. On this basis, combined with the domain knowledge of building pattern recognition, it further infers and constructs other spatial semantic relations, and improves the geographic knowledge graph. Then the grid-pattern of the buildings complex scene is expressed as the rules of the knowledge graph, which is based on NoSQL language for reasoning. The results show that this method can effectively extract the linear pattern of buildings and further deduce the grid-pattern, which demonstrates the important role of geographic knowledge graph in spatial reasoning and its good adaptability in domain problem research, and provides ideas for the application of geographic knowledge graph in the field of spatial cognition.
Keywords:
本文引用格式
唐曾杨, 艾廷华, 徐海江.
TANG Zengyang, AI Tinghua, XU Haijiang.
1 引言
基于图结构存储表达的知识图谱在语义网络[1]的描述与推理方面获得了广泛发展,显著提升了智能问答、信息推送、自然语言处理等AI应用领域的智能化水平。语义概念、规则及知识的推理在图结构下可充分估计多因素的上下文影响,为不确定性知识的衍生提供了支持。问答系统中传统的形式语义、框架语义等语义表达形式存在描述不全面、难以消除歧义等局限[2];常规推荐系统一直面临着交互数据稀疏等问题,导致推荐结果不准确[3]。知识图谱的基本组成单位是三元组:<实体,关系,实体>或<实体,属性,属性值>,其本质是具有属性的实体之间通过关系连接而形成的一个语义信息图数据库。知识图谱本体化的知识表示方法将概念与属性抽象出来并建立本体,语义与本体核心紧密相关,形式化、结构化地表达概念与关系,通过概念、关系的组合进而表示大量的复杂知识,同时以其精确性和共享性确保消除歧义[4-5],这些特征在知识图谱的领域应用中发挥着重要赋能作用。
知识图谱对于空间实体的结构化抽象与空间推理也具有重要意义,空间实体、联系可看作是与定位有关的特殊语义网络表达,实体概念具有显式的定位性和空间关联,通过图谱的路径探测、子图对齐、模式发现实现基于知识图谱的空间推理。人类活动产生的信息数据绝大部分与地理空间位置有关[6],而地理空间的表达通常是基于形象化符号的地图,空间格局与结构关系依比例缩小可视化,能够真实模拟实景特征。然而针对空间推理思维,往往是基于抽象的结构体系,通过概括实体主要特征、归纳实体间重要联系,进而演绎出派生信息。常规的具象化地图表达,对于空间推理并不是最好的表达,需要作抽象概括的预处理。受语义网络知识图谱表达的启示,如果把空间表达中的地理实体单元抽象成节点、实体联系抽象成边,基于图的数据结构用知识图谱描述空间场景,则会有利于知识表达与空间推理。
地理知识的时空特征与知识图谱结合即形成地理知识图谱,地理知识图谱是一种对地理概念、实体及其相互关系进行形式化描述的知识系统[7],是集地理概念、语义关系、人地交互信息于一体的知识表达,以描述地理过程变化为核心,目标是解决人地关系。在地理知识图谱中可表达多样化的关系,现实物理空间中的空间关系、语言空间中的语义关系、时间演化形成的过程与时态关系等都可以在地理知识图谱中表达。如表1所示,一方面地理场景被空间化,实体间的关系可以涉及方位、拓扑、时态等空间时间维度;另一方面,大量语义信息同空间位置关联起来,实体间的关系也可以表示语义信息:功能关系如地铁线路间的换乘、管理关系如总部与分部、依附关系如水电站与河流。随着语义网络技术的发展,GeoNames Ontology、Linked Geo Data等地理语义网络已经逐渐出现,拥有大量的地理实体和丰富的空间关系,能提供系统、全面、深层次的结构化地理信息。当前,地理知识图谱在构建上已有较多工作。在知识抽取方面,一些地理实体与实体关系从语义网络中被抽取出来,如张春菊等[8]利用网络爬虫与地名识别技术解析网页文本,进而获取地理命名实体的文本集合,Blessing[9]和 Loglisci[10]分别抽取建立了河流与水系的汇入关系和地理实体之间的拓扑、方位关系。同时结合地图、影像等基础地理空间数据,蒋秉川等[11]提出了基于多源异构地理信息数据的地理知识构建技术体系,刘俊楠等[12]在地理知识图谱中将地理实体与百科信息链接,覆盖率较高,扩充了地理实体的概念描述信息。在知识表示方面,张雪英等[13]提出了包含“地理概念-地理实体-地理关系”3个层次的地理知识表达模型,可以用于描述不同粒度地理知识语义单元的基本组成及其逻辑关系。在关系推理方面,现有地理知识图谱的相关工作较少,段鹏飞[14] 构建了基于空间投影和关系路径的地理知识图谱表示学习算法,用于推理知识图谱中的关系,但其推理预测的可解释性较差。综上所述,在语义上,现有地理知识图谱对语义关系的抽取、表达比较丰富,可以支持进一步的语义搜索、关联分析等;与语义相比,地理知识图谱在空间上的抽取、表达较弱,如现有的拓扑关系、方位关系均为要素与要素之间的空间关系,很少涉及到空间模型中进一步的分布态势、空间格局等,在空间语义方面有待增强。若结合GIS界的主要研究视角,关注基础地理信息数据的空间位置、场所及其可量测特征,在图谱之上聚焦空间关系加以推理进一步的空间特征,便可增强地理实体在空间知识方面的语义表达。
表1 空间关系与语义关系
Tab. 1
| 地理知识图谱中的关系分类 | 关系示例 |
|---|---|
| 空间关系 | Intersects,Disjoint,Contains,Within,……, over-,up-,in-,out-,…… |
| 语义关系 | 河流的汇入关系,资产的权属关系, 管理结构的层级关系,人的社会关系,…… |
本着以上动机,本研究以地理实体为节点,以基本邻近关系和其他语义关系为边构建图结构,得到空间位置相关的地理知识图谱,强调空间实体的承载作用,描述空间事物或现象的分布、属性、状态以及空间事件与空间行为,进而表达空间事物或现象的时态演化和相互作用规律。地理知识图谱一方面可以将人工智能领域在知识图谱推理中的最新模型方法引入,基于知识图谱发展空间推理方法,为解决GIS领域这一长期存在的瓶颈做出贡献。另一方面知识图谱的抽象化表达也为空间表达提供了一种新的范式,自然语言、地图语言长期以来作为地理空间表达的第一、第二语言,知识图谱可望成为一种全新的表达语言,在地理知识表达与空间推理上为GIS研究开辟新的途径。伴随着地理信息服务向地理知识服务转型升级的趋势[15],地理知识图谱逐步成为地理信息科学领域中的研究重点。如何利用地理知识图谱探测地理实体间的空间关系与语义关系, 实现地理知识的快速获取、推理、融合,是地理信息科学的重要任务。
本研究在地理知识图谱上,本着可操作性目标,以建筑物格网模式识别为案例,在neo4j支持下构建建筑群地理知识图谱,结合建筑物模式识别的领域知识,通过cypher语言实现建筑物模式推理规则,试图验证地理知识图谱在空间推理上的作用和在领域问题研究中的良好适应性,为地理知识图谱在空间认知、空间推理领域的应用提供了思路。
2 面向建筑物格网模式的地理知识图谱表达方法
在不同的应用领域,可以依据领域知识构建相应的知识图谱。在以抽象化结构体系为基础的空间推理上,地理知识图谱有着巨大优势,其应用领域包括但不限于位置邻域内的搜索、自然语言词汇中的空间查询、大气洋流等空间现象的时空演化规律[16]等。在特定领域建立起个体知识图谱,多个个体知识图谱共同建立起群体知识图谱[17]。通过知识图谱更新知识的核心过程——“知识推理-知识融合-知识反馈”,将不同知识源的知识进行整合[18],消除歧义,即可得到大规模高质量的知识图谱。在建筑物模式识别领域内,如图1所示,本文以建筑物认知的主要视觉变量为基础,结合约束Delaunay三角网的空间结构,实现实体、属性与空间邻近关系的抽取,组成地理知识图谱的最基础框架,完成建筑群的抽象化、知识化表达。然后将建筑物模式规则转化为知识图谱的推理规则,从而识别建筑物中基础的直线模式,并进一步推理识别格网模式。
图1
图1
面向建筑物格网模式的地理知识图谱体系
Fig. 1
Geographic knowledge graph system for building grid pattern
(1)直线模式
直线型的建筑物模式定义为一组邻近且形状相似的建筑物在一条直线上排列。单个建筑物实体在直线模式中最多只能有2个邻近对象,在直线模式中保持其特征的最小基元则为处于同一直线上的具有邻近关系的三点——三元直线模式。
给定3个建筑物实体A、B、C,邻接边分别为
式中:
(2)格网模式
格网型建筑物模式在城市建筑场景里常见且易于识别,其中建筑物在空间分布上较为规则。从特征来看,格网模式可视作多组平行的直线模式,相邻直线模式之间大部分建筑物成员有邻近关系。从单体建筑来看,格网模式中的建筑物之间均有相似性。给定2组直线模式,格网模式定义见式(2)。
式中:
2.1 格网型建筑物模式研究
建筑物模式识别的现有研究多使用聚类,且聚类指标通常结合多方面的几何度量。学者们定义了多样化的指标与约束条件,如基于Voronoi图分割的局部密度指标[19];综合讨论位置、大小、方向的视觉距离指标[20];基于城市形态学的道路、河流全局约束[21]等。尽管指标与约束条件多样化,但相互之间鲜有关系,没有定义基本的指标本体与进一步的关系类型,不同指标之间难以组合。在聚类方法上,三角网、最小生成树等几何结构由于在空间位置上的表达适应性强而应用广泛[22],然而并未构建多样的关系类型,缺乏基于关系的规则推理,导致模式规则没有形式化结构化的表达。SOM[23]、深度学习[24]等智能算法也应用于建筑物模式识别并取得初步进展,但该类方法需要大量的先验知识,且难以理解其知识聚合的逻辑过程,使得此类方法应用有限。
综上所述,现有的建筑物模式研究存在的问题:① 在聚类指标与约束上,没有定义基本的指标本体与关系类型,各个复杂指标之间缺乏一套联系机制;② 聚类方法上,模式规则没有形式化结构化的表达。孤立的个别指标在聚类方面已到达瓶颈,若不建立一套系统将各个指标和约束条件统一起来,并采用系统化、结构化的规则形式,那么传统方法将难以突破。
模式作为各个实体之间相互联系共同体现出来的形态特征,其必定由不同的基础实体之间的联系组合而成。尽管建筑物模式聚类所用的方法多种多样,但多数方法均可用节点和边组成的图结构来描述。图结构让知识图谱的构建有良好的可分解性[25]。先将图结构“分解”定义为基本类型的节点与关系,然后在此基础上运用规则对关系进行“组合”实现推理运算,即可获得新的知识。因此,将知识图谱引入建筑物模式识别问题中,在抽象的建筑群图结构上,应用边的路径扩展,基于知识图谱的推理运算进行空间模式识别,就能快速挖掘建筑物模式,弥补传统建筑物模式识别方法上的不足。同样重要的是,地理知识图谱理论上能将各种图结构聚类方法统一起来,不同的图结构聚类方法均能在其中得到分解表达,从而形成更完整的知识图谱,充分发挥知识图谱的知识融合能力。
2.2 格网型建筑物模式的地理知识图谱表达
在建筑物模式识别领域中,格式塔认知理论强调简洁、完备、联想、视知觉、部分与整体、抽象等认知过程[26],是一套完备的心理认知学理论,从心理认知上为建筑物模式分析提供了理论基础。在建筑物的特征描述方面,Bertin[27]提出的视觉变量能较为完备地描述建筑物要素的视觉特征,其中的位置、尺寸、形状、方向在建筑物模式分析中成为主要认知变量。在空间关系上,Delaunay三角网作为广泛应用的几何结构,能够构建起建筑物之间的空间邻近关系。在知识图谱推理中,可以将格式塔原则、视觉变量、Delaunay三角网视为领域专业化规则知识,领域知识与图结构的推理框架做结合,体现了地理知识图谱在领域研究问题中良好的适应性。
记建筑群的知识图谱为G=(E,R),其中E={
表2 知识图谱中的表达要素
Tab. 2
| 类型 | 要素 | 属性/描述 |
|---|---|---|
| 实体 | 建筑物(single) | 形状、面积、方向等 |
| 标签 | 直线模式(linearPattern) | lineList:建筑物ID列表 relaList:关系ID列表 |
| 格网模式(gridPattern) | ||
| 关系 | 邻近关系(nextTo) | 两建筑物邻近 |
| 相似关系(similarTo) | 两建筑物相似 | |
| 协同格网关系(gridWith) | 两直线模式协同构成格网模式 |
(1)邻近关系:如图2所示,以建筑群地理数据为基础构建约束Delaunay三角网,将单体建筑物抽象成实体,提取建筑物之间的邻近关系。建筑物
图2
图2
建筑群地理知识图谱的构建过程
Fig. 2
The construction process of geographic knowledge graph of building cluster
(2)相似关系:相似的定义为2个建筑物在形状、面积、方向上均有相似性,相关参数定义见 表3。当建筑物实体
表3 相似关系定义
Tab. 3
| 参量 | 指标描述 | 计算方式 |
|---|---|---|
| 建筑物的延展度接近程度 | 两建筑物延展度差值的绝对值,延展度:最小外接矩形的长宽比 | |
| 建筑物的大小接近程度 | 两建筑物中较大面积值除以较小面积值 | |
| 建筑物的最小外接矩形长边方向(Smallest bounding rectangle orientation)之间的接近程度 | 两建筑物最小外接矩形长边方向的差值 |
式中:
(3)协同格网关系:直线模式
2.3 建筑物模式的推理识别
建筑物模式识别的规则推理需要快速高效的查询作保证,本次实验采用neo4j作为知识图谱的数据库,基于其提供的cypher查询语言,结合建筑物模式识别规则进行推理识别,表4对推理规则中的要素进行了定义。
表4 直线模式和格网模式的推理规则要素
Tab. 4
| 推理规则要素 | 描述 |
|---|---|
| shapeSimi(x,y) | x,y形状相似 |
| areaSimi(x,y) | x,y大小相似 |
| directionSimi_B(x,y) | x,y建筑物方向相似 |
| similar(x,y) | x,y相似 |
| near(x,y) | x,y邻近 |
| interval(x,y,z) | x,y,z近似等距分布 |
| sameLine(x,y,z) | x,y,z在一条直线上 |
| tmpThree(x,y,z) | x,y,z组成三元直线模式 |
| linerPattern(A) | A中元素构成直线模式 |
| directionSimi_Lp(A,B) | A,B直线方向相似 |
| close(A,B) | A,B中大部分元素具有邻近关系 |
| gridPattern(A,B) | A,B协同形成格网模式 |
(1)直线模式的推理规则
图3
图3
直线模式识别过程的知识图谱表达示意图
Fig. 3
The schematic diagram of knowledge graph expression in linear pattern recognition process
① shapeSimi(a,b)∧areaSimi (a,b)∧directionSimi_B(a,b) ⇒ similar(a,b);
similar(a,b)∧similar(b,c)∧near(a,b)∧near(b,c)∧interval(a,b,c)∧sameLine (a,b,c)
⇒ tmpThree (a,b,c);
② tmpThree (a,b,c)∧tmpThree (b,c,d) ⇒ linerPattern(A), a,b,c,d∈A;
(2)格网模式的推理规则
linerPattern(A)∧linerPattern(B)∧directionSimi_B(A,B)∧directionSimi_Lp(A,B)∧close(A,B) ⇒ gridPattern(A,B)
图4
图4
格网模式识别过程的知识图谱表达示意图
Fig. 4
The schematic diagram of knowledge graph expression in grid pattern recognition process
3 实验与分析
3.1 实验数据
图5
图6
图6
建筑物的形态大小特征统计
Fig. 6
Statistics of shape and size characteristics of buildings
实验以OSM的建筑群数据为基础,在适当数据预处理之后,将建筑物抽象为地理实体节点,并计算、抽取建筑物的大小、方向等属性数据,然后基于约束Delaunay三角网构建空间邻接关系。在此基础上,开始进行相似性、三元直线排列的空间推理,丰富知识图谱,并进一步完成直线模式、格网模式的推理识别。
3.2 实验结果
图7
图8
格网模式的识别建立在直线模式识别成功的基础之上,2种模式的相关阈值由各自模式特征决定;而在同一模式下,区域的不同会有细微差别,相关阈值需要进行微调。具体阈值参数对结果的影响将在此节后面详细讨论。视觉认知十分依赖人类的主观性,本文通过与人眼视觉识别结果进行对比验证本文方法识别结果的可靠性,人眼视觉识别结果为4名地图学专业硕(博)士生的人工视觉识别结果,记为
表5 模式识别结果统计
Tab. 5
| 模式 | |||||||
|---|---|---|---|---|---|---|---|
| linearPattern | 456 | 446 | 398 | 48 | 58 | 89.2% | 87.3% |
| gridPattern | 180 | 172 | 148 | 24 | 32 | 86.0% | 82.2% |
为验证本研究方法模式识别结果的合理性,将本文方法与文献[28]中综合多个算法的识别方法进行比较。在直线模式的提取上,现有方法因最小支撑树MST的单连通性,剪枝时会导致少部分直线信息丢失,导致在直线模式向格网模式的进一步推理识别上,现有方法的识别结果会偏少,不能令人满意。同时,在进行特定建筑物模式识别时,MST难以通过树各条边的权重大小按顺序剪枝得到,难以针对特定的模式形态进行识别。而本文方法在能较好识别直线模式的基础上,亦能进一步得到良好的格网模式识别结果。
3.3 实验参数讨论
本文中建筑物模式识别规则参考格式塔原则,视觉变量涉及位置、形状、尺寸、方向,不同的参量其阈值变化对识别结果的影响不同:
(1)相似关系
图9
图9
修改不同参数后的识别结果
Fig. 9
Recognition results after modifying different parameters
(2)直线排列空间模式
(3)格网排列空间模式
在直线模式识别较好的情况下,格网模式在建筑物方向和直线模式方向上其
3.4 其他建筑物模式
在地理知识图谱中识别出基础的直线型、格网型模式后,可延伸到更加复杂一些的“复合”建筑物模式,如“C”字型、“工”字型的建筑物模式。此类模式相较基础的直线型、格网型模式更不规则(图10),适宜通过典型模板构建相应的子图,然后将子图匹配分解为节点匹配与边匹配,进而在图谱中进行匹配识别,通过计算识别结果与模板的相似度检验识别的准确率。今后将会就此进行进一步的开展。
图10
4 结论与展望
本文针对空间推理思维,论述了知识图谱在图结构聚类中的可行性。受语义网络知识图谱表达的启示,将空间实体单元抽象成节点、实体联系抽象成边,基于图的数据结构用知识图谱描述空间场景,构建地理知识图谱。并引入约束Delaunay三角网等领域知识,构建了建筑群场景下的地理知识图谱,基于空间关系推理实现了格网型模式的建筑物识别案例。实验证明,本文方法能够有效识别建筑物群中的格网模式,识别准确率达到了86.0%,与人工识别结果对比后,召回准确率达到82.2%,符合视觉认知,证明了知识图谱在领域专业化问题中的良好适应性。本文方法中直线模式识别结果受建筑物之间相似性的影响较大,而格网模式识别结果受直线模式之间邻近性的影响较大。本文方法中相似性暂只考虑了形状、面积与方向三个特征的相似,若增加其它特征或者采用其他指标来度量形状、方向等特征,则识别结果可能发生变化,需要重新调整参数。
面对信息数据爆炸式的增长,如何从中海量信息中归纳概括出知识是研究重点。地理知识图谱不仅拥有以概念、实体以及相互关系来抽象化表达、形式化描述知识的系统,更兼具地理上的地学特征与时空特征,让地理学知识在表达、获取及管理上建立了一套完整的联系机制,可成为地理空间的一种全新表达语言。利用知识图谱的抽象化表达系统,不仅能让地理学知识转换成可被计算机识别和处理的内容,使得机器也能学习这些知识,让地理学知识在人工智能领域的研究更进一步;同时也能充分发挥通过空间推理获取知识的巨大优势,加速“知识推理-知识融合-知识反馈”的更新过程,形成大规模、高质量的地理知识图谱,为人们能快速获取、推理与应用地理知识提供重要基础,这也是地理信息服务向地理问答系统等地理知识服务转型升级的关键。
在知识图谱的推理方法中,除了本文使用的基于规则的推理方法外,还有基于图结构的推理方法、基于表示学习的推理方法和基于神经网络的推理方法等。面对如今“数据海量”的背景,上述推理方法在地理知识图谱中都有着巨大的研究空间,地理实体在空间知识方面的语义增强仍需要人们的探索。
参考文献
Retrieval time from semantic memory
[J].
新技术驱动的自然语言处理进展
[J].
Advances in natural language processing under new technology-driven
[J].
基于知识图谱的推荐系统研究综述
[J].
A survey on knowledge graph-based recommender systems
[J].
知识图谱研究进展
[J].
The research advances of knowledge graph
[J].
知识图谱构建技术综述
[J].
Knowledge graph construction techniques
[J].
How much information is geospatially referenced? Networks and cognition
[J].
论地理知识图谱
[J].
DOI:10.3724/SP.J.1047.2017.00723
[本文引用: 1]
网络文本蕴含大量隐式地理空间信息,为地理知识获取与知识服务提供了巨大潜能。地理知识图谱是将传统地理信息服务拓展到地理知识服务的关键,也是网络文本蕴含地理信息采集与处理的终极目标。本文系统评述了开放地理语义网、开放地理实体及关系抽取、地理语义网对齐、知识图谱存储方法等地理知识图谱相关主题的研究进展,从网络文本蕴含地理空间信息量与质量评价、地理信息语义理解、空间语义计算模型和异构地理语义网对齐等方面剖析了目前亟需解决的关键科学问题。
On geographic knowledge graph
[J].
基于网络爬虫的地名数据库维护方法
[J].
DOI:10.3724/SP.J.1047.2011.00492
[本文引用: 1]
目前,我国地名数据库建设存在大、中颗粒度地名集中,小颗粒度地名较为缺乏,地名资料陈旧、时效性较低,简称、别名等非标准地名信息和地名的相对位置信息缺失等问题。而地名数据库的更新维护工作主要通过人工测绘手段完成,存在周期长、成本高、效率低等缺点。针对这一问题,本文以现有地名数据库和空间关系词汇为基础,基于Google搜索引擎服务,提出一种以网页资源为数据源,利用网络爬虫技术和地名识别技术,进行地名数据库更新维护的方法。首先,设计以地名为主题的网络爬虫,实现非结构化的网页数据中海量空间敏感网页文本的主动获取;然后,采用HTML DOM技术解析空间敏感网页并应用CRF地名识别模型自动识别网页文本中地名;最后,设计相关算法进行网页文本中地名信息的自动解析,实现新地名和地名空间位置信息的获取,进行地名数据库的更新维护。以"南京师范大学仙林宾馆+西北"为空间检索实例,验证了此方法的可行性。
Method of toponym database updating based on web crawler
[J].
Fine-grained geographical relation extraction from Wikipedia
[C].
Toward geographic information harvesting: Extraction of spatial relational facts from web documents
[C]//
多源异构数据的大规模地理知识图谱构建
[J].
Geographic knowledge graph building extracted from multi-sourced heterogeneous data
[J].
面向多源地理空间数据的知识图谱构建
[J].
DOI:10.12082/dqxxkx.2020.190565
[本文引用: 1]
知识图谱广泛应用于人工智能领域,基于此融合多源地理空间数据并表示地理事物的语义和时空信息,实现“数据—知识”的转换成为人们关注的热点。但现有通用知识图谱的空间知识覆盖度低且存在错误,同时基于维基百科构建的地理知识图谱存在空间关系、中文属性和坐标信息等属性缺失问题。因此本文以地理空间数据和百度百科数据的特征分析为基础,提出了以地理空间数据提取地理实体为主,百度百科补充属性信息为辅的知识图谱构建方式。① 基于GeoSparql设计模式层的地理实体、要素、几何形状和空间关系的逻辑关系;② 通过地理实体提取、实体链接和属性信息填充,在数据层实现空间知识融合;③ 结合关系型数据库和图数据库,设计空间知识存储方式;④ 在实体和关系2个方面定量分析知识图谱的构建规模。结果表明,本文构建的知识图谱中地理实体覆盖度和链接百科成功率相对较高,扩充了地理实体的概念描述信息,并将地理坐标的覆盖率提高到100%,对地理数据到地理知识的拓展具有重要意义。
The construction of knowledge graph towards multi-source geospatial data
[J].
顾及时空特征的地理知识图谱构建方法
[J].
Spatiotemporal features based geographical knowledge graph construction
[J].
基于空间投影和关系路径的地理知识图谱表示学习
[J].近年来,类人智能技术和相关产品飞速发展,这在很大程度上得益于完备知识图谱的构建,特别是以地理为代表的基础教育知识图谱。传统的知识图谱采用网络知识组织形式进行表示,计算复杂度较高,而且三元组的知识表示形式不能有效地度量和利用实体间语义关联关系。该文构建了基于空间投影和关系路径的知识表示学习算法—PTransW(Path-based TransE and Considering Relation Type by Weight)模型,该模型结合空间投影和关系路径来对翻译模型进行扩展,并加入关系类型的语义信息进行改进。最后,在FB15K数据集和GEOGRAPHY数据集上训练并做链接预测实验。实验结果表明,PTransW模型对复杂关系的建模能力取得了较大地提升;对于规模较小的数据集,复杂度低的TransE和TransR模型将会训练得更充分;但是PTransE和PTransW模型由于利用了关系路径和反向关系中的语义信息,在关系预测方面有很大的优势。
Space projection and relation path based representation learning for construction of geography knowledge graph
[J].Humanoid intelligence has developed rapidly and it benefits from the complete knowledge graph especially elementary education knowledge graph represented by geography. The traditional knowledge graph is represented by network leading to high computation complexity. This paper puts forward a new algorithm named PTransW (Path-based TransE and Considering Relation Type by Weight). It combines the space projection with the semantic information of relation path, taking advantage of the semantic information of relation type for further improvement. The experiment results on the FB15K and GEOGRAPHY data sets show that the ability of dealing with complex relation in knowledge graph is improved significantly by PTransW model.
基础地理知识服务的基本问题与研究方向
[J].
Basic issues and research agenda of geospatial knowledge service
[J].
Evidence for a collective intelligence factor in the performance of human groups
[J].Psychologists have repeatedly shown that a single statistical factor--often called "general intelligence"--emerges from the correlations among people's performance on a wide variety of cognitive tasks. But no one has systematically examined whether a similar kind of "collective intelligence" exists for groups of people. In two studies with 699 people, working in groups of two to five, we find converging evidence of a general collective intelligence factor that explains a group's performance on a wide variety of tasks. This "c factor" is not strongly correlated with the average or maximum individual intelligence of group members but is correlated with the average social sensitivity of group members, the equality in distribution of conversational turn-taking, and the proportion of females in the group.
A constructive model for collective intelligence
[J].Natural phenomena of collective intelligence (CI) occurring in physical space show a potential approach to effective large-scale human collaboration in cyberspace. Based on existing explanatory understanding of CI, this perspective proposes a constructive model for building artificial CI systems, i.e., problem-oriented CI phenomena with AI-powered information integration and feedback.© The Author(s) 2020. Published by Oxford University Press on behalf of China Science Publishing & Media Ltd.
时空大数据时代的地理知识工程展望
[J].
Prospect of geo-knowledge engineering in the era of spatio-temporal big data
[J].
Analysis of settlement structures by graph-based clustering
[J].
基于格式塔识别原则挖掘空间分布模式
[J].
Polygon cluster pattern mining based on gestalt principles
[J].
Automated building generalization based on urban morphology and Gestalt theory
[J].
Proximity-based grouping of buildings in urban blocks: A comparison of four algorithms
[J].
一种建筑物群智能聚类法
[J].
Intelligent building grouping using a self-organizing map
[J].
图卷积网络模型识别道路正交网格模式
[J].
Grid pattern recognition in road networks based on graph convolution network model
[J].
基于互联网群体智能的知识图谱构造方法
[J].
Knowledge graph construction method via Internet-based collective intelligence
[J].
Building pattern recognition in topographic data: Examples on collinear and curvilinear alignments
[J].
/
| 〈 |
|
〉 |

