关键词:
城市功能区分类
深度学习
堆叠集成模型
多源数据融合
摘要:
城市功能区的自动分类对城市规划和治理至关重要。目前的方法主要依赖于单一的遥感影像数据或社会感知数据。然而,基于遥感影像的方法具有捕获活动特征不足的缺点,而社会感知数据中很少包含形态特征。为了克服这些不足,有必要结合多源数据来感知城市功能。在此背景下,本研究提出了一种结合矢量建筑物和兴趣点(points-of-interest,POI)数据进行城市功能区分类的方法。主要工作如下:(1)基于建筑物的街区形态特征提取。本研究构建了一个改进的图卷积神经网络(graph convolutional neural network,GCNN),从每个街区内的建筑物中提取形态特征。为每个街区内的建筑物构建图结构,其中每个建筑物的中心点作为图节点,根据建筑物之间的邻接关系构建图的边,并提取建筑物相关的特征作为节点特征,用于描述图;接下来,将建筑物图结构输入图卷积神经网络,经过卷积层和池化层提取隐含特征;进一步通过全连接层建立隐含特征与城市功能区类型之间的关系;并采用监督学习的方法训练GCNN,训练完成后,将街区内建筑物的图结构输入GCNN,将得到的隐含特征作为街区的形态特征。(2)基于POIs的街区活动特征提取。本研究借助词向量(Word2Vec,W2V)模型从POIs数据中挖掘街区活动特征。首先,借助模仿自然语言中的文本语料库,将所有街区内的POIs构建了block-POI语料库;接下来,借助W2V模型分析block-POI语料库,挖掘每一类POIs的代表向量;最后,通过将街区内所有POIs的代表向量求平均,从而提取街区的活动特征。(3)堆叠集成分类。本研究在此获得街区的形态和活动特征的基础上,设计了一个堆叠集成(stacking ensemble,SE)分类模型,将形态特征和活动特征结合起来,对每个街区的功能进行分类。SE模型将形态特征和活动特征作为基分类器的输入,将基分类器的预测结果作为元分类器的输入,通过元分类器进行最终的城市功能区分类。将本文方法在中国深圳南山区进行了训练和测试,取得了86.83%的分类准确度为,比基于单一数据源的对比方法高12.2%–16.1%。训练后的模型应用于光明区和福田区两个区,分别取得了85.32%和68.37%的分类准确度,分别比基于单一数据源的方法高3.68%~7.79%和3.69%~8.94%。此外,与现有的多源数据集成方法在三个研究区域分类结果相比,本文方法的分类准确度高出2.41%–9.76%。这些结果表明,本文提出的集成方法可以有效地整合来自不同数据源的特征,并为城市功能区域的分类提供一种可供选择的、更准确的解决方案。