本文研究了利用基于矢量的编码方案。首先,增强了预处理方法,并结合基于特征的编码方案评估CNN、RNN、GCNN的性能。结果表明,特征描述符提高了三种神经网络的准确率。
●提出一种利用形状描述和表示技术的顶点特征描述工作流,该工作流适用于CNN、RNN、GraphCNN和几何类型(polyline和polygon)
●研究编码特性(如编码方案、规范化、规律性和特征描述)对分类模型结果的影响
点的顺序对于直线和多边形的矢量数据表示至关重要,目前对polyline和polygon嵌入的研究可分为有序序列和图结构两种。有序序列将几何图形编码为顶点位置的有序列表,可以将其输入序列模型,如RNN和一维CNN。另一种:图网络。
用各自神经网络的第一层编码具有十个顶点和每个顶点五个特征的多边形的示例性方法。左: LSTM-RNN 中:1D-CNN右:图
3.1几何编码
我们提出了一种使用顶点特征描述对多边形和折线进行编码的方法,我们通过满足以下要求来增强编码过程,使其能够在自动地图概化中得到最好的利用:
●编码过程可逆,并且编码有关地图对象的空间信息,例如以坐标的形式
●预处理期间的几何操作被最小化
●预处理不进行任何矢量-栅格变换
图2给出了编码工作流程的各个步骤,使用供选择的方法的编码工作流程的步骤和产生的编码序列。一些不是原创,本文的新颖贡献用红色标出。
3.1.1
深度学习模型需要一个有规律的结构化和规范化的输入来以最好的方式执行。为了确保所有输入具有相同数量的输入特征:
(1)使用填充方法:识别具有最多点数的几何形状,并对所有其他几何形状加零,直到它们达到相同的大小。但添加大量零通常会对神经网络的性能产生负面影响。
(2)使用插值方法进行预处理:首先执行Douglas-Peucker算法对原始数据进行简化,然后使用等间距插值,得到具有预定义顶点数量和顶点之间距离相同的几何形状。这损害了我们对地图泛化效用的第二个要求——在预处理过程中最大限度地减少几何操作。
(3)我们引入了一种替代方法,通过迭代地将当前最长的边缘与额外的顶点分开,直到目标到达顶点的数量,从而保持几何的原始形状 (见图3)。缺点是这种方法不能保证表示的内部规律性,因为顶点之间的距离可能相差很大。因为这些方法之间没有最优解,所以我们将在实验中对它们进行测试。
(结果:(1)最不好,(2)略好于(3))
图3。有16个点的几何体。a)8点的原始形状。b)顶点之间距离相等的插值方法,操纵几何形状并产生橙色形状。c)迭代划分最长边的方法,直到达到目标顶点数。顶点之间的距离可以不同;下一个顶点将被放置在橙色标记的位置,因为这是当前最长的边。
3.1.2 坐标归一化
之前研究为基于对象的规范化:对于每个点向量归一化计算为:其中p为几何质心,s为比例因子,可以基于z-score方法或所有对象边界框的标准差。 而我们提出了一种替代方法,即引入基于地图的规范化。与基于对象的方法相比,主要区别在于公式中使用的质心p与整个地图区域相关。不知道效果怎样,实验测试。
a)基于对象和b)基于映射的规范化。
3.1.3. 编码几何图形的特征提取
表示几何图形最直接的方法是使用其外部顶点坐标。缺点是这种编码只能描述简单的多边形。Veer(2018)也使用这些点坐标,但与标记顶点[1 0 0],子几何[0 1 0]或整个几何[0 01]的端点的单热向量结合使用。该方法还可以对带孔的复杂多边形和多多边形进行编码,并可应用于折线。然而,仅使用点坐标来表示顶点,缺乏形状边界所能提供的丰富的认知信息。因此,可以使用描述1局部、2区域和3全局特征的特定指标,这些特征可用于描述线和多边形的形状。
1局部结构的特征描述了出现在某一点A及其相邻的B、C上的特征,它们之间的距离为k,形成三角形ABC。特征有三角形面积、所有边长度和转角等。
A点的局部特征。蓝色三角形由k=1,红色k=2
2区域结构的特征描述了与几何图形的重要区域点(例如质心)相关的兴趣点周围的一般特征,同时使用与局部特征相同的特征计算。对于大多数线来说,质心可能不是最佳参考点。(我的理解就是选关键点做上一步的局部特征)
3描述几何整体结构的特征只计算一次,并将相同的值应用于几何的每个顶点。尽管有一些特征可以同时应用于直线和多边形,但区分这两种几何类型是有用的(参见图6)。
a)一条直线和b)一个多边形的选定全局特征。MABR是定义长度(l)和宽度(w)的最小区域边界矩形,或分别定义锚线长度和带宽。
编码方案
综上所述,所有编码方案都有其优势。表4给出了三种编码方案:坐标编码、坐标+one-hot、坐标+one-hot+3特征。
4实验
评估不同编码方案与cnn、rnn和gcnn结合的性能
检查每个预处理步骤(规则匹配、坐标归一化)对分类结果的影响
检查特征选择和编码顺序对分类结果的影响
将编码技术应用于多线数据集
我们对多边形和折线数据进行了形状分类作为下游任务的实验。选择这个任务有三个原因:1从(编码)几何中学习——这是本文的主要主题——对这个任务至关重要。2该任务的结果可以在数据集中进行标记时进行定量评估,也可以通过人眼进行定性评估,这对边缘情况的分类特别有利。3该任务与Yan等人(2021)的数据集相结合已成为形状编码的基准,因此我们希望将此设置用于我们的工作。该数据集由从OpenStreetMap中提取的5010栋建筑组成,这些建筑根据其形状和与字母表中十个字母(E、F、H、I、L、O、T、U、Y和Z)中的一个的相似性被手动标记为类。图10显示了这十个类的示例变化,每个类包含501栋建筑。
对于折线,我们利用关于沿海类型的数据集。选择了三个类别:即“可蚀岩和/悬崖”,“港口”和“海滩”。
结果:略