P+F洗车机传感器传统上,从航空/航天影像中提取建筑物的主要工作集中在经验地设计一个恰当的特征以表达“什么是建筑物”,并创建相应的特征集用于建筑物的自动识别和提取。常用的指标包括像素[2]、光谱[3-5]、长度、边缘[6-8]、形状[9-10]、纹理[4, 11-12]、阴影[1-2,13]、高度[14-16]、语义[17-18]等。而这些指标却会随着季节、光照、大气条件、传感器质量、尺度、建筑物风格和环境发生较明显的变化。因此,这种凭经验设计特征的方法常常只能处理特定的数据,而无法真正做到自动化。
(P+F 超声波传感器 UC4000-30GM-E6R2-V15)
参数化接口,用于通过服务程序 ULTRA 3000 根据具体应用调整传感器设置,2 路可编程的开关输出,迟滞模式可选,可选窗口模式,同步选项,可调声功率和灵敏度,温度补偿
感应范围 : 200 ... 4000 mm 调整范围 : 240 ... 4000 mm 死区 : 0 ... 200 mm 标准目标板 : 100 mm x 100 mm 换能器频率 : 大约 85 kHz 响应延迟 : 最短 145 ms
440 ms,出厂设置 绿色 LED : 常亮:通电
闪烁:待机模式或程序功能检测到物体 黄色 LED 1 : 常亮:开关状态开关输出 1
闪烁:程序功能 黄色 LED 2 : 常亮:开关状态开关输出 2
闪烁:程序功能 红色 LED : 常亮:温度/编程插头未连接
闪烁:发生故障或编程功能没有检测到物体 温度/示教连接器 : 温度补偿 , 开关点编程 , 输出功能设置 工作电压 : 10 ... 30 V DC ,纹波 10 %SS 空载电流 : ≤ 50 mA 接口类型 : RS 232, 9600 Bit/s , 无奇偶校验,8 个数据位,1 个停止位 同步 : 双向
0 电平 -UB...+1 V
1 电平:+4 V...+UB
输入阻抗:> 12 KOhm
同步脉冲:≥ 100 µs,同步脉冲间歇时间:≥ 2 ms 同步频率 : 输出类型 : 2 路开关输出,PNP,常开/常闭,可编程 额定工作电流 : 200 mA ,短路/过载保护 电压降 : ≤ 2,5 V 重复精度 : ≤ 0,1 % 满量程值 开关频率 : ≤ 1 Hz 范围迟滞 : 调节后工作范围的 1%(默认设置),可编程 温度影响 : ≤ 2 满量程值的 %(带温度补偿)
≤ 0.2%/K(无温度补偿) UL 认证 : cULus 认证,一般用途 CSA 认证 : 通过 cCSAus 认证,一般用途 CCC 认证 : 额定电压 ≤ 36 V 时,产品不需要 CCC 认证/标记 环境温度 : -25 ... 70 °C (-13 ... 158 °F) 存储温度 : -40 ... 85 °C (-40 ... 185 °F) 连接类型 : 连接器插头 M12 x 1 , 5 针 防护等级 : IP65 材料 : 质量 : 180 g
威海洗车机传感器卫星数据集Ⅱ包含6张相邻的、色彩差异明显的卫星遥感影像,地面分辨率0.45 m,覆盖东亚地区860 km2的土地,如图 10所示。本文数据集主要用于评估深度学习方法对于不同数据源但建筑物类型相似的样本的泛化能力。建筑物矢量图同样在ArcGIS中全手工画出,包含3.4万栋建筑物。与航空数据集类似,整个区域被分成17 388个512×512像素的瓦片,便于深度学习方法的应用。
中国洗车机传感器文中利用3个指标评估检测结果的准确性。第1个是交并比IoU,指算法检测到的建筑物像素与真实的正像素的交集以及它们的并集之间的比值。IoU一般作为目标检测和语义分割中的最常用指标。第2个是准确率(Precision),算法检测到的建筑物像素中真实正像素的百分比。第3个是召回率(Recall),即算法检测到正确建筑物像素占地面真实正像素的百分比。
P+F洗车机传感器特征金字塔网络(feature pyramid network, FPN)也是梯形结构,但具有多个预测输出(见图 1(b))。FPN在每一个阶段均进行预测,通过对这些输出进行加权得到最终的损失函数。因此各阶段的预测结果都用于反向传播和网络参数的更新。FPN可以定位不同比例的对象,因而在目标检测中具有良好的效果。然而,在像素分割中只关注最后一层(即原始图像分辨率下)的分割精度,其分割能力可能需要进一步强化。
威海洗车机传感器针对以上建筑物提取在深度学习时代下的问题和瓶颈,本文提出了相应的解决方法。首先,笔者创建了一套目前范围最大、精度最高、涵盖多种样本形式(栅格、矢量)、多类数据源(航空、卫星)的建筑物数据库(WHU building dataset),并实现开源。希望能够为深度学习时代下的建筑物提取奠定基础,并提供了一个重要的算法性能比较标准。其次,本文提出一种改进的FCN方法,与最新的文献相比,在建筑物语义分割中得到了领先的结果;第三,本文提出了一种改进的Mask R-CNN方法,首次实现了大场景下(18万栋)建筑物的实例分割,经试验验证,其像素语义分割精度略超过基于FCN的方法。
中国洗车机传感器在建筑物提取试验中,对于小型的建筑物,Mask R-CNN的提取结果较好(包括包容盒与目标);而在提取大建筑物时,其包容盒比较精确,但是掩膜Mask的边界存在不太精确之处,本文尝试对其改进。原始版本的mask大小为分别为14×14像素与28×28像素,大建筑物由于缩放比例过高而损失了大量细节信息。在试验中,修改为40×40与80×80像素,同时将包容盒的大小从7×7像素按比例设置成20×20像素。
摘要:从遥感图像中自动化地检测和提取建筑物在城市规划、人口估计、地形图制作和更新等应用中具有极为重要的意义。本文提出和展示了建筑物提取的数个研究进展。由于遥感成像机理、建筑物自身、背景环境的复杂性,传统的经验设计特征的方法一直未能实现自动化,建筑物提取成为30余年尚未解决的挑战。先进的深度学习方法带来新的机遇,但目前存在两个困境:①尚缺少高精度的建筑物数据库,而数据是深度学习必不可少的“燃料”;②目前国际上的方法都采用像素级的语义分割,目标级、矢量级的提取工作亟待开展。针对于此,本文进行以下工作:①与目前同类数据集相比,建立了一套目前国际上范围最大、精度最高、涵盖多种样本形式(栅格、矢量)、多类数据源(航空、卫星)的建筑物数据库(WHU building dataset),并实现开源;②提出一种基于全卷积网络的建筑物语义分割方法,与当前国际上的最新算法相比达到了领先水平;③将建筑物提取的范围从像素级的语义分割推广至目标实例分割,实现以目标(建筑物)为对象的识别和提取。通过试验,验证了WHU数据库在国际上的领先性和本文方法的先进性。
本文报告了遥感影像建筑物提取的数个重要研究进展。第一,与当前国际同类数据集相比,本文建立了一套范围最大、精度最高、涵盖栅格和矢量样本形式、航空/航天数据源的建筑物数据库,并实现开源。该数据库便于研究人员使用、便于方法间的比较、便于新方法的快速发展;同时该数据集提供的矢量形式能够拓展建筑物提取的研究范围,即从当前的像素级语义分割推广至单体建筑物的实例分割乃至多边形提取。第二,本文提出一种基于全卷积网络的建筑物语义分割方法,与最先进的方法相比,达到了领先水平。第三,本文将建筑物提取研究从像素级的语义分割推广至目标实例分割,实现以建筑物为对象的识别和提取,并取得了比语义分割更好的结果。
目前,国际上共有3套开源数据集可用于建筑物提取,分别是Massachusetts数据库[38]、ISPRS的Vaihingen和Potsdam数据库(http://www.isprs.org/commissions/comm3/wg4/tests.html)、Inria数据库[39]。ISPRS数据库太小,只覆盖13 km2的地区,建筑物实例太少,无法进行大范围的应用。Massachusetts数据库包含151张1500×1500像素的图像,分辨率为1 m,但这个数据库质量较差,没有被用于最新的文献的试验中。Inria数据库是2017年最新的建筑物数据库,覆盖405 km2,分辨率0.3 m,但目前还没有被广泛应用。从文献[39]可以看出,使用主流的全卷积网络的方法,通过交并比(intersection on union, IoU)进行评估,只能达到0.59的精度,可见数据库质量较差。
显然,建筑物提取的研究并非止于语义分割。建筑物提取的目标并非关注某个像素是不是建筑物,而更关注建筑物目标本身,包括建筑物的位置,建筑物的数量。这是一个典型的目标实例分割问题,在本文研究中就是建筑物单体分割。然而,目前基于CNN的建筑物实例分割研究在国内外相关领域关注仍然较少,并亟待填充。在深度学习中,从CNN中发展出一类特殊的网络架构用于目标检测,即通过回归而非标签分类寻找一个最优包容盒(bounding box)。由包容盒的四角坐标,进一步得到待检测物体的位置和数量,其中最流行的是基于区域的模型(region-based model)。这些模型包括R-CNN (region-based CNN)[33],Fast R-CNN[34]、Faster R-CNN模型[35]、YOLO(you only look once)[36]。