基于主动学习的油气管道沿线地物变化检测(3)
1.4.2 边缘采样的主动学习算法
在样本增选过程中,如果选择光谱特征相似的未标记样本进行标注不仅不能提高变化检测的精度,还会增加样本的冗余性进而降低变化检测的效率。因此利用主动学习算法进行增选样本选择的优化十分重要。边缘采样是样本不确定性分析的标准之一,该方法是根据样本的最大后验概率和次大后验概率的差值来描述不确定性,差值越小,不确定性越大,说明该样本的信息量越大,可分性越小,添加到训练模型中越有意义。在变化检测中只有变化和非变化两类,因此选择属于变化和非变化类别概率结果差值的绝对值最小的样本x′i进行标注,即
x′i=argmin|p(yi=c|xi)-p(yi=uc|xi)| (10)
式(10)中:c代表变化类别的标签;uc代表非变化类别的标签;p(yi=c|xi)和p(yi=uc|xi)分别表示像元xi属于变化和非变化类型的概率。
影像大小分别为700×700个像元,空间分辨率为2.1 m图2 两时相遥感影像和参考变化图Fig.2 Two-temporal images and reference map
1.5 算法流程
为了提高变化检测算法的自动化程度,并且有效利用高分辨率遥感影像丰富的空间信息,构建了基于多源特征融合和主动学习的变化检测算法,并且为了充分利用机器学习的挖掘能力,将目前应用广泛的梯度提升树(gradient boosting decision tree, GBDT)、k近邻(knear neighbor, KNN)和极限随机树(extremely randomized trees, ET)作为基分类器构成集成结构。
其中实验主要分为两部分,如图1所示,首先利用1.1节所述的多源特征提取方法构建多源特征和差值影像。由于在实际应用中,初始训练样本获取较为困难,因此利用自适应阈值法和不确定性分析自动选择准确度较高的初始训练样本,并通过半监督变化检测算法获取变化检测结果,在半监督变化检测过程中,为了提高未标记样本的准确率并且减少增选样本的冗余性,通过对象约束和主动学习增选准确且信息量较大的未标记样本进行标注。
图1 算法流程Fig.1 Algorithm flowchart
2 实验结果与分析
2.1 实验数据
利用2013年11月和2014年10月的两时相影像资源3(ZY-3)号影像进行实验有效评估算法的有效性,影像覆盖范围是江苏省部分区域,如图2(a)、图2(b)所示,参考变化图如图2(c)所示。
2.2 实验过程
2.2.1 模型建立
为了有效验证本文构建的用于油气管道沿线地物变化检测算法的可行性,选择基于EM的CVA、基于ET和GBDT的同质分类器集成变化检测算法,以及基于主动学习的支持向量机(semi-SVM)半监督变化检测算法作对比,实验过程中ET和GBDT算法都是利用自适应阈值法自动选择训练样本。为减少训练样本的偶然性对变化检测结果的影响,每次实验进行5次,取平均值作为最终精度,所有实验都以整幅影像像元作为测试像元。其中在基于SVM和多分类器的半监督变化检测过程中,两种方法初始训练样本都设置为100个,迭代过程中每次增选50个,共迭代11次,都利用边缘采样的主动学习策略进行样本增选,两种方法的变化检测精度曲线如图3所示,图中Semi-SVM表示基于半监督SVM的变化检测算法,Semi-ensemble表示本文提出的基于多分类器集成和主动学习的半监督变化检测算法。
图3 半监督变化检测算法精度变化曲线Fig.3 Precision trend of semi-supervised methods
白色表示变化区域;黑色代表非变化区域图4 变化检测结果和参考变化图Fig.4 Change detection results and reference map
通过图3可以看出,半监督SVM变化检测算法在迭代到第8次时精度趋于平稳状态,总体精度低于本文所提的变化检测算法,因此也说明了多分类器集成结构相对于单分类器来说挖掘能力更强。
2.2.2 精度评定
图4所示为不同变化检测算法和参考变化图。通过图4(a)可以看出,基于CVA的非监督变化检测算法中存在较多噪声影响产生的虚检像元,如绿色框区域。通过图4(b)~图4(e)检测结果中可以看出,在红色框区域所示的裸土变为道路部分,基于ET[图4(b)]和GBDT算法[图4(c)]漏检了大量像元,基于SVM半监督变化检测算法[图4(d)]稍微得到改善,漏检像元数量有所减少,而本文构建的基于主动学习的多分类器集成结构[图4(e)]对于这些区域的检测效果得到了明显提升,并且虚检现象也得到较大改进,因此可以有效应用于油气管道沿线地物变化情况研究。
为了定量地评估不同算法的有效性,利用总体精度、Kappa系数、虚检率、漏检率和误检像元数量5种评价指标来进行精度评定。表1列出了不同变化检测算法的检测精度,通过实验结果可以看出本文构建的变化检测算法总体精度为0.947 7,Kappa系数为0.703 6,具有比其他算法更高的变化检测精度,更低的虚检率和漏检率。相比其他变化检测算法总体精度分别提高了2%~4%,Kappa系数提高了约0.23,并且,通过误检像元数量可以看出,相对于对比实验来说,本文提出的方法误检像元数量减少很多,因此说明了该方法的可行性和有效性。
文章来源:《油气储运》 网址: http://www.yqcyzz.cn/qikandaodu/2021/0222/367.html
上一篇:油气储运设备的管理、维护举措分析
下一篇:油气储运过程中仪表自动化技术的应用