为了改善空气质量、防风固沙、减少水土流失等环境问题,中国政府进行了大规模的植树造林活动。臭椿、云南松和栾树作为中国常见的绿化树种,自然而然地成为植树造林的首选。由于我国绿化造林面积巨大,林业病虫害几乎是不可避免的问题,而解决这一问题要花费巨大的人力物力。高光谱激光雷达探测系统可以快速同步获得地物目标的测距信息和光谱信息,可应用于目标的探测与识别等。这为研究一种精准高效的林业病虫害监测方法提供了保障,因此开展基于高光谱激光雷达的林业病虫害监测方法的研究具有重要的意义。
1实验系统与分类方法
1.1新型可调谐高光谱激光雷达系统
新型可调谐高光谱激光雷达系统主要由发射系统、接收探测系统、扫描控制系统三个主要部分组成。发射系统主要由激光器和声光可调谐滤波器(AOTF)组成;接收探测系统主要包括接收光学系统、光电探测器和数据采集系统;扫描控制系统负责对发射光束进行空间位置和激光出射方向的控制,实现预定的空间扫描。图1为高光谱激光雷达原理,表1为高光谱激光雷达系统的主要参数。
图1高光谱激光雷达原理示意图
表1高光谱激光雷达的主要参数
高光谱激光雷达系统首先将超连续激光光束注入AOTF中,经AOTF调谐滤波后按照设置要求在不同时刻发射不同波长的单色光,激光经准直扩散镜和反射镜出射,出射光束有小部分投射到光束采样镜后进入主波探测器中并传递到数据采集系统,大部分光束通过扫描转镜后投射到目标上,目标的回波信号由光学接收系统接收,再经光电探测器转化为电信号,由数据采集系统保存至上位机。对于采集到的数据首先进行预处理,即将采集到的样本回波强度信息转化为样本光谱反射率信息。为了减少外部环境因素的影响,保证同一次实验的数据之间可以横向比较,使用回波反射率对每个测量目标进行归一化。回波反射率由同一光谱通道的目标回波强度与参考板回波强度的归一化处理得到。待测目标的反射率可表示为
式中:Itarget和Ireference分别为待测目标和参考靶标的激光回波强度;Rreference为参考靶标的反射率,参考靶标的反射率可通过地物光谱仪测量得到。起始波长为650m,终止波长为1100nm,波长间隔为5nm,共91个光谱通道,参考靶标可以选用不同反射率的白色参考板。
1.2分类方法
支持向量机是一种二类分类模型,其基本模型是定义在特征空间上间隔最大化的线性分类器,在分类问题中给定输入数据和学习目标x={x1,x2,x3,…,xn}和y={y1,y2,y3,…,yn},其中输入数据的每个样本都包含多个特征并由此构成特征空间,而学习目标为二元变量并分别表示负类和正类。若输入数据所在的特征空间存在作为决策边界的超平面,则将学习目标按正类和负类分开,并使任意样本的点X到平面距离不小于最小距离,则称该分类问题具有线性可分性,超平面的法向量ω和截距b可表示为
但是支持向量机还是局限于线性可分的数据,当引入核函数之后,则使其成为实质上的非线性分类器。最早Cortes等提出了线性支持向量机,之后Stephan通过引入核技巧提出了非线性支持向量机。支持向量机是一种常用的数据分类和回归的机器学习方法,该方法已成功地应用于遥感监测领域。支持向量机的优点是鲁棒性强,对维数不敏感,对训练样本数量要求较低,而且支持向量机具有良好的泛化性能,具有较强的统计学习理论基础。
2分类实验与数据分析
2.1实验样本与样本光谱反射率
本实验采用的样本包括标准反射率白板、健康的臭椿样本、感染沟眶象的臭椿样本、健康的云南松样本、感染云南松切梢小蠹的云南松样本、健康的栾树样本、感染洁长棒长蠹的栾树样本等。植被、土壤和水体等物质是地球表面的主要组成部分,具有显著不同的光谱特征。色素吸收决定着可见光波段的光谱反射率,细胞结构决定近红外波段的光谱反射率。一般情况下,植被在350~2500nm波长范围内具有典型的反射光谱特征,而且植被分析常使用红边区域和近红外区域的工作波段。因此,本实验的工作波长选定为650~1100nm,光谱通道数量为91个,光谱分辨率为5nm,在吸收率100%的黑色参考板背景下对上述目标在固定距离处分别采集回波强度信号。实验采集的部分样本如图2所示。
图2高光谱激光雷达数据采集的样本实例
由于林木样本的生长环境和保存状况一直处于变化之中,而且木质样本易受大气介质等因素的影响,所以林木样本表面的成分随着时间推移而不断变化,因此激光回波强度受林木样本表面特性的影响很大。首先对健康林木样本表面与感染林木样本表面的光谱反射率差异进行初步分析。图3为健康样本表面与染病样本表面的反射率趋势。从图3可以看到,除了健康臭椿与感染沟眶象臭椿的反射率在部分波长范围内反射率差异较大,其他几种林木样本健康与染病的反射率都十分接近。
图3健康样本表面与染病样本表面的反射率。(a)臭椿;(b)云南松;(c)栾树
2.2支持向量机分类器模型的构建及参数选择
由于林木样本的波长与反射率是非线性的,为此本文采用了非线性支持向量机分类器。支持向量机可以配置不同的核函数来处理各种非线性决策边界,目前常用的核函数有多项式核函数、高斯径向基核函数、线性核函数。因为高斯径向基核函数具有平滑、稳定、同步的特性,所以本研究采用的是高斯径向基核函数,即
式中:x和z为空间内不同的样本点;σ为核半径。关于实验数据处理,本文使用软件对回波信号进行处理、划分样本集、建模以及评价。通过数据预处理得到了样本的光谱信息,之后将健康的臭椿样本与感染沟眶象的臭椿样本、健康的云南松样本与感染云南松切梢小蠹的云南松样本、健康的栾树样本与感染洁长棒长蠹的栾树样本的表面反射率数据一分为二,一半作为支持向量机的训练集并用于构建支持向量机模型,另一半作为测试集并用来验证支持向量机分类器模型的分类效果。得到三组不同的支持向量机模型之后,调节模型参数使模型性能更加优越。使用基于高斯径向基核函数的SVM模型有两个非常重要的参数C与γ。
C为惩罚系数,即对误差的宽容度,若C值越大,则说明越不能容忍出现误差,容易过拟合;若C值越小,则容易欠拟合,综上C值过大或过小,都会影响模型的泛化能力。γ是选择高斯径向基函数作为核函数后,该函数自带的一个参数,其隐含地决定了数据映射到新的特征空间后的分布,γ值越大,则支持向量越少,这会造成SVM只作用于支持向量样本附近,则训练集上的准确率很高,而测试集上的准确率较低,存在过拟合的风险;γ值越小,则支持向量越多,则会造成平滑效应太大,无法在训练集上得到特别高的准确率,也会影响测试集的准确率。此外高斯径向基核函数公式里面的σ和γ的关系,可以通过改变σ值来影响γ,先根据经验对其惩罚因子C和核函数的固有参数进行初始化赋值,然后通过实验测试,再根据测试数据反复调整参数值,直到得到满意的结果为止。因为实验选用正类与负类的数据数量一样多,所以对惩罚系数在0~64之间进行选择。根据台湾大学林智仁教授的研究表明σ值通常可以在2-5~25之间,所以对σ在2-5~25之间进行选择。图4为不同σ值条件下健康林木样本与染病林木样本的分类精度趋势,图5为不同C值条件下健康林木样本与染病林木样本的分类精度趋势。
图4不同σ值条件下健康林木样本与染病林木样本的分类精度趋势。(a)臭椿;(b)云南松;(c)栾树
σ的取值集中在0~1之间,γ的取值较大、支持向量减少,则展现出较高的分类精度;当σ增大时,γ值减小、支持向量增多,则样本的分类精度呈现出明显的下降趋势。从图4(a)可以看到,健康臭椿与感染沟眶象臭椿在σ=2-2.7附近的分类精度可达0.9890。从图4(b)可以看到,健康云南松和感染切梢小蠹云南松在σ=2-2.1附近的分类精度可达0.9286。从图4(c)可以看到,健康栾树与感染洁长棒长蠹栾树在σ=2-2.5附近的分类精度可达0.6703。对于惩罚系数C来说,随着C值的增加,分类精度迅速增加,当前取值超过一定范围之后分类器模型的性能将不会有较大提升。通过分析发现,刚开始C值增加,模型的复杂度增加,支持向量减少;而当C值足够大之后,模型中边界支持向量的数量为0,C的变化就不会对模型的性能产生较大的影响。从图5(a)可以看到,健康臭椿与感染沟眶象臭椿在参数C=47附近的分类精度可达0.9945。从图5(b)可以看到,健康云南松和感染切梢小蠹云南松在C=18附近的分类精度可达0.9286。从图5(c)可以看到健康栾树与感染洁长棒长蠹栾树在C=48附近的分类精度可达0.6593。
图5不同C值条件下健康林木样本与染病林木样本的分类精度趋势。(a)臭椿;(b)云南松;(c)栾树
2.2测试集数据实验结果验证
完成支持向量机模型优化之后,就得到了适合识别不同种类林木样本健康或者染病的支持向量机模型。将测试集数据输入支持向量机分类器模型中,用来验证其分类效果。表2为样本测试数据的分类精度。
表2测试集样本数据的分类精度
通过测试集数据的验证,经过参数优化之后的支持向量机模型可以很好地分类识别各种林木样本目标,而且都达到了预期效果,并未出现过拟合的现象。从表2可以看到,臭椿和云南松的分类精度较高,可以达到90%以上;栾树的分类精度也接近70%。分类精度较高主要是因为其在650~1100nm整个波长范围内的反射率差异显著,除了部分波段有混叠现象外,其他部分差异十分明显。而栾树在650~1100nm整个波长范围内的反射率非常接近,这也是其分类精度较低的主要原因。综合来看支持向量机对于健康与染病的多种林木样本,分类效果明显,原因在于新型可调谐的高光谱激光雷达的91通道光谱信息为分类提供了丰富的光谱信息,而且具有主动测量、占地面积小、抗干扰能力强等优点,这就使测量精度得到保证。
2结论
本研究利用自研的新型可调谐高光谱激光雷达系统,对固定距离下不同种类的健康林木样本和染病林木样本进行了分类研究,通过分析健康林木样本表面光谱与横截面光谱的关系证实表面光谱用于分类的可行性;运用支持向量机对健康和染病的林木样本的表面光谱反射率展开了关于核函数选取、模型参数选择、分类精度的相关研究;将实验获得的数据输入到优化之后的支持向量机模型中并进行验证,发现其对实验样本有良好的分类效果。其中健康臭椿和感染沟眶象臭椿在参数σ=2-2.7、C=47附近的分类精度可达96.98%;健康云南松和感染切梢小蠹云南松在参数σ=2-2.1、C=18附近的分类精度可达91.21%;健康栾树与感染洁长棒长蠹栾树在参数σ=2-2.5、C=48附近的分类精度66.21%。
虽然栾树的分类精度没有臭椿和云南松高,但在日后的研究中可以通过对模型的调整优化来进一步提升分类精度。本文在有限的光谱通道条件下对健康和染病的林木样本表面光谱反射率进行分类识别,探索了一种适用于基于可调谐高光谱激光雷达光谱的病虫害林木样本分类方法,目前只获得了初步结果,但具有一定的参考价值。本文的研究并未关注林木样本的染病程度,只是定性地分析了林木样本的健康染病与否,日后可以展开林木样本染病程度的相关研究,实现更加精确的监测。
莱森光学(深圳)有限公司是一家提供光机电一体化集成解决方案的高科技公司,我们专注于光谱传感和光电应用系统的研发、生产和销售。
审核编辑 黄昊宇
-
激光雷达
+关注
关注
967文章
3933浏览量
189504 -
高光谱
+关注
关注
0文章
328浏览量
9909
发布评论请先 登录
相关推荐
评论