湿地遥感影像分类途径

湿地遥感影像分类途径

 

1引言   海滨湿地是指发育在海岸带附近并且受海陆交互作用的湿地,是陆地生态系统和海洋生态系统的交错过渡地带,广泛分布于沿海海陆交界、淡咸水交汇地带,是一个高度动态和复杂的生态系统[1]。江苏盐城海滨湿地属于典型的淤泥质海岸湿地类型,由于海岸的不断淤长,海滨湿地植物覆被类型比较丰富多样,景观格局处于不断演变之中[2]。遥感技术是获取地表覆盖信息的有效技术手段,目前广泛用于湿地研究中并取得了显著的成果[3-5]。采用何种方法对湿地遥感信息进行有效提取,以达到理想精度要求,一直是湿地遥感研究的重要内容。目前,湿地遥感信息提取中难度最大的是对湿地植物覆被类型的有效识别,其方法研究成为湿地遥感信息提取的难点与热点[3-5]。而针对不同的遥感数据源,学者们采取的方法各异。如于欢等[6]选取ALOS遥感影像为数据源,通过对其波段的光谱及纹理特征进行分析,采用非监督、监督及面向对象分类方法,对三江平原湿地信息进行提取。那晓东等[7]以Landsat卫星影像为数据源,利用回归树集中挖掘分类规则对湿地类型进行分类研究。牛明香等[8]利用TM数据,提出了单红外阈值法和改进的监督分类相结合方法对湿地进行分类。从目前的研究进展来看,湿地遥感分类研究采用的数据源大部分都是TM、SPOT等影像,而利用ALOS数据的研究并不多。   本文针对江苏海滨湿地的时空分布特征,选择ALOS影像为数据源,其原因是保护区核心区面积较小,空间分辨率较高的ALOS影像更适合,而不选用波段与之相似的Landsat卫星数据。另外,相比于分辨率相同的SPOT等影像,ALOS影像在图像纹理特征方面,如反映地物类别空间特征的差异性和纹理信息的丰富程度均比SPOT5等影像强,并且小图斑的面积精度也优于SPOT等影像[9];从时间选择来看,由于11月份海滨湿地的盐蒿呈现红色,与其他湿地植被类型的色差比较明显,是湿地遥感信息提取的较好时机。而选用的ALOS数据在2006年11月9日恰好在海滨湿地过境,故采用分辨率高、性能好、价格低的秋季ALOS影像作为本次研究的数据源最为合适。   为此,针对海滨湿地植物覆被类型遥感信息分类难度大,以及湿地植物覆被类型之间的生态交错带信息难以正确识别的问题,综合考虑光谱信息、空间信息并附加知识规则和GIS规则,对海滨湿地进行遥感分类方法研究,为海滨湿地研究提供重要的科学支撑。   2研究区概况   江苏盐城部级珍禽自然保护区核心区是目前残留的典型淤泥质海滨湿地代表,具有丰富多样的湿地类型。该区域位于新洋港和斗龙港出海河之间[10],地理位置位于33°25′0″~33°42′40″N,120°26′40″~120°44′40″E,面积为203.57km2,基本保持自然景观状态。湿地植物覆被类型包括芦苇群落、大米草群落、盐蒿群落等[11]。研究区位置如图1所示。   3数据源   采用的数据为ALOS数据,重访周期为46d,卫星轨道为太阳同步。AVNIR-2传感器可以接收4个波段的数据,分别为蓝波段(0.42~0.50μm)、绿波段(0.52~0.60μm)、红波段(0.61~0.69μm)、近红外波段(0.76~0.89μm)。多光谱分辨率10m,全色波段空间分辨率2.5m。为了更准确地提取信息,还采用了其他相关辅助资料,包括1∶400000江苏省海岸土地利用图以及野外调查时38个点GPS数据。   3.1数据预处理   本文采用ENVI下的FLAASH模块对ALOS影像进行大气校正。FLAASH是基于MODT-RAN4大气校正模块,可以从多光谱遥感影像中复原地物的地表反射率,是多光谱能量影像反射率反演的首选大气校正模型[12]。影像几何校正通常选取图像上有定位识别明显的标志,如道路交叉点、河流岔口等GPS记录点为控制点。采用二次多项式变换和最邻近像元重采样的方法对原始影像进行几何纠正,RMS小于0.5个像元。   3.2湿地分类系统的建立   根据研究区湿地类型的特征,综合考虑遥感影像数据的可解译性,建立湿地土地利用/覆被分类系统,见表1。   4对ALOS影像的非监督分类   针对本研究区特点,海岸带地物在遥感影像上的光谱比较复杂。选择的训练区不可能包括所有的光谱类型,也就是说有一部分像元会出现漏分的现象。所以本文采用人机交互的非监督分类方法,算法是重复自组织数据分析技术(ISODATA)。   4.1分类的过程及结果   海岸带地物的波谱相关性较大,也就是“同物异谱”和“异物同谱”的情况比较多。鉴于这种情况,使用非监督分类时,一般设置分类的数目比最终分类数量多3~4倍,再进行合并,防止错分漏分,以提高分类精度。本次研究初始分类数定为30类,输出分类图像后再对30类地物进行合并,找到最佳的合并方案,然后再对其进行重新合并。把原始影像和分类的结果进行对比,并且参考1∶400000江苏海岸土地利用数据,对30类地物进行同类合并删减。合并时尽量遵循以下规则,尽可能地把地物归为:养殖塘、河流、芦苇、盐蒿、米草和光滩6类。利用上述规则,在ENVI中对非监督分类的图像进行重新归类,结果如图2所示。   4.2分类精度检验   精度检验是遥感分类的必备工作,通过精度分析可以清楚地发现哪些类别的分类精度还有待提高,从而改进分类模式,修改分类结果,提高分类精度。根据所选择的样本,大致为150个样本点,其中包括野外调查时38个点GPS数据,每类样本至少20个,在ENVI4.7软件的分类后处理中选择混淆矩阵法通过地表真实感兴趣区进行精度检验。经检验,总体分类精度为78.8786%,Kappa系数为0.7415,具体参数见表2。#p#分页标题#e#   从非监督分类后的精度验证可以看出,非监督分类的精度一般。地物类型之间尤其在米草、盐蒿、芦苇等草本植被类型间错分、漏分现象比较突出,其中米草错分误差达到33.21%,芦苇漏分误差达到26.47%。分析其原因主要有以下3个方面:   (1)由于遥感影像光谱的复杂性,非监督分类这种纯粹的依靠光谱特征的分类方法在地物类型比较复杂的地区很难得到较高的精度[7]。   (2)米草、盐蒿、芦苇3种植被由于光谱比较类似,所以植被分类精度不理想。   (3)保护区北部人为管理区大坝内和养殖塘东界以西的区域部分,芦苇因为光谱的相似性被错分为米草或者盐蒿。因此要提高分类精度,就要对非监督分类后的结果进行改进。   5非监督分类后初始结果的改进   核心区北部人为管理区大坝内和养殖塘东界以西的区域被错分为米草和盐蒿的芦苇可以根据生态学知识和GIS规则进行修改,同理被错分为芦苇和盐蒿的光滩部分也可以用同样的方式修改。而对于3种植被的交错带的部分只能寻找新的特征向量来加以区分,所以根据分区分层分类法的思想可以把研究区化为3个小区域:交错带区、大坝以内养殖塘东界以西以及剩余区域。根据研究区的特殊性把非监督分类结果的修改分为下面两个部分,其流程如图3所示。   5.1基于知识规则的植被覆盖的细分   由于ALOS数据4个波段组成的特征空间有很高的相关性,不足以将核心区的地物很好地划分,导致初始非监督分类的精度不是十分理想。所以必须寻找新的特征向量和特征空间来减少地物之间的相关性,以区分核心区的地物信息,达到提高分类精度的目的。本文通过ALOS四个波段的PCA变换、纹理分析和NDVI进一步构造特征空间,再利用特征空间上的阈值作为知识规则,进而采用密度分割和决策树的方法来区分地物。就研究区的实际情况来看,分类精度不高的地区主要有3个,米草和盐蒿的交错带,芦苇和盐蒿的交错带,以及上下两个芦苇、米草和盐蒿的交错带。所以如何较高精度地划分出3个交错带,对提高遥感影像的解译精度具有非常重要的意义。知识规则阈值的生成有两个途径:第一是根据特征空间上值的分布人工寻找阈值;第二采用数据挖掘算法例如CART树、C4.5树等自动挖掘阈值[13]。数据挖掘的方法适合于大批量阈值的寻找,就本研究的实际情况,由于只要寻找出两种植被或3种植被的阈值,数据量不是很大,故采用观察样本差异人工寻找阈值的方法。   5.1.13种植被交错带的细分   PCA变换又称主成分变换,是一种除去波段之间的多余信息,将多波段的图像信息压缩到比原波段更有效的少数几个转换波段的方法。使得在原光谱空间相关性较大的地物,能在新的PCA特征空间中得到有效区分[14]。本次研究利用PCA变换对3种植被的交错带进行细分:被区分的植被有米草、芦苇和盐蒿。首先对原图进行PCA变换,进而在PCA变换图上绘制3种植被的训练区,尽量选择比较纯净的像元,然后对这些训练样本的主成分变换后的数值进行分析。通过观察这几种植被在主成分变换中各个主成分的差异,找出差异最大的主成分波段,观察PCA中各个主成分的最大值、最小值和平均值,最后发现PC1能够很好地区分这3种植被,如表3所示。   5.1.2芦苇和盐蒿交错带的细分通过观察非监督分类图上芦苇和盐蒿的分布,根据实地考察记录的GPS点,可以看到很多芦苇都被错分为盐蒿,主要分布在分类图左下角养殖塘的周围。对错分为盐蒿的芦苇和正确划分的芦苇以及正确划分的盐蒿进行采样,采样时依旧遵循上面的原则即尽量保证像元纯净,以方便比较。然后在ENVI4.7中绘制光谱图,如图4所示。观察图4可以发现错分为盐蒿的芦苇和芦苇的斜率比较相近,而和盐蒿的斜率有较大的差别,进而计算整个图像的NDVI,然后利用上面的采样区对NDVI进行分析,得到以上3种植被的NDVI数值表,见表4。从表4可以看出,在光谱空间上极易错分为盐蒿的芦苇和正确划分的盐蒿在NDVI值上相差很大,而和正确划分的芦苇的值很接近,所以通过NDVI可以较为准确地划分芦苇和盐蒿。   5.1.3盐蒿和米草交错带的细分   非监督分类后,通过观察分类图上米草和盐蒿的分布,可以发现有较大片的盐蒿属于米草,同理也有较大片的米草属于盐蒿。所以需要把错分为盐蒿的米草从盐蒿中分离出来,然后将其中的米草信息还原。同理错分为米草的盐蒿也是这样。对米草和盐蒿在NDVI和PCI特征空间做采样分析,发现在这两个特征空间不能找到合适的阈值将其区分。考虑到灰度共生矩阵的纹理可以很大程度上改进遥感影像的分类精度,本文采用ENVI4.7软件的二阶概率矩阵方法生成8个基于灰度共生矩阵的纹理特征,即平均值、方差、同质性、反差、差异性、熵、二阶矩和自相关性。生成二阶概率矩阵时选用3×3的滑动窗口,移动步长为1。通过比较这8组数据发现盐蒿和米草在方差和自相关性上差异较大,如表5。自相关上差异很大是因为米草有不少负相关很大的值,比如-8000,因此平均的米草负相关值就会很大,同理盐蒿也是,从米草和盐蒿的自相关值集中的频率来看,两者绝大部分的值都集中在-1和1之间,所以在自相关这个纹理特征空间上不能将米草和盐蒿区分开。而从方差上看,方差的第四波段可以较容易地划出一个阈值来区分米草和盐蒿。方差运算后结果比较小的表示该地物纹理比较细密,方差运算后结果比较大的表示该地物纹理比较粗糙,从遥感影像上来看盐蒿的纹理显得比较平滑、波动性小,而米草的纹理比较粗糙,刚好符合表5统计数据的特征[15]。因此,可以选用方差的第四波段上的阈值来区分米草和盐蒿。   5.1.4河流和养殖塘错分的修改   由于核心区的养殖塘形状较为规则,呈现长方形和正方形,而河流的形状较为弯曲,且分布在核心区的最北和最南,根据这条知识规则对非监督分类图中河流和养殖塘的错分进行修改,还原错分的养殖塘和河流。总结上述知识规则,得到表6。对于3种植被的交错带,采用构建决策树的方法进行细分(图5)。而芦苇和盐蒿两种植被的交错带则采用密度分割的方法划分阈值进行细分。#p#分页标题#e#   5.2基于GIS规则的分类改进   遥感影像特征是基于植物类型与土壤、水体等地物特征及其组分相互消长关系的综合反映,由于“同物异谱”和“异物同谱”的情况比较严重,因此,单纯基于光谱特征识别植被类型会不同程度地产生错分和误分。根据生态学和地学等方面的专家知识,利用GIS,对基于光谱特征的影像分类进行改进是提高分类精度的一个重要方法[16]。利用研究区1∶5万的地形图和江苏省1∶400000海岸土地利用图,可以在影像上目视解译出河道和养殖塘的范围。将非监督分类后所得的栅格数据转为矢量图,并与河道和养殖塘的范围作GIS叠加分析,对于河道和养殖塘叠加后有偏差的少部分区域,借助于地形图和土地利用图予以确认并进行修改。叠加分析后发现部分米草和盐蒿分布在河道和养殖塘的周围。根据生态学的基本知识,米草和盐蒿性喜盐,在淡水区域不可能长出米草和盐蒿,应为喜淡水的芦苇。通过GIS的空间相邻关系特征设置查询选项,执行这一特定区域的误分斑块的筛选,然后进行类代码的重新赋值,提高了分类精度。同理,被误分为芦苇和盐蒿的光滩也可以通过这一原理重新赋值修正。由于保护区具有科学实验的特征,核心区分为人为管理区和自然生长区。以中路港为界上半部分为人为管理区下半部分为自然生长区,在20世纪90年代人为管理区修建堤坝以防止海水的入侵,因此涨潮时海水不会影响堤坝内的植被。所以依照生态学的知识,根据GIS空间叠加分析的功能可以把该区域误分为米草和盐蒿的芦苇进行选定,并进行类别代码的重新赋值,从而纠正该类的误分。   5.3对修改后的非监督分类图进行精度评价   根据上述知识规则对非监督初始分类图进行修改,结果如图6所示。所选择的150个样本点仍然是非监督分类后的检验样本,每大类至少20个样本,其中包括野外考察38个点。在ENVI4.7软件中的分类后处理中选择混淆矩阵法,通过地表真实感兴趣区进行精度检验。经检验,总体精度为92.6829%,Kappa系数为0.9098,见表7。   6结语   通过精度检验表(表7)可以看出,各类地物的用户精度和生产精度都有了不同程度的提高,普遍达到85%以上,总体精度达到了92.68%。其中养殖塘和河流的分类精度都比较高,用户精度和生产精度都达到了95%以上。修改后米草和光滩间相互误分比较明显,因为越靠近光滩,有部分米草是小块、零散分布的,面积通常比较小,10m的空间分辨率无法将其表现出来。这些米草像元被自动归为与之相临近的光滩里面导致了误分错分。芦苇和光滩也存在误分,因为有些区域芦苇长势不是很好,和一些裸地形成了混合像元,从而在表观上显示裸地的光谱特征。米草和芦苇在上下两个三界交错带有部分的混生分布,并且光学特征非常类似,所以也产生了错分现象。非监督分类的方法无需选定感兴趣区,单纯依靠光谱信息聚类,误分错分比较多,具体表现在河流和养殖塘之间、芦苇、米草和盐蒿这两组光谱空间非常相似的地物之间。本文以非监督分类后的结果为模板,运用分区分层分类的思想对非监督分类初始结果进行修改,得到了较高的精度。研究表明融合遥感影像纹理信息、主成分变换等非光谱信息,可以提高地物的可分性,避免单纯利用光谱信息导致的错分漏分。同时基于分类规则以GIS为工具,依据生态学知识、地学等方面的知识对分类结果进行改进是提高分类精度的重要手段。