黑河流域中游地区作物种植结构的遥感提取
河海大学水文水资源与水利工程科学国家重点实验室,南京 210098
Remote Sensing of Cropping Structure in the Middle Reaches of the Heihe River Basin
State Key Laboratory of Hydrology-water Resources and Hydraulic Engineering, Hohai University, Nanjing 210098, China
通讯作者:
收稿日期: 2019-04-22 修回日期: 2019-07-4 网络出版日期: 2019-10-25
基金资助: |
|
Corresponding authors:
Received: 2019-04-22 Revised: 2019-07-4 Online: 2019-10-25
Fund supported: |
|
作者简介 About authors
边增淦(1995-),男,山东淄博人,硕士生,研究方向为水文遥感E-mail:zengganbian@163.com 。
及时、准确地获取农作物种植结构对区域水资源管理与作物产量估测等具有重要意义。随着对通过遥感手段获得作物种植结构的深入研究,如何优选遥感数据和分类器成为需要重点考虑的关键问题。针对黑河流域中游地区的作物分布与种植特点,提出一种基于多时相遥感影像与多分类器组合的作物种植结构提取方法。利用2018年18景16 m分辨率的GF-1 WFV影像,构建NDVI时间序列。根据NDVI时间序列表征的作物季相节律和物候变化规律特点,采用分层的策略,首先解译一级土地覆被类型,再解译二级土地覆被类型。一级土地覆被类型解译中,使用决策树分类方法先将NDVI特殊且易提取的水体进行解译,再使用面向对象分类方法通过分区将需借助NDVI纹理信息提取的建设用地进行解译,最后使用随机森林分类方法解译耕地、林地、草地、裸地和湿地。在对耕地的进一步分类中,使用决策树分类方法首先将具有特殊物候规律且易于区分的苜蓿类别解译出来,再将与其他类别物候差异较大的小麦解译,最后将物候相似的玉米、蔬菜及其他解译。黑河流域中游研究区内一级土地覆被分类总体精度为97.24%,卡帕系数为0.96;作物种植结构解译总体精度为86.58%,卡帕系数为0.80。此外,还分析了影响黑河流域中游研究区解译精度的4个因素:对土地覆被类别的定义、混合像元、影像分割时基础影像的选择以及分类方法的选择。通过对不同分类方法的比较发现,与仅使用最大似然分类方法、支持向量机分类方法或随机森林分类方法相比,本文提出方法的解译结果更好,解译精度更高。
关键词:
Timely and accurate acquisition of cropping structure is crucial for regional water resource management and crop yield estimation. Remote sensing of cropping structure based on multiple-temporal imagery can make full use of temporal featuresfor especially regions with complicated cropping structure.However, how to select remote sensing data and classifier remains a challenge.In this paper, to map the crop distribution and planting characteristicsin the middle reaches of the Heihe River Basin, we proposed a new method by combining multi-temporal remote sensing imagery and multiple classifiers. Eighteen images available from the Gaofen-1(GF-1) satellite in 2018 were applied to construct the time series of normalized differential vegetation index (NDVI) according to the following hierarchical principles: from easy to difficult, from specific to general. The level-1 and level-2 land cover categories were interpreted successively. Specifically, in interpreting level-1 land cover categories, the decision tree classification method was used to ide.pngywater bodies based on NDVI; and then, the object-oriented classification method was used to interpret construction land by NDVI texture information after zoning; and finally, the random forest classification method was used to classify cropland, forest land, grassland, bare land, and wetland. To further classify cropland, the decision tree classification method was used firstly to interpret alfalfa which has special phenology regularity and is easy to distinguish, and then to interpret wheat categories which possess large phenological differences from other categories, and finally to interpret corn, vegetables, and other crops that have similar phenological conditions. The overall accuracy of the level-1 land cover classification and cropping structure interpretation in the study area is 97.24% and 86.58%, respectively, with the kappa coefficient being 0.96 and 0.80, respectively. In addition, four factors affecting the interpretation accuracy of the research area in the middle reaches of the Heihe river basin are analyzed: definition of landcover categories, mixed pixels, selection of basic image in image segmentation and selection of classification method. By comparing different classification methods, Compared with methods which employ only a single classifier (e.g., maximum likelihood classification method, support vector machine classification method, and random forest classification), the proposed method has higher interpretation accuracy.
Keywords:
本文引用格式
边增淦, 王文, 江渊.
BIAN Zenggan.
1 引言
黑河流域是我国西北干旱区典型的内陆河流域,水资源短缺是限制其中游绿洲农业发展、下游生态环境保护的首要原因。近年来,随着土地资源的不断开发,中游地区水资源供需矛盾日益加剧。据统计,该流域的中游绿洲农业用水约占总用水量的80% [1]。因此,及时、准确地获取黑河流域中游地区土地利用/覆盖数据,掌握农作物种植结构信息,对区域水资源管理、农业的精细化管理与生态系统稳定等具有重要意义。
遥感技术因宏观性、综合性和动态性的特点,在获取区域作物种植结构上发挥了重要作用。利用NDVI时间序列表征作物季相节律和物候变化规律特点进行作物分类[2,3,4,5],是开展农业种植结构遥感监测的重要方法之一。近10年来,众多学者对黑河流域的土地利用/覆被情况进行了研究。陈睿等[6]基于滤波后的HJ1A/CCD NDVI时序数据,采用CART算法获得黑河中游2011年和2016年的玉米、小麦种植结构,解译精度高于90.80%;杨思睿等[7]融合高光谱影像和LiDAR数据,借助稀疏多项式逻辑回归分类器分类获得黑河中游航空样带区2012年玉米、土豆等7类作物种植结构,总体精度达94.50%;胡晓利等[8]基于Landsat影像目视解译获得黑河中游2007年和2011年土地覆被信息,总体精度分别为87.68%、94.40%;王志慧等[9]采用决策树和面向对象分类方法对黑河中游航空样带区进行2012年土地覆被分类,总体精度为87.20%;程良晓等[10]基于多期HJ卫星影像,采用决策树分类方法获得张掖市2012年玉米、小麦、大麦以及油菜种植结构,总体精度为86.43%;刘亚群[11]基于多期Landsat 影像,采用决策树分类方法获得黑河流域2007、2012和2014年玉米、小麦、大麦以及油菜种植结构,2012年总体精度为85.51%;仲波等[12]集成了MODIS、HJ-1等多源数据和决策树、支持向量机等多种分类方法,获得黑河流域2013年玉米、小麦等6类作物种植结构,中游作物分类精度为84.09%。
基础数据方面,上述研究多使用30 m空间分辨率的Landsat数据或HJ CCD数据。GF-1WFV数据具有16 m 空间分辨率、重访时间可达2 d,相对于Landsat数据、HJ CCD数据兼具更高的时空分辨率,更适合中小区域农业种植结构遥感监测。
分类方法方面,上述研究多使用决策树、CART等单一分类器对研究区土地覆被进行分类,不同的分类器学习和容错能力不同,对数据源及区域的适用性也存在差异,多分类器组合可以充分单一分类器在特定土地覆被对象中的优势,提高分类精度。
作物类型方面,上述研究多忽略了苜蓿类型以及未考虑一年两季的蔬菜类型,从2018年实地调查看,作物分类过程中苜蓿以及一年两季的蔬菜两种作物类型是不应忽略的。数据时效方面,由于作物比较收益、水资源时空分布不均和国家政策等因素的共同影响,黑河流域的农作物种植结构变化显著,而上述研究中最新的土地覆被数据时间为2016年,且仅包括玉米、小麦两类作物。
本文选择黑河流域中游地区的甘州区、临泽县和高台县作为研究区域,提出一种基于多时相遥感影像与多分类器组合的作物种植结构提取方法,利用2018年18景16 m分辨率的GF-1 WFV影像,构建NDVI时间序列,通过分析不同土地覆被类型的NDVI时序曲线,使用决策树分类、面向对象分类、随机森林分类方法,通过分层分类逐步提取黑河流域中游研究区作物种植结构。
2 研究区概况与数据来源
2.1 研究区概况
黑河流域是中国西北地区第二大内陆流域,中游位于97.20°E-102.12°E、38.08°N-39.57°N,是重要的灌溉农业经济区。黑河流域中游研究区平均海拔约1574 m,多年平均温度6~8 ℃,年降水量约为150 mm,年蒸发能力达1410 mm。该区域是中国重要的商品粮基地和蔬菜生产基地,主要种植玉米、小麦、苜蓿、蔬菜等作物。黑河流域中游研究区位置示意见图1。
图1
图1
黑河流域中游研究区位置及2018年地物样本点分布示意
Fig. 1
Location of the study area in the Middle Reaches of the Heihe River Basin and distribution of sample sites in 2018
2.2 遥感数据
遥感解译所用主要数据为GF-1WFV数据(2018年1月至12月共18期)以及高分二号(GF-2)卫星全色多光谱相机(Panchromatic and Multispectral Sensor,PMS)数据(2018年3月至10月共30景)。覆盖黑河流域中游研究区的GF-1WFV数据详细信息见表1。
表1 覆盖黑河流域中游研究区的2018年GF-1 WFV影像数据列表
Tab. 1
序号 | 采集日期 | 景数 | 传感器 |
---|---|---|---|
1 | 2018-01-08 | 4 | WFV3 WFV3 WFV4 WFV4 |
2 | 2018-02-26 | 2 | WFV3 WFV3 |
3 | 2018-03-06 | 2 | WFV2 WFV3 |
4 | 2018-04-15 | 2 | WFV1 WFV1 |
5 | 2018-05-03 | 2 | WFV4 WFV4 |
6 | 2018-05-14 | 2 | WFV1 WFV1 |
7 | 2018-05-27 | 2 | WFV2 WFV3 |
8 | 2018-06-08 | 2 | WFV1 WFV2 |
9 | 2018-06-21 | 4 | WFV3 WFV3 WFV4 WFV4 |
10 | 2018-07-15 | 1 | WFV2 |
11 | 2018-07-23 | 2 | WFV1 WFV2 |
12 | 2018-08-17 | 2 | WFV2 WFV4 |
13 | 2018-09-07 | 3 | WFV3 WFV3 WFV4 |
14 | 2018-09-19 | 1 | WFV3 |
15 | 2018-09-27 | 2 | WFV2 WFV3 |
16 | 2018-10-22 | 4 | WFV3 WFV3 WFV4 WFV4 |
17 | 2018-11-11 | 1 | WFV2 |
18 | 2018-12-01 | 2 | WFV1 WFV2 |
式中:VFC表示植被覆盖度;NDVI表示混合像元的NDVI值;NDVImax为置信区间内纯植被像元的最大NDVI值,NDVImin为置信区间内纯非植被像元的最小NDVI值。GF-2 PMS影像基于PIEOrtho软件进行正射校正、图像融合和几何精校正预处理,GF-2融合影像分辨率达1 m,用于目视解译选取训练样本和检验样本。为减少因GF-1、GF-2图像分辨率差异引起的样本误选,基于GF-2 PMS图像使用ENVI感兴趣区(ROI)工具选择样本时,ROI需在单类型斑块面积大于48 m×48 m的区域内选取,且ROI外边界与斑块外边界保持至少16 m的距离。样本选取完成后,将ROI转换至GF-1 WFV图像中。
研究中用到的其他数据包括9.6 m分辨率Google Earth卫星影像、30 m分辨率GDEM V2数据。Google Earth影像用于高分卫星影像的预处理。GDEM V2数据用于高分卫星影像的预处理,并归一化处理后(X-Xmin)/(Xmax-Xmin)作为分类器的输入数据。数据统一投影坐标系统为WGS_1984_UTM_zone_47N。
2.3 样本数据
样本数据来源于GF-2融合影像目视解译以及地面调查。其中,从GF-2融合影像上目视解译随机均匀选取耕地、湿地、林地、草地、裸地、水体、建设用地样本,数量分别为:1484、303、353、1242、854、238、294;2018年8月初以及11月末,通过地面调查获得样本共993个,其中耕地样本733个(包括玉米样本348个,小麦样本73个,苜蓿样本66个,蔬菜及其他样本246个),草地样本69个,林地样本104个,裸地样本64个,湿地样本23个。2019年7月末,通过地面调查,选取部分年际变化稳定的林地、湿地一级类别样本,用于补充辅助2018年中游地区土地覆被分类,其中:湿地样本32个,林地样本78个。2018年地物样本点分布示意见图1。这些样本按照7:3的比例,分为训练样本和检验样本。
3 研究方法
3.1 分类系统
参考中国科学院中国土地利用现状遥感监测数据库数分类系统、国家基础地理信息中心全球30 m地表覆盖数据(GlobeLand30)分类系统以及黑河流域土地覆被实际种类和分布情况,确定了黑河中游土地覆被分类系统。黑河流域中游研究区土地覆被分类系统包括耕地、林地、草地、水体、裸地、建设用地、湿地共7个一级类别。在一级类别基础之上,耕地进一步划分为玉米、小麦、苜蓿和蔬菜及其他4个二级类别,草地按照植被覆盖度进一步划分为3个二级类别,即低覆盖度草地(10%~30%)、中覆盖度草地(30%~50%)以及高覆盖度草地(50%以上)。
3.2 分类的总体技术路线
采用分层的策略,遵循先整体后局部、先易后难、先特殊后一般的原则,首先解译一级土地覆被类别,再解译二级土地覆被类别。一级土地覆被类别解译中,使用决策树分类方法先将NDVI特殊且易提取的水体进行解译,再使用面向对象分类方法通过分区将需借助NDVI纹理信息提取的建设用地进行解译,最后使用随机森林分类方法解译其他一级土地覆被类别。在对耕地的进一步分类中,使用决策树分类方法首先将具有特殊物候规律且易于区分的苜蓿类别解译出来,再将与其他类别物候差异较大的小麦解译,最后将物候相似的玉米、蔬菜及其他解译。2018年黑河流域中游研究区农作物类型识别技术流程见图2。
图2
图2
2018年黑河流域中游研究区农作物类型识别技术流程
Fig. 2
Methodological flowchart for the crop mapping in the Middle Reaches of the Heihe River Basin in 2018
3.3 一级土地覆被类别的遥感解译
(1)构建NDVI时间序列数据,以揭示不同植被类型的物候特征。统计2018年黑河流域中游研究区各一级土地覆被类别训练样本不同时期的NDVI均值,绘制NDVI时间序列曲线(图3)。
图3
图3
2018年黑河流域中游研究区一级土地覆被类型NDVI时间序列曲线
Fig. 3
NDVI time series of the level-1 landcover categories in the Middle Reaches of the Heihe River Basin in 2018
(2)采用决策树分类方法将NDVI特征与其他地类差异明显的水体解译出来。决策树分类的基本思想是逐步从原始数据中分离并掩膜每一种目标作为一个图层或树枝,避免此目标对其他目标提取时造成干扰和影响,最终将所有图层复合以实现对图像的分类。水体的NDVI值总体为负值。5-10月,流动性好的水体NDVI值为负值,部分静水或流动很慢的水体受水生植物的影响NDVI值为正值;11月-次年4月,水生植物枯萎或未开始生长,此时静水或流动很慢的水体未受水生植物的影响NDVI值为负值。认为18期NDVI时间序列图像中累计超过3期出现NDVI值为负值的区域,则为水体。水体提取分类依据为满足条件C1,即:
(3)使用面向对象分类方法通过分区分层将建设用地解译出来。面向对象分类的基本思想是先将图像分割成多个具有相同属性特征的均质单元(即对象),然后再采用一定的分类算法对这些均质单元进行分类,包括对象构建和对象分类2个过程。对象构建时,考虑到建设用地多与耕地相邻,不同行政区划种植结构有所差异,从而导致建设用地与耕地多光谱信息差异最大的日期有所不同。因此,将黑河流域中游研究区按行政区划分为3块区域,分别解译建设用地类型。对象分类时,建设用地与草地、裸地的NDVI时间序列曲线比较接近,难以单纯依据NDVI时序列特征有效区分,面向对象分类能够充分利用对象的光谱信息及NDVI标准差等纹理信息,可以较好的提取建设用地[15]。建设用地的面向对象分类分2个阶段进行:第一阶段获取建设用地与部分草地、裸地的混合对象;第二阶段分离出建设用地类型。第一阶段,利用各分区不同时相(甘州、临泽和高台分别采用8月17日、7月23日、 7月15日)的GF-1 WFV多光谱影像进行图像分割,获得二类对象,即建设用地与部分草地、裸地的混合类以及其他类别(包括耕地、湿地、林地等)的混合类,然后对这二类对象分别目视选择一定数量的样本,根据3-11月NDVI时间序列数据的波段平均、最大、最小灰度值属性,采用支持向量机方法区分出这二类对象。第二阶段,针对建设用地与部分草地、裸地的混合对象,再次利用多光谱影像进行图像分割获得建设用地类以及草地与裸地混合类这二类对象,进而对二类对象分别目视选择一定数量的样本,根据DEM最大最小值、全年NDVI时间序列数据标准差,采用支持向量机方法,将建设用地这一类对象解译出来。
(4)采用随机森林分类方法解译NDVI时间序列曲线具有相对明显差异的一级类别:耕地、湿地、林地、草地、裸地。随机森林是通过集成学习的思想将多棵决策树集成的一种算法,其学习过程为:① 随机从训练样本N中有放回地抽样n个作为决策树的输入样本;② 从M个样本特征(即每个样本对应的不同时期的NDVI值)中随机选取m个特征,作为每一个结点的输入样本特征,其中m远小于M;③ 以m个特征的最优分裂作为该结点的分裂规则;④ 每一棵决策树均最大限度地生长,不剪枝;⑤ 生成所有决策树之后,用投票的方法对所有决策树的分类结果进行综合,得出最终结果。随机森林算法需要设定2个重要参数:随机森林树的数量和每颗决策树分类使用的特征数量(m)。随机森林树的数量越大,构建耗时越长,将该值设置为100。每颗决策树分类使用的特征数量越多,模型中每棵决策树稳定性越高,但决策树间相关性也增大。特征数量选择使用Square Root方法,将该值设置为4。输入数据为全年NDVI时间序列数据和NDVI最大值合成数据,导入相应的训练样本,运行随机森林算法将耕地、林地、草地、湿地以及裸地分类结果输出。
3.4 作物种植结构提取
图4
图4
2018年黑河流域中游研究区不同作物的NDVI时间序列曲线
Fig. 4
NDVI time series of the different crops in the Middle Reaches of the Heihe River Basin in 2018
表2 黑河流域中游地区主要作物物候期
Tab. 2
4月 | 5月 | 6月 | 7月 | 8月 | 9月 | 10月 | |
---|---|---|---|---|---|---|---|
玉米 | 播种 | 抽穗 | 收获 | ||||
小麦 | 播种 | 抽穗 | 收获 | ||||
苜蓿 | 播种 | 收割 | 收割 | 收割 |
根据主要作物的物候变化特征,采用决策树分类方法进行作物分类的总体思路是,首先将具有特殊NDVI时序曲线特征的苜蓿类别以及一年两季的蔬菜类别解译出来,再将NDVI时序曲线规则且比玉米和一年一季蔬菜及其他NDVI时序曲线峰值超前的小麦解译出来,再后将NDVI特征明确的玉米类型解译出来,最后将NDVI时序曲线相对杂乱的耕地像元归类为一年一季蔬菜及其他类型。
苜蓿生长周期短,每年可收割多次,其NDVI时间序列曲线一般具有2个甚至多个峰值且伴随着较为强烈的波动。玉米、小麦和大部分的蔬菜及其他一年只种植一季,NDVI时间序列曲线仅有一个峰值且变化相对平缓。对样本进行统计,玉米、小麦、一年一季蔬菜及其他、一年两季蔬菜及其他、苜蓿相邻两期NDVI差值的和分布范围分别为:1.12~1.78、1.08~1.80、1.02~1.76、2.31~2.76、1.83~4.32。苜蓿和一年两季蔬菜及其他分类依据为满足条件C2,即:
一年两季的蔬菜及其他NDVI时间序列曲线有两个峰值,总体变化相对苜蓿NDVI时间序列曲线变化较为平缓,且在蔬菜种植间歇期NDVI变化较小。苜蓿在收割后NDVI值会迅速减小,之后NDVI值又会迅速增加。5月3日-10月22日段NDVI时间序列曲线,苜蓿则至少会出现一次相邻的3个时相NDVI值变化很大,且NDVI值表现为大小大或者小大小的模式。因此,苜蓿分类依据为满足条件C2、C3,其中条件C3为:
小麦的播种和收获时间均比玉米、一年一季的蔬菜及其他提前。5月14日小麦已经开始生长发育,而玉米、一年一季的蔬菜及其他刚刚播种或者还未播种。5月14日小麦、玉米、一年一季蔬菜及其他NDVI分布范围分别为0.31~0.64、0.07~0.24、0.07~0.30。6月21日至7月23日,小麦开始成熟收获,NDVI值逐渐减小;玉米、一年一季蔬菜及其他不断生长,NDVI值逐渐增加。因此,小麦分类依据为满足条件C4、C5,即:
一年一季的蔬菜及其他,从8月中旬开始陆续收获,至9月7日大多已收获,NDVI较小;此时玉米还处于成熟阶段,NDVI较大,10月22日左右玉米收获,NDVI变小。9月7日至10月22日,蔬菜及其他的NDVI差值较小,玉米的NDVI差值则较大。实地调查中以地块(斑块)为单元进行样本标记,每个样本包括多个像元点,玉米与蔬菜及其他各随机选取5000个实地调查像元点,统计10月22日与9月7日的NDVI差值,玉米中89.86%NDVI差值的大于等于0.20,一年种植一季的蔬菜及其他中68.21%NDVI差值的小于0.20。另外玉米和一年一季的蔬菜及其他在9月7日、9月19日NDVI值存在较大差异,加入玉米在这2个日期的NDVI范围有助于提高玉米的提取精度,玉米分类依据为满足条件C4、C6,其中条件C6为:
剩余类别均归类为蔬菜及其他。分类结果中不可避免会存在许多由单个或少数像元组成的小图斑,绝大多数的小图斑都是不符合实际情况的,使用主要分析对分类结果进行分类后处理,中心像元权重设置为1,变换核尺寸为3像元×3像元。
4 分类结果与分析
根据第3节所述方法,获得2018年黑河流域中游研究区土地覆被分类结果,见图5。
图5
图5
2018年黑河流域中游研究区土地覆被分类
Fig. 5
Landcover maps of the study area in the Middle Reaches of the Heihe River Basin in 2018
表3 2018年黑河流域中游研究区一级土地覆被分类混淆矩阵
Tab. 3
类别 | 验证样本 | 总计 | 用户精度 | ||||||
---|---|---|---|---|---|---|---|---|---|
林地 | 裸地 | 湿地 | 水体 | 建设用地 | 耕地 | 草地 | |||
林地 | 92.49 | 0.00 | 10.15 | 0.90 | 1.01 | 0.83 | 0.50 | 3.54 | 82.84 |
裸地 | 0.00 | 99.97 | 0.14 | 0.11 | 1.75 | 0.00 | 0.00 | 18.19 | 99.41 |
湿地 | 3.06 | 0.00 | 64.85 | 1.15 | 0.15 | 0.08 | 0.49 | 0.95 | 61.29 |
水体 | 0.00 | 0.00 | 0.00 | 96.34 | 0.00 | 0.00 | 0.03 | 2.66 | 99.51 |
建设用地 | 0.43 | 0.03 | 0.76 | 0.90 | 90.82 | 0.75 | 0.20 | 5.67 | 94.10 |
耕地 | 1.56 | 0.00 | 20.10 | 0.25 | 1.48 | 97.07 | 0.61 | 26.58 | 97.81 |
草地 | 2.46 | 0.00 | 4.01 | 0.36 | 4.80 | 1.27 | 98.17 | 42.40 | 98.24 |
总计 | 100.00 | 100.00 | 100.00 | 100.00 | 100.00 | 100.00 | 100.00 | 100.00 | - |
制图精度 | 92.49 | 99.97 | 64.85 | 96.34 | 90.82 | 97.07 | 98.17 | - | - |
表4 2018年黑河流域中游研究区作物分类混淆矩阵
Tab. 4
类别 | 验证样本 | 总计 | 用户精度 | |||
---|---|---|---|---|---|---|
苜蓿 | 小麦 | 玉米 | 蔬菜 | |||
苜蓿 | 88.22 | 3.21 | 3.69 | 3.21 | 38.23 | 94.56 |
小麦 | 1.20 | 94.01 | 0.34 | 0.33 | 3.62 | 81.22 |
玉米 | 2.93 | 1.39 | 89.92 | 22.62 | 39.90 | 87.10 |
蔬菜 | 7.65 | 1.39 | 6.05 | 73.84 | 18.25 | 69.77 |
总计 | 100.00 | 100.00 | 100.00 | 100.00 | 100.00 | - |
制图精度 | 88.22 | 94.01 | 89.92 | 73.84 | - | - |
表5 2018年黑河中游研究区一级土地覆被类型面积统计
Tab. 5
区县名称 | 耕地 | 林地 | 草地 | 湿地 | 裸地 | 建设用地 | 水体 | 总计 |
---|---|---|---|---|---|---|---|---|
甘州区 | 1184.79 | 124.72 | 2090.94 | 24.03 | 37.76 | 184.31 | 13.51 | 3660.06 |
临泽县 | 520.19 | 103.19 | 1257.14 | 24.14 | 755.25 | 53.42 | 15.39 | 2728.72 |
高台县 | 528.04 | 85.45 | 1719.02 | 43.89 | 1853.67 | 63.82 | 48.89 | 4342.78 |
总计 | 2233.02 | 313.36 | 5067.10 | 92.06 | 2646.68 | 301.55 | 77.79 | 10731.56 |
表6 2018年黑河流域中游研究区各区县不同作物类型面积统计面积
Tab. 6
区县名称 | 玉米 | 小麦 | 苜蓿 | 蔬菜及其他 | 总计 | |||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
面积/km2 | 比例/% | 面积/km2 | 比例/% | 面积/km2 | 比例/% | 面积/km2 | 比例/% | 面积/km2 | 比例/% | |||||
甘州区 | 932.79 | 78.73 | 41.75 | 3.52 | 41.93 | 3.54 | 168.32 | 14.21 | 1184.79 | 100.00 | ||||
临泽县 | 390.21 | 75.01 | 13.14 | 2.53 | 26.62 | 5.12 | 90.22 | 17.34 | 520.19 | 100.00 | ||||
高台县 | 308.35 | 58.40 | 31.32 | 5.93 | 17.22 | 3.26 | 171.15 | 32.41 | 528.04 | 100.00 | ||||
总计 | 1631.35 | 73.06 | 86.21 | 3.86 | 85.77 | 3.84 | 429.69 | 19.24 | 2233.02 | 100.00 |
5 分类精度影响因素分析
遥感解译的精度受到多方面因素的影响,本文重点从以下4方面进行分析:
(1)对土地覆被类别的定义。土地覆被类别是人为定义的,与卫星传感器的物理信号无关,因此,类别定义与影像之间的矛盾是导致遥感影像土地覆被分类复杂的一个重要原因[16]。准确定义土地覆被类别,降低遥感影像类别定义的模糊性,是保证解译精度的重要前提。以湿地分类为例,图6左侧为真彩色合成影像,右侧为分类结果图,a、b区域存在不同程度的沼泽化(真彩色影像上颜色为深褐色,一般沼泽化程度越高,颜色越深),符合本文湿地的定义。a区域内混有稀疏的树木,同时符合疏林地的定义,分类结果中除白圈标记的沼泽化程度较高的部分被分类为湿地外,其他部分则为湿地与其他一级类别混分。b区域两侧为耕地,右侧凸出部分已开垦种植作物,同时符合耕地的定义,分类结果中湿地与耕地边界不明显,混分较为严重。因此,若不能准确定义区分土地覆被类别以及将定义标准清晰准确表达在遥感影像上,会造成遥感影像解译结果的歧义。
图6
图6
湿地与耕地、林地类别模糊化典例
Fig. 6
Examples of obfuscation between wetland, cropland, and forest land
(2)混合像元。遥感影像的空间分辨率和研究区空间异质性是形成混合像元的两个主要因素。以耕地分类为例,本文解译使用影像的分辨率为16 m,而黑河流域中游研究区有很多宽度在16 m以内田间小路,会存在边界农田、田间小路、行道树等分布在一个像元内的情况。选择田块破碎度不同的3个区域,对比基于GF-2融合影像目视解译与基于GF-1影像自动解译耕地的空间分布和面积,计算自动解译相对于目视解译耕地的解译精度,为减少工作量,目视解译时长宽小于10 m的土地覆被类别忽略。图7中a、b、c区域的面积均为530 605.46 m2,由a区至c区田块破碎程度逐渐增加。解译结果对比中,a区域目视解译与自动解译耕地边界匹配度较好。未被红圈标记的宽度小于16 m的3条田间道路与周围农田形成了混合像元,红圈标记的宽度为21 m的田间道路占据了2个像元的部分,与周围农田也形成了混合像元,因而均没有自动解译出4条田间道路。b区目视解译与自动解译的大斑块耕地边界匹配度较好,小斑块耕地边界匹配度较差。c区域林地斑块之间的耕地斑块或耕地斑块之间的林地斑块,在16 m分辨率影像上多为3个像元宽度,受混合像元的影响,自动解译错分较为严重。对a、b、c区域的解译耕地面积进行统计,耕地自动解译相对精度计算公式为:
由表7统计可知,随着a、b、c区域田块破碎度的增加,耕地解译相对精度逐渐降低,面积估算误差呈现增大趋势。
图7
图7
田块破碎度不同区域的耕地目视解译、自动解译对比
Fig. 7
Comparison of visual and automatic interpretations of cropland in areas with different fragmentation levels
表7 田块破碎度不同区域的耕地目视解译、自动解译面积统计
Tab. 7
a区 | b区 | c区 | |
---|---|---|---|
目视解译耕地面积/m2 | 452302.15 | 359770.24 | 238243.46 |
自动解译耕地面积/m2 | 480768.27 | 388784.19 | 260864.67 |
耕地解译相对精度/% | 93.71 | 91.94 | 90.51 |
(3)影像分割时基础影像的选择。面向对象分类方法进行对象提取时可以基于不同时期的单一时相多光谱影像,也可基于多期NDVI图像进行图像分割。基础图像的选择会影响到对象提取效果,从而对分类结果的精度有很大影响。为了分析这种影响,选取高台县一小片区域(3.76 km×4.95 km), 该区域以耕地和农村自建房为主,房屋具有明显的沿道路两侧分布的特点。通过观察和实验,获得各自情况下的最优对象化效果(图8)。基于7月15日多光谱影像进行影像分割,耕地与建设用地的光谱差异较大,耕地和建设用地均能够很好的分离并保持完整。基于3月6日多光谱影像进行影像分割,耕地此时几乎未种植作物,此时耕地与建设用地的光谱相似,即使将分割对象数目增加,依然还有较多集聚程度低的建设用地与耕地被分为一个对象。基于18期NDVI时间序列图像的分割效果与基于3月6日多光谱影像的分割效果相近。相比之下,基于一景处于作物生长旺季的7月15日多光谱影像进行影像分割,整体分割效果最好。此外,由于不同行政区划种植结构有所差异,从而建设用地与耕地多光谱信息差异最大的日期有所不同。因此,通过分区并基于不同时期多光谱遥感影像进行分割可以进一步提高解译精度。
图8
图8
基于多光谱影像和NDVI图像的分割效果对比
Fig. 8
Comparison of the image segmentation effect based on multi-spectral image versus NDVI image
图9
图9
4种不同分类算法获取的2018年黑河流域中游研究区土地覆被分类结果对比
Fig. 9
Comparison of classification results by four different classification methods in the Middle Reaches of the Heihe River Basin in 2018
表8 多分类器组合与最大似然算法、支持向量机算法、随机森林算法的分类精度对比
Tab. 8
类别 | 多分类器组合 | 最大似然法 | 支持向量机 | 随机森林 | |||||||
---|---|---|---|---|---|---|---|---|---|---|---|
用户精度 | 制图精度 | 用户精度 | 制图精度 | 用户精度 | 制图精度 | 用户精度 | 制图精度 | ||||
林地 | 86.16 | 92.49 | 65.73 | 64.59 | 75.40 | 88.24 | 77.87 | 93.90 | |||
草地 | 98.97 | 98.17 | 94.87 | 89.55 | 93.34 | 97.22 | 94.88 | 98.46 | |||
湿地 | 61.29 | 64.85 | 22.29 | 75.14 | 60.11 | 64.31 | 60.83 | 61.49 | |||
裸地 | 99.41 | 99.97 | 90.71 | 97.12 | 97.41 | 99.62 | 98.83 | 99.74 | |||
水体 | 99.51 | 96.34 | 99.00 | 91.16 | 99.27 | 89.05 | 99.75 | 81.50 | |||
建设用地 | 97.20 | 90.82 | 64.76 | 59.57 | 69.82 | 54.09 | 90.92 | 50.26 | |||
玉米 | 84.56 | 89.71 | 94.83 | 69.67 | 89.20 | 78.19 | 95.43 | 77.63 | |||
小麦 | 80.49 | 94.01 | 84.59 | 85.23 | 90.65 | 88.10 | 89.74 | 85.47 | |||
苜蓿 | 94.51 | 87.59 | 90.60 | 86.71 | 90.10 | 84.13 | 94.29 | 83.00 | |||
蔬菜及其他 | 66.85 | 73.59 | 50.72 | 86.77 | 56.03 | 91.10 | 56.20 | 91.86 | |||
总体精度 | 94.19 | 85.97 | 88.25 | 90.44 | |||||||
Kappa系数 | 92 | 82 | 87 | 88 |
通过混淆矩阵精度评估,对黑河流域中游研究区使用多分类器组合与最大似然算法、支持向量机算法、随机森林算法进行解译的总体精度分别为:94.19%、85.97%、88.25%、90.44%, Kappa系数分别为:0.92、0.82、0.87、0.88。多分类器组合的总体解译精度最高。4种分类方法的水体、裸地以及草地解译结果空间分布大体一致,平均解译精度均超过90.00%,解译精度较高。多分类器组合的建设用地解译结果区县中心呈面状分布,而其他方法解译结果呈点状分布,前者结果更符合作图要求。使用多分类器组合解译的建设用地用户精度为97.20%、制图精度为90.82%,比其他3种分类方法具有更高的解译精度。耕地解译结果中,通过目视解译对比, 4种方法对于沿河灌区内耕地解译结果总体较好,但在非沿河灌区(图9红框标记),多分类器组合解译精度更高,最大似然法将耕地错分为林地严重,随机森林法解译的耕地地块支离破碎,支持向量机法耕地解译效果则介于二者之间。从作物解译结果看,决策树分类具有更高的解译精度,尤其是在蔬菜及其他类别解译时,使用多分类器组合用户精度为66.85%、制图精度为73.59%,用户精度与制图精度较为接近。而其他方法解译的蔬菜及其他类别不仅面积占比过高,而且用户精度和分类精度存在较大差异,这反映了其他3种方法解译效果较差。此外,多分类器组合一级土地覆被类型解译精度均略高于随机森林一级土地覆被类型解译精度,说明了分层分类的策略能够提高解译精度。
6 结论与展望
6.1 结论
本文利用多期GF-1 WFV多光谱影像构建NDVI时间序列,进而依据不同土地覆被类型的NDVI时序曲线,采用分层分类的策略,构建了多分类器组合分类方法,进行了黑河流域中游研究区的地物类型分类及作物种植结构提取。结果表明:
(1)黑河流域中游研究区一级土地覆被分类总体精度为97.24%,kappa为0.96;作物种植结构解译总体精度为86.30%,kappa为0.80。对解译结果进行面积统计,黑河流域中游研究区作物种植面积玉米占比最大,蔬菜及其他次之,最后是小麦、苜蓿。各类型占比分别为73.06%、19.24%、3.86%、3.84%。分区县对比,甘州区玉米种植比例最大,占78.73%,蔬菜及其他种植比例最小,占14.21%;临泽县苜蓿种植最大,占5.12%;高台县小麦、蔬菜及其他种植比例最大,分别占5.93%、32.41%,玉米种植比例最小,仅占58.40%。
(2)遥感解译的精度受到多方面因素的影响,本文对土地覆被类别的定义、混合像元、影像分割时基础影像的选择以及分类方法的选择4个方面进行了分析。这4个方面不同程度地影响了黑河流域中游研究区的解译精度。通过将本文提出的基于多时相遥感影像与多分类器组合的分类方法解译结果与单一的最大似然、支持向量机、随机森林分类方法解译结果进行对比分析,证明本文提出的作物种植结构提取方法具有更好的解译精度。
6.2 展望
作物分类研究往往需要使用作物物候期内甚至全年的多时相遥感数据,因此只能在年底或者第二年获得多时相遥感数据的基础之上才能进行遥感影像作物解译工作。如果能够使用较短的时间序列提前获得作物分类的结果,将使作物分类研究更有意义。单一卫星很难兼具高时间分辨率和高空间分辨率,随着新卫星的发射和数据融合方法的发展,近年来,提出了多种数据融合方法,Gao等[20,21,22,23]提出的时空自适应反射率融合模型(STARFM)以及在此基础上改进的一些模型(ESTARFM、mSTARFM等)是目前应用最广泛的中分辨率图像融合模型。基于时空融合模型尝试高时间分辨率MODIS数据和中高空间分辨率GF1 WFV数据的融合,提取更多物候相关信息,尽可能早的获得作物种植结构,将是值得进一步探索的方向。
参考文献
黑河中游地区作物用水效率比较及种植结构调整方向研究
[J]. ,DOI:10.3724/SP.J.1047.2016.00977 Magsci [本文引用: 1]
<p>黑河流域地处西北干旱区,水资源短缺是限制其中游绿洲农业发展、下游生态环境保护的首要原因。该流域的中游绿洲农业用水约占总用水量的80%,因此农业节水对流域发展至关重要。在干旱区绿洲农业节水探索中,众多学者主张通过节水技术来提高用水效率,而关于农业种植结构调整对农业节水影响的定量研究较少。本文采用2012年黑河流域蒸散发数据、土地利用数据、降水数据和农业经济统计数据,定量分析黑河中游主要作物需水特征和用水效率差异,尝试从调整作物种植结构角度为其绿洲农业节水提供依据。结果表明:(1)研究区4种主要作物中,玉米生长期需水量最大,其次为小麦、油菜和大麦;(2)考虑降水补给,发现大麦和油菜生长需水可很大程度上依赖降水,而小麦和玉米则需要灌溉,且玉米灌溉需水量远超小麦;(3)作物用水效率由高到低依次为大麦、油菜、小麦和玉米。从用水效率角度而言,考虑种植区位,在黑河中游适当扩大小麦种植规模更有利于提高中游农业用水效率。</p>
A comparative study of water use efficiency of different crops in the middle reaches of Heihe River and its implicationsfor planting structure adjustment
[J].DOI:10.3724/SP.J.1047.2016.00977 Magsci [本文引用: 1]
<p>黑河流域地处西北干旱区,水资源短缺是限制其中游绿洲农业发展、下游生态环境保护的首要原因。该流域的中游绿洲农业用水约占总用水量的80%,因此农业节水对流域发展至关重要。在干旱区绿洲农业节水探索中,众多学者主张通过节水技术来提高用水效率,而关于农业种植结构调整对农业节水影响的定量研究较少。本文采用2012年黑河流域蒸散发数据、土地利用数据、降水数据和农业经济统计数据,定量分析黑河中游主要作物需水特征和用水效率差异,尝试从调整作物种植结构角度为其绿洲农业节水提供依据。结果表明:(1)研究区4种主要作物中,玉米生长期需水量最大,其次为小麦、油菜和大麦;(2)考虑降水补给,发现大麦和油菜生长需水可很大程度上依赖降水,而小麦和玉米则需要灌溉,且玉米灌溉需水量远超小麦;(3)作物用水效率由高到低依次为大麦、油菜、小麦和玉米。从用水效率角度而言,考虑种植区位,在黑河中游适当扩大小麦种植规模更有利于提高中游农业用水效率。</p>
Enhancing land cover mapping through integration of pixel-based and object-based classifications from remotely sensed imagery
[J]. ,
Land-cover classification using multi-temporal GF-1 wide field view data
[J]. ,
Scalable parcel-based crop ide.pngication scheme using Sentinel-2 data time-series for the monitoring of the common agricultural policy
[J]. ,
应用Sentinel-2A NDVI时间序列和面向对象决策树方法的农作物分类
[J]. ,
Crop mapping based on Sentinel-2A NDVI time series using object-oriented classification and decision tree model
[J].
基于多源卫星数据的黑河中游绿洲区土地利用分类与作物类型提取及其时空变化分析
[J]. ,
Land classification and spatio-temporal changes of wheat and corn in the middle reaches oasis of Heihe using multi-satellite data
[J].
高光谱与LiDAR数据融合研究——以黑河中游张掖绿洲农业区精细作物分类为例
[J]. ,
Fusion of hyperspectral and LiDAR data: A case study for refined crop classification in agricultural region of Zhangye Oasis in the middle reaches of Heihe River
[J].
Land use/cover change in the middle reaches of the Heihe River basin over 2000-2011 and its implications for sustainable water resource management
[J]. ,
黑河中游绿洲灌溉区土地覆盖与种植结构空间格局遥感监测
[J]. ,<p>以高空间分辨率、高光谱分辨率CASI航空遥感数据作为采样带,对黑河中游绿洲灌溉区土地覆盖和农作物种植结构空间格局进行遥感监测。设计了分层分类方法,综合采用基于像素和基于对象的2种遥感图像分类方法对航空样带区域进行土地覆盖制图。根据实地土地覆盖类型调查与目视解译,对样带土地覆盖和农作物种植结构的分类结果进行精度评价,总体分类精度为84.2%,Kappa系数为0.793。与样带区域2007年Landsat TM/ETM+土地覆盖产品相比,高分辨率CASI航空数据能够对树木、草地与农作物类别进行有效监测。监测结果表明,中游绿洲灌溉区内接近59.1%的地区为裸地与建筑用地;植被覆盖区域占39.8%,其中,农田34.9%,树木5.3%,草地仅有0.1%;而在农田区域中玉米为大宗作物,分类成数占96.1%。研究结果表明高质量与高分辨率的航空遥感数据能够实现对流域下垫面异质性进行有效监测,为生态—水文过程研究提供高分辨率的下垫面类型信息。</p>
Monitoring on land cover pattern and crops structure of Oasis irrigation area of middle reaches in Heihe River Basin using remote sensing data
[J].<p>以高空间分辨率、高光谱分辨率CASI航空遥感数据作为采样带,对黑河中游绿洲灌溉区土地覆盖和农作物种植结构空间格局进行遥感监测。设计了分层分类方法,综合采用基于像素和基于对象的2种遥感图像分类方法对航空样带区域进行土地覆盖制图。根据实地土地覆盖类型调查与目视解译,对样带土地覆盖和农作物种植结构的分类结果进行精度评价,总体分类精度为84.2%,Kappa系数为0.793。与样带区域2007年Landsat TM/ETM+土地覆盖产品相比,高分辨率CASI航空数据能够对树木、草地与农作物类别进行有效监测。监测结果表明,中游绿洲灌溉区内接近59.1%的地区为裸地与建筑用地;植被覆盖区域占39.8%,其中,农田34.9%,树木5.3%,草地仅有0.1%;而在农田区域中玉米为大宗作物,分类成数占96.1%。研究结果表明高质量与高分辨率的航空遥感数据能够实现对流域下垫面异质性进行有效监测,为生态—水文过程研究提供高分辨率的下垫面类型信息。</p>
基于NDVI时间序列影像的张掖市农作物种植结构提取
[J]. ,
Abstract of planting structure of crops in zhangye city based on NDVI time series image
[J].
基于多时相遥感影像的黑河流域农作物种植结构提取研究
[D]. ,
Changes in crop planting structure of the Heihe River basin in China based on the multi-temporal NDVI from TM/ETM+/OLI images
[D]. ,
Finer fesolution land-cover mapping using multiple classifiers and multisource remotely sensed data in the Heihe River basin
[J]. ,
基于MODIS-NDVI的云南省植被覆盖度变化分析
[J]. ,
Analysis of vegetation coverage change in Yunnan Province based on MODIS-NDVI
[J].
新疆植被覆盖度趋势演变实验性分析
[J]. ,
Experimental analysis of spatial and temporal dynamics of fractional vegetation cover in Xinjiang
[J].
结合面向对象方法的多层次干旱与半干旱区域城镇提取方法
[J]. ,DOI:10.11873/j.issn.1004-0323.2015.1.0123 Magsci [本文引用: 1]
<p>在干旱与半干旱区域戈壁及沙漠等高亮地表与城镇连成一片,两者的光谱特征在中等分辨率遥感数据上非常相似;因此,利用基于像素的分类方法很难将城镇准确提取出来。根据两种地物的样本对NDVI、NDBI的分布特征统计分析得出:基于面向对象的分类方法在提取城镇信息方面有较大优势。以典型的干旱区域—黑河流域张掖市及周边地区作为研究区域,将面向对象的方法应用到具有中等分辨率的Landsat-TM数据上,提出了结合面向对象方法的多层次干旱与半干旱区域城镇提取方法。该方法首先使用分层分类的方法得到城镇和荒漠的混合影像,然后使用面向对象的分类方法精确提取城镇信息,其中分割对象过程中引入样本可分离度量化不同尺度的影像分割效果,实现最优尺度分割。结果表明:其目视效果\,总体精度(94.51%)和Kappa系数(0.89),均优于支持向量机(SVM)与基于时间序列的分类方法。</p>
A multi-layerd urban extraction method combining object-oriented classification for the arid and semi-arid regon
[J].DOI:10.11873/j.issn.1004-0323.2015.1.0123 Magsci [本文引用: 1]
<p>在干旱与半干旱区域戈壁及沙漠等高亮地表与城镇连成一片,两者的光谱特征在中等分辨率遥感数据上非常相似;因此,利用基于像素的分类方法很难将城镇准确提取出来。根据两种地物的样本对NDVI、NDBI的分布特征统计分析得出:基于面向对象的分类方法在提取城镇信息方面有较大优势。以典型的干旱区域—黑河流域张掖市及周边地区作为研究区域,将面向对象的方法应用到具有中等分辨率的Landsat-TM数据上,提出了结合面向对象方法的多层次干旱与半干旱区域城镇提取方法。该方法首先使用分层分类的方法得到城镇和荒漠的混合影像,然后使用面向对象的分类方法精确提取城镇信息,其中分割对象过程中引入样本可分离度量化不同尺度的影像分割效果,实现最优尺度分割。结果表明:其目视效果\,总体精度(94.51%)和Kappa系数(0.89),均优于支持向量机(SVM)与基于时间序列的分类方法。</p>
多光谱遥感影像植被覆盖分类研究进展
[J]. ,DOI:10.6046/gtzyyg.2016.02.02 Magsci [本文引用: 1]
<p>利用多光谱遥感影像进行植被覆盖分类是目前遥感技术应用的热点研究领域之一。在广泛调研文献的基础上,综述了近年来多光谱遥感影像植被分类研究现状和进展,较全面深入地分析了各种植被分类特征、分类算法的优缺点、适应性和应用情况,指出了当前面临的难点和挑战,并对未来发展趋势进行了展望。未来多光谱遥感影像的植被分类不仅要从分类算法上进行创新,提高分类器的自动化程度、分类效率和学习速度,扩大适用范围,增强鲁棒性,而且同样不能忽视对植被分类新特征的挖掘,提高特征的可分性,融合多源数据、利用多时相影像、挖掘更多新特征参与植被分类是未来的发展趋势。</p>
Progress in the study of vegetation cover classification of multispectral remote sensing imagery
[J].DOI:10.6046/gtzyyg.2016.02.02 Magsci [本文引用: 1]
<p>利用多光谱遥感影像进行植被覆盖分类是目前遥感技术应用的热点研究领域之一。在广泛调研文献的基础上,综述了近年来多光谱遥感影像植被分类研究现状和进展,较全面深入地分析了各种植被分类特征、分类算法的优缺点、适应性和应用情况,指出了当前面临的难点和挑战,并对未来发展趋势进行了展望。未来多光谱遥感影像的植被分类不仅要从分类算法上进行创新,提高分类器的自动化程度、分类效率和学习速度,扩大适用范围,增强鲁棒性,而且同样不能忽视对植被分类新特征的挖掘,提高特征的可分性,融合多源数据、利用多时相影像、挖掘更多新特征参与植被分类是未来的发展趋势。</p>
An assessment of the effectiveness of decision tree methods for land cover classification
[J]. ,
Dubé. A comparison of pixel-based and object-based image analysis with selected machine learning algorithms for the classification of agricultural landscapes using SPOT-5 HRG imagery
[J]. ,
Effects of pre-processing methods on Landsat OLI-8 land cover classification using OBIA and random forests classifier
[J]. ,
A flexible spatiotemporal method for fusing satellite images with different resolutions
[J]. ,
An improved image fusion approach based on enhanced Spatial and temporal the adaptive reflectance fusion model
[J]. ,
An enhanced spatial and temporal adaptive reflectance fusion model for complex heterogeneous regions
[J]. ,
On the blending of the Landsat and MODIS surface reflectance: Predicting daily Landsat surface reflectance
[J]. ,
/
〈 | 〉 |