Serious air pollution has recently aroused wide public concerns in China. The traditional method of quantitative remote sensing model is not only sophisticated but also inaccurate to fetch the exact PM2.5 data near the ground. Though the built-up ground monitoring stations can now provide sufficient PM2.5 observation data with high sampling frequency, there still exist many extreme outliers due to inevitable observation noise. Therefore, in this study, we adopted Kalman filter for optimal estimation of time-series of air quality data in 338 cities of China and comprehensively analyzed the spatiotemporal distribution pattern during the period of 2015. In our detailed analysis, we used DTW based K-Medoids clustering to classify cities into 4 levels according to their contamination degree, and utilized q statistic technique to evaluate the spatial stratified heterogeneity of PM2.5. The results show that by using Kalman filter, noise can be effectively reduced and value of PSNR can be significantly improved. In the study of temporal distribution, we found that PM2.5 followed a ‘U’ curve in yearly temporal distributions while daily temporal distributions obeyed a ‘W’ curve. PM2.5 density is much higher in winter than in summer in China, and spatial stratified heterogeneity is even more pronounced during the fall-winter stage. In the study of spatial distribution, it can be clearly seen that PM2.5 appears a ‘Dual-core’ pattern across China where concentration of PM2.5 spiked at Xinjiang and North China plain. In contrast, Xizang, Guangdong and Yunnan are more stable areas with excellent air quality, ranking first-tier nationwide.
传统的PM2.5的研究主要利用卫星观测数据,通过遥感反演气溶胶光学厚度(AOT)来揭示PM2.5的分布规律[5-8]。但是,利用遥感反演方法数据更新周期长,难以揭示不同时间尺度(季节、月、日)的PM2.5浓度变化规律,也难以反映近地面PM2.5浓度的空间分布格局[9]。2012年以来,中国陆续在全国各城市建设了空气质量监测站,并实时监测和发布PM2.5等6项污染物浓度数据。监测站的数据更新周期为1 h,因而能揭示不同时间尺度的PM2.5变化规律。武装[10]等利用监测数据,基于Hadoop平台进行了空气污染时空分布的可视化分析,王振波等[11]基于中国2014年190个城市的945个监测站的PM2.5浓度观测数据,采用空间数据统计模型,揭示了中国PM2.5的时空分布格局。然而,时空维度上的直观统计量只能揭示特定城市的时间变化规律,而不能反映其与其他城市的相关性。而且,由于测量噪声的存在,采用均值滤波处理监测站数据不能反映PM2.5浓度的真实分布。
在Kalman滤波的基础上,本研究获取了中国各城市PM2.5浓度的月度变化。为了有效分析不同地区PM2.5浓度的时间分布差异,本研究采用基于动态时间规整(Dynamic Time Warping, DTW)的K-Medoids聚类方法,对各个城市的PM2.5浓度分布分级划分。
本研究采用DTW对2个时间序列进行动态规整,并基于DTW路径的长度来衡量2个时间序列之间的相似度。同时,采用AP(Affinity Propagation)[32]算法初始化聚类中心,来减小随机选择对聚类结果的影响。AP算法在初始过程将所有数据点作为潜在的聚类中心,数据点之间通过吸引度和归属度之间的信息传递来竞争聚类中心和选择归属的聚类中心[33-34],以此获得几个具有代表性的聚类中心。另外,为了精确化聚类数目,本研究引入Silhouette来评估聚类结果的合理性。Silhouette是Rousseeuw[35]提出的评价每个数据对象与其所属类别的适宜度的指标,它基于数据点与类内其他数据点和其他类中数据点之间的距离来衡量类内凝聚度和类间离散度[36],从而确定最适宜的聚类数目[37]。对于Y类中的某个数据对象
PM2.5的观测值存在时间差异性,而且由于不同城市监测环境和设备条件、自然社会环境、PM2.5浓度分布不同,城市观测值的空间分布具有较大差异性。本研究基于Kalman滤波进行观测数据的最佳估计,为了评估Kalman滤波最佳估计与观测值的优劣,本研究选取北京、上海、广州、南京的24 h的PM2.5浓度分析发现(表1),滤波后数据PSNR明显提高,信号失真度明显降低。因此,采用Kalman滤波对数据进行滤波处理能有效地去除噪声,更好地反映数据真实分布。
表1 Kalman滤波前后PSNR值对比表
Tab.1 PSNR value before and after Kalman filtering
地区 | 滤波前 | 滤波后 |
北京 | 12.8132 | 21.0545 |
上海 | 9.7523 | 14.9660 |
广州 | 13.2474 | 19.1636 |
南京 | 17.9053 | 27.0554 |
4.1.1 时间分布分析
2015年1-12月中国PM2.5平均浓度为49 μg/m3,按照中国环境空气质量(GB 3095-2012)PM2.5浓度年、日均限值为15 μg/m3和35 μg/m3的标准,中国超过一半(51.95%)的城市空气质量不达标,而且PM2.5浓度呈现明显的“冬高夏低”分布模式(图4(a))。研究发现[11,38],原因主要是冬季土壤干燥,地表植被覆盖少,地面扬尘容易进入空气中,且冬季中国北部大范围地区供暖燃烧产生大量污染性气体[39],因此冬季PM2.5浓度最高,达到了71.02 μg/m3。夏季降雨量最大,天气系统变化较强,PM2.5浓度最低[40],为31.02 μg/m3。春秋季由于天气系统转换,常伴随着不稳定的天气系统变化,气候扩散条件较好[41],PM2.5浓度分别为40.42 μg/m3和41.79 μg/m3。
图4 中国PM2.5季度和月度平均浓度
Fig.4 Quarterly and monthly average concentrations of PM2.5 in China
中国的PM2.5浓度月度变化曲线呈“U”形 (图4(b)),2-5月PM2.5浓度呈快速下降趋势,6-9月PM2.5浓度维持在较平稳水平,7月天气炎热,扬尘严重,因而PM2.5浓度略微上升。10-12月PM2.5呈现明显的上升趋势。1月PM2.5浓度最高,达到77.31 μg/m3,超过75 μg/m3的浓度标准。2月、3月和10-12月的PM2.5浓度在35 μg/m3和75 μg/m3之间。5月PM2.5浓度下降为34.14 μg/m3,8月浓度最低,为29.93 μg/m3,5-9月PM2.5浓度均在35 μg/m3以下。
中国的PM2.5逐小时浓度呈双峰变化(图5),双峰分布在上午10-12时和夜间21-22时,PM2.5浓度分别达到了45.78 μg/m3和44.86 μg/m3。研究发现[39],10时开始地表太阳辐射增强,人群活动频率逐渐增加,污染排放开始积累,从而导致PM2.5含量升高。另外,20时下班晚高峰和人群夜生活的影响致使夜间20-22时PM2.5含量达到峰值。而下午由于温度升高,局部地表差异较大,空气对流增强,使得颗粒物浓度有所降低,最低为34.73 μg/m3。3-6时,人类活动对空气质量的影响最弱,PM2.5含量稳定并轻微降低。
4.1.2 空间分布分析
从本文基于一维线性Kalman的PM2.5时空分布分析模型的的实验结果来看,中国PM2.5的分布呈现明显的空间异质性[42]。从PM2.5浓度年均值来看,中国PM2.5浓度分布呈现以“新疆-华北平原”为中心的双核分布特征,这与王振波的结论[11]基本符合。如图6所示,作为双核分布的核心,新疆喀什地区以及华北平原的河北南部、山东西部、河南北部和山西东南部PM2.5浓度高达70~80 μg/m3,并向四周扩散衰减。研究表明,河北、河南、山东等区域的常年PM2.5高浓度分布主要来源于人为污染,重工企业高源排放产生大量大气污染物[43],加之地形和气象要素的影响[39],形成相互输送的重污染区[44]。核中心附近的新疆大部、辽宁、湖北、山西、安徽、江苏PM2.5浓度达到了50~60 μg/m3,吉林、陕西、宁夏、四川、重庆、湖南、浙江等地PM2.5年均浓度为40~50 μg/m3,青海、甘肃北部、内蒙古北部、黑龙江北部及广西、广东、江西等地区PM2.5年均浓度维持在30~40 μg/m3,西藏、云南、海南、珠江三角洲地区、福建、空气质量良好,年均浓度为20~30 μg/m3,低于GB 3095-2012年均限值35 μg/m3。西藏、云南人口稀疏,开发强度不大,且植被覆盖度高,因此PM2.5含量很低,空气质量高。海南、福建为沿海省份,由于空气强对流和海水的吸收作用,可吸入颗粒物含量极低。
图6 2015年中国PM2.5平均浓度空间分布图
Fig.6 Spatial distribution of average PM2.5 concentration in China in 2015
图7表现了中国PM2.5空间分布的月度变化特征。1月,中国超过50%的地区PM2.5浓度超过 75 μg/m3,尤其是华北平原和湖北,其月均PM2.5浓度超过了100 μg/m3,部分城市超过120 μg/m3。2月全国PM2.5浓度有所下降,但以湖北和华北平原为中心的地区空气中颗粒物月均浓度依旧在75 μg/m3以上。3-9月中国大部分地区空气质量较良好,而从4月开始新疆西北部的喀什地区出现较严重的颗粒物污染现象,且其浓度超过了125 μg/m3。薛江丽等[44]研究发现新疆在春季沙尘暴期间(3-5月)PM2.5浓度明显上升,而且春季天气交替造成沙尘天气频繁,因此春季新疆PM2.5浓度较高。10月开始,华北平原和新疆地区空气状况开始变差。11月,以吉林、辽宁为中心的东北地区空气中颗粒物含量急剧上升,超过了100 μg/m3。12月,重度污染区开始南移,甘肃以东、长江以北的地区几乎都受重度污染影响,而西北的新疆地区也维持较高的PM2.5浓度。
图7 中国2015年1-12月PM2.5浓度空间分布图
Fig.7 Spatial distribution of PM2.5 concentration in China in 2015
图8 Silhouette值随类别数目变化图
Fig.8 The variation of Silhouette values with the changes in number of categories
图9反映了采用K-Medoids进行城市聚类后, 4个类别的聚类中心。从图9可以明显地看出,第 1类城市的月度PM2.5浓度变化最大,且平均浓度最高,污染最严重,PM2.5浓度除了在3月和5月存在小型的上升趋势,其一年的变化趋势基本符合“U”型分布。第2类城市的PM2.5平均浓度低于第1类,且月度变化不大,均处于15~50 μg/m3之间。第3类和第4类分布规律近似,且平均浓度最低,但第4类在1-8月浓度均低于第3类,而进入10月之后PM2.5浓度反而高于第3类。
图11 基于K-Medoids的城市PM2.5浓度聚类结果图
Fig.11 Clustering results of PM2.5 concentrations of cities based on K-Medoids
从时间维度分析,中国PM2.5浓度呈现出春夏低、秋冬高的变化模式,冬季远远高于夏季,部分地区浓度超过200 μg/m3;日均PM2.5浓度呈现以10-12时和21-22时为峰值的“W”形分布。从空间维度分析,中国超过半数地区的PM2.5浓度超过国家标准(年度平均浓度不超过35 μg/m3),且严重超标的地区主要分布在以华北、江淮平原和塔里木盆地为核心的地区,PM2.5浓度以这些核心区域为中心向四周减弱分布,青藏高原、云贵、广西、广东、福建以及内蒙古东北部等地区的空气质量相对良好。
〈 |
〉 |