矮马预报具有技术手段的独立性,我们的技术相对来说是不同于其他开发者的,这种独立性提供了科学上的多样性,对提高我国空气质量预报的整体水平是多有裨益的,也是作为政府机构“第三方独立预报”的技术保证。另外,矮马预报是不依附于任何组织和机构的,矮马预报赖以生存的基础就是其预报的准确性,失掉准确性的优势,它就会被其他类似的预报系统所取代,因此我们坚持不懈始终以研发状态维护矮马预报产品。只有做到这两点,矮马预报才能生存。我们敢于在网站上实时发布头一天的全国重点城市预报和实测日报截图的情况对比(见矮马预报“历史评估”网页),是一种自信的表现,同时也是鞭策自己的一种手段,时刻激励我们,不懈努力维持矮马预报的准确性。
矮马预报目前遇到的最大“困境”来自无法获取经过质量控制的监测数据。在缺失经过质量控制的监测数据的情况下,严格、科学地检验模式预报结果甚至准确地判断预报准确性都变得问题重重。目前监测总站的实时监测数据发布系统,相对以往来说已经是一个非常大的进步,但是这个所谓的数据公开还是远远不够的。一是没有办法获取经过质量控制的空气质量监测数据,二是即使这些原始数据的发布也采用了特别的编程手段防止自由下载,三是这1000个左右的监测站点的经、纬度坐标也是不能透露的秘密。这些无疑给我国空气质量数值预报事业拖了后腿,是进行数值预报性能评估并助以提高预报准确性的最大障碍。同时这也是阻碍整个灰霾相关科学研究健康发展的无形阻力。矮马预报迫不得已,采取了对比重点城市实测日报截图的办法来展示其历史评估记录(见矮马预报“历史评估”网页),让普通公众对矮马预报的预报能力或者预报准确程度有一个直观认识。如果将来监测总站实施严格的监测数据质量控制并定期公开发布质量控制后的数据,矮马预报会实时公布严格的站点预报和实测数据比对,为地方政府空气质量预报员以及普通公众提供各地的矮马预报误差水平数据。这些数据可进一步为公众使用矮马预报产品提供误差范围参考以及可信度水平参考。
那么矮马预报目前的这个“历史评估”同严格意义上的预测和实测对比评估有哪些差别,我们应该怎样正确解读当前的矮马预报“历史评估”呢?
相信您已经通过阅读“电脑如何预测空气质量?”以及“电脑预测空气质量靠谱吗?”,对矮马预报如何进行数值计算从而预报空气质量有了大概的了解,也对有哪些因素可能造成矮马预报的预测误差有了一定的认识。我们经由这些知识可以知道,如果矮马预报能够在“历史评估”网页,展示矮马预报格点预报数值与全国所有监测站点的实测数据的一一对应的比对评估,而这个评估误差是在长期平均为20%或者30%左右(根据预报物种而不同),那么矮马预报的预报准确性将是国际先进的。遗憾的是,由于目前矮马预报无法获取相应的经过质量控制的监测数据,我们未能实现严格学术意义上的“历史评估”,只能用对比监测总站的全国重点城市实测日报截图来代替。
然而对比监测总站的全国重点城市实测日报截图是会进一步引入误差的,这个额外的误差并不是来自空气质量模式的预报误差,而是应该称为“比对方式误差”。因为我们进行的不是严格的点对点比对,而是一点对多点平均的比对。正如我们在矮马预报“答疑解惑”网页上解释的,矮马预报的重点城市预报产品是针对重点城市市中心、人口稠密的有限地区作出的,提取的是该市市中心点位经、纬度所在的预报格点的预测数值。然而全国所有的重点城市基本上都具有较大的城市范围,都有多于一个的空气质量监测点位。比如北京或者上海这样的大都市甚至有超过10个的国控站点。中国环境监测总站的城市实测日报值实际上是该城市所有国控站点的空气质量指数平均值。因此这时矮马预报的重点城市预报与中国环境监测总站的城市实测日报并不是理论上一一对应的。在空气污染较为严重时,也就是当空气污染往往表现为PM2.5或者臭氧污染时,由于这时这两种污染物都主要是二次污染物,其特征是在大的范围内混合均匀,因此矮马预报的城市预报同重点城市实测日报值仍然有较高的可比性。但是需要注意的是,由于城市市中心大量排放氮氧化物,加上一氧化氮对臭氧的滴定消耗效应,使得臭氧浓度在市区中心往往较城市下风向偏低很多,因此会造成矮马预报的城市预报产品在臭氧季节对大都市地区的臭氧预报同城市实测日报相比数值偏低。同时,PM2.5毕竟有相当比例的成分来自一次排放,因此PM2.5在都市地区的空间分布上也具有一定的梯度,主要表现为城市市中心区由于交通拥堵严重、排放密度相对更高,则易造成矮马预报的PM2.5数值往往高于监测总站的城市实测日报值。
上面这一点结合对比矮马预报的空间分布图与监测总站的重点城市实测日报截图更容易理解一些。比如昨天(9月12日)的矮马预报预测北京市市中心地区为轻度污染,而对应的北京市实测日报是良,看起来预报误差很大。但是我们仔细观察矮马预报的空间分布图可以发现,矮马对北京这天的预报除了市区中心及周边小部分地区是轻度污染外,预报的数值在北京市范围内大部分地区都是良,甚至在其北部小部分地区预报为优。因此,如果取矮马预报在北京市所有国控监测站点的预报数值并取平均的话,矮马预报和监测总站的实测日报的对比结果将要接近得多。而且,从两图的对比上我们可以清楚地看到,矮马预报准确的捕捉到了由城市实测日报显示出来的分别以鞍山,唐山以及淄博和潍坊为代表的三处范围不小的区域污染。
上海(以及武汉,合肥,南昌)也是同样的情况。矮马预报对上海给出中度污染的城市中心区预报,而监测总站的实测日报则显示为良,差异很大。但是实际上,从矮马预报的空间分布图上我们可以看到,在上海市范围内,只有市中心区以及其西边狭长地带是中度或者轻度污染,上海大部分地区为良,西南部更是预报为优。也就是说如果对矮马预报也取所有国控监测点位的预报数值平均,很可能城市预报值也是良。另外,矮马预报空间分布图上长三角地区的良和优的空间范围分布也很好地吻合了监测总站的城市实测日报图体现出来的空气质量地理分布上的基本状况。
最后,我们还应该理解的是,监测总站的全国重点城市实测日报截图是根据空气质量指数的等级来着色的。然而我们知道,当矮马预报的预报数值着色与监测总站实测日报的着色不同但是属于相邻等级时,也并不意味着实际的预报浓度误差有多大。总之,严格、科学的误差评估需要对比具体的空气污染物浓度数值。
如何正确解读矮马预报的“历史评估”?
https://www.zro-orz.com/ophtha1201a/2016/05/30/a8/