區(qū)域自動(dòng)站數(shù)據(jù)質(zhì)量分析與評(píng)估

時(shí)間:2022-11-04 11:16:43

導(dǎo)語(yǔ):區(qū)域自動(dòng)站數(shù)據(jù)質(zhì)量分析與評(píng)估一文來(lái)源于網(wǎng)友上傳,不代表本站觀點(diǎn),若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。

區(qū)域自動(dòng)站數(shù)據(jù)質(zhì)量分析與評(píng)估

常規(guī)氣象觀測(cè)數(shù)據(jù),尤其是空間密度較高的區(qū)域自動(dòng)站觀測(cè)數(shù)據(jù),是制作天氣預(yù)報(bào)和氣候預(yù)測(cè)的基礎(chǔ)資料,其正確與否直接影響著天氣預(yù)報(bào)和氣候預(yù)測(cè)的質(zhì)量[1-3]。近年來(lái),國(guó)內(nèi)外針對(duì)自動(dòng)站觀測(cè)資料質(zhì)量控制已作了大量研究,為自動(dòng)站質(zhì)量控制的業(yè)務(wù)應(yīng)用奠定了良好的基礎(chǔ)[4-8]。氣象資料業(yè)務(wù)系統(tǒng)(簡(jiǎn)稱MDOS)就是在此基礎(chǔ)上研發(fā)的一個(gè)集數(shù)據(jù)傳輸監(jiān)控、質(zhì)控信息處理與查詢反饋、基礎(chǔ)信息管理、產(chǎn)品制作與數(shù)據(jù)服務(wù)、元數(shù)據(jù)處理于一體的業(yè)務(wù)平臺(tái)。本研究基于MDOS中區(qū)域自動(dòng)站小時(shí)數(shù)據(jù)的質(zhì)控結(jié)果,重點(diǎn)就MDOS正式運(yùn)行之后廣東省區(qū)域自動(dòng)站小時(shí)數(shù)據(jù)的質(zhì)量進(jìn)行分析和評(píng)估,希望能夠?yàn)樘鞖鈶?yīng)用提供可信性參考,以進(jìn)一步提高中小尺度天氣系統(tǒng)的預(yù)報(bào)準(zhǔn)確率和預(yù)警能力。

1考核區(qū)域自動(dòng)站數(shù)據(jù)質(zhì)量

1.1考核標(biāo)準(zhǔn)。按數(shù)據(jù)上傳時(shí)效考核與否,區(qū)域自動(dòng)站分為考核站和非考核站。本研究首先利用國(guó)家氣象局業(yè)務(wù)內(nèi)網(wǎng)的廣東省2015年7月至2018年12月考核區(qū)域自動(dòng)站資料質(zhì)量,對(duì)資料可用率、錯(cuò)誤率、可疑率、缺測(cè)率進(jìn)行統(tǒng)計(jì)分析??己藰?biāo)準(zhǔn)中所使用的質(zhì)控碼是Z文件質(zhì)控碼,Z文件質(zhì)控碼及其描述如表1所示??捎寐实姆肿訉?duì)應(yīng)于一體化的質(zhì)控碼為0、3、4的數(shù)據(jù)個(gè)數(shù);錯(cuò)誤率對(duì)應(yīng)于一體化數(shù)據(jù)質(zhì)控碼2的個(gè)數(shù);可疑率對(duì)應(yīng)于一體化數(shù)據(jù)質(zhì)控碼1的個(gè)數(shù);可用率、錯(cuò)誤率、可疑率分母均對(duì)應(yīng)于考核要素個(gè)數(shù);缺測(cè)率分子由3部分?jǐn)?shù)據(jù)累加得到:1)考核要素中,質(zhì)控碼為8的個(gè)數(shù);2)考核要素中,質(zhì)控碼為7(無(wú)觀測(cè)任務(wù))的要素個(gè)數(shù);3)快速質(zhì)控文件未上傳的考核站的考核要素個(gè)數(shù),分母對(duì)應(yīng)于考核要素個(gè)數(shù)。1.2考核區(qū)域自動(dòng)站總體質(zhì)量評(píng)價(jià)。圖1反映了自MDOS正式運(yùn)行以來(lái),區(qū)域自動(dòng)站的各月平均可疑率及錯(cuò)誤率隨月份的分布情況。由圖1可知,考核區(qū)域站的錯(cuò)誤率各月份普遍偏低,冬季(12月—次年2月)錯(cuò)誤率接近于0,而可疑率冬季相對(duì)其他季節(jié)偏高,12月為013%。但是與缺測(cè)率橫向比較發(fā)現(xiàn),二者對(duì)可用率的影響較小,貢獻(xiàn)最大月份也低于014%,相對(duì)而言,其影響可以忽略。圖1考核區(qū)域自動(dòng)站疑誤率隨月份變化2015年7月至2018年12月廣東省考核區(qū)域自動(dòng)站月平均可用率、缺測(cè)率的分布如圖2所示。由圖2可知,可用率存在明顯的季節(jié)變化趨勢(shì),秋冬季節(jié)較好,數(shù)據(jù)可用率均達(dá)到975%以上。4月以后逐漸變差,7—10月是一年中數(shù)據(jù)可用率最差的時(shí)段,這與廣東省的汛期(4—10月)基本一致。結(jié)合各月平均缺測(cè)率隨月份變化曲線可知,考核區(qū)域站可用率隨月份變化的趨勢(shì),與缺測(cè)率變化有明顯的對(duì)應(yīng)關(guān)系,可用率與缺測(cè)率的皮爾遜相關(guān)系數(shù)高達(dá)-0999,通過(guò)了顯著性為1%的顯著性檢驗(yàn)。導(dǎo)致區(qū)域自動(dòng)站要素缺測(cè)的因素有移動(dòng)通信故障、數(shù)據(jù)采集處理軟件故障、臺(tái)站儀器故障以及質(zhì)控確認(rèn)缺測(cè)4個(gè)方面,結(jié)合廣東省幾類故障情況,統(tǒng)計(jì)同時(shí)段區(qū)域站數(shù)據(jù)缺測(cè)率可以發(fā)現(xiàn),通訊故障和數(shù)據(jù)采集處理軟件故障由于其影響范圍廣,是目前影響區(qū)域自動(dòng)站數(shù)據(jù)缺測(cè)率的主要原因,約占所有缺測(cè)情況的75%以上。1.3考核區(qū)域自動(dòng)站要素質(zhì)量分析。區(qū)域自動(dòng)站按觀測(cè)要素個(gè)數(shù)可分為4要素站(溫度、雨量、風(fēng)向、風(fēng)速)和6要素站(溫度、雨量、風(fēng)向、風(fēng)速、氣壓和相對(duì)濕度)2種。考核區(qū)域站各要素的正確率、錯(cuò)誤率、可疑率及缺測(cè)率統(tǒng)計(jì)結(jié)果如圖3所示。由圖3可知,經(jīng)過(guò)MDOS質(zhì)量控制后的區(qū)域自動(dòng)站考核要素的錯(cuò)誤率及可疑率均較低,二者加起來(lái)也不到總量的05%,對(duì)各要素可用率影響較大的均為缺測(cè)率,氣溫、風(fēng)速和降水的缺測(cè)率為2%左右,而氣壓和相對(duì)濕度相對(duì)較高,氣壓缺測(cè)率為50%,相對(duì)濕度缺測(cè)率為87%??紤]缺測(cè)率對(duì)數(shù)據(jù)可用率的影響較大,本研究進(jìn)一步對(duì)各要素缺測(cè)率月分布情況進(jìn)行分析,所得結(jié)果如圖4所示。由圖4可以看出,各要素2—5月缺測(cè)率普遍較高,4月達(dá)到最大值,此后缺測(cè)率開始降低,7—9月較低,10月以后缺測(cè)率分布又有抬升趨勢(shì)。氣溫、風(fēng)速和降水的缺測(cè)趨勢(shì)基本一致,對(duì)各要素缺測(cè)率進(jìn)行兩兩相關(guān)性檢驗(yàn),所得結(jié)果可以看出各要素缺測(cè)率相關(guān)性均較好,并且相關(guān)性均通過(guò)了顯著性為1%的相關(guān)性檢驗(yàn)。

2MDOS質(zhì)量評(píng)估系統(tǒng)中區(qū)域自動(dòng)站數(shù)據(jù)質(zhì)量

2.1各地市省級(jí)查詢與臺(tái)站反饋情況統(tǒng)計(jì)及時(shí)反饋率指疑誤信息的“查詢時(shí)間”與“反饋時(shí)間”之間的間隔未超過(guò)24h的數(shù)據(jù)個(gè)數(shù)占總下發(fā)疑誤數(shù)據(jù)的比例,它能夠量化反映臺(tái)站對(duì)疑誤信息的及時(shí)處理情況,目前在廣東省作為臺(tái)。站對(duì)于MDOS疑誤信息反饋的考核標(biāo)準(zhǔn)存在。2016—2018年,廣東省氣象局發(fā)往臺(tái)站的總疑誤信息查詢數(shù)為270766條,從反饋時(shí)效來(lái)看,及時(shí)反饋率為9307%、超時(shí)反饋率為682%、未反饋率為011%。利用MDOS質(zhì)量評(píng)估規(guī)則,分別對(duì)全省21個(gè)地市反饋及時(shí)率進(jìn)行統(tǒng)計(jì)可知,東莞、深圳、中山3市臺(tái)站及時(shí)反饋率較高,均達(dá)到98%以上,而汕頭、河源、茂名、清遠(yuǎn)的及時(shí)反饋率較低,均低于90%。2.2區(qū)域自動(dòng)站疑誤信息統(tǒng)計(jì)。MDOS平臺(tái)質(zhì)量控制結(jié)果的疑誤類型分為錯(cuò)誤、可疑、缺測(cè)3類,2016—2018年區(qū)域自動(dòng)站共產(chǎn)生了978691條疑誤信息,系統(tǒng)判斷或人工判斷為錯(cuò)誤的數(shù)據(jù)共計(jì)80252條,占據(jù)異常數(shù)據(jù)總體的82%;而可疑數(shù)據(jù)較多,占異常數(shù)據(jù)總體的622%;置缺測(cè)處理的疑誤信息共有289694條,占所有疑誤信息的296%。區(qū)域自動(dòng)站數(shù)據(jù)的缺測(cè)過(guò)多,一是由于觀測(cè)設(shè)備故障或者通訊異常[9]導(dǎo)致的數(shù)據(jù)缺測(cè);二是由于觀測(cè)數(shù)據(jù)經(jīng)過(guò)質(zhì)量控制后被標(biāo)記為疑誤數(shù)據(jù),經(jīng)過(guò)反饋審核后確認(rèn)為錯(cuò)誤數(shù)據(jù),但無(wú)可用數(shù)據(jù)替代,所以當(dāng)成缺測(cè)處理。分析不同要素的疑誤信息條數(shù)的結(jié)果(圖略)可知,區(qū)域自動(dòng)站產(chǎn)生疑誤信息較多的要素分別為氣壓(32%)、濕度(35%)、風(fēng)(18%),其中,氣壓的疑誤信息較多主要是由于廣東省土地面積大約3/5是坡地和丘陵[10],受海拔高度影響,氣壓經(jīng)常會(huì)提示未通過(guò)內(nèi)部一致性檢查等疑誤信息;風(fēng)要素疑誤信息共181681條,極大風(fēng)速、最大風(fēng)速出現(xiàn)時(shí)間不在觀測(cè)時(shí)間范圍內(nèi),存在較多錯(cuò)誤。2.3區(qū)域自動(dòng)站疑誤信息質(zhì)控方法統(tǒng)計(jì)。由2016—2018年廣東省區(qū)域自動(dòng)站產(chǎn)生的所有疑誤信息所采用的質(zhì)控方法(圖略)可以看出,區(qū)域自動(dòng)站數(shù)據(jù)的978691條疑誤信息,主要由于數(shù)據(jù)未通過(guò)內(nèi)部一致性檢查及人工檢查得到,二者共占了所有疑誤信息引起原因的637%,快速質(zhì)控(154%)、范圍值檢查(81%)及包含多重檢查在內(nèi)的其他檢查(58%)也是發(fā)現(xiàn)疑誤信息的主要檢查方法;而未通過(guò)界限值檢查、持續(xù)性檢查、時(shí)變檢查、空間一致性檢查的疑誤信息共有67627條,占所有疑誤信息引起原因的69%。自MDOS在廣東省正式運(yùn)行以來(lái),區(qū)域站數(shù)據(jù)可疑率和錯(cuò)誤率均較低,對(duì)數(shù)據(jù)可用性影響較小,各考核要素可用率主要受缺測(cè)率影響。而區(qū)域站各考核要素缺測(cè)率相關(guān)性較好,致使區(qū)域站數(shù)據(jù)缺測(cè)的的主要原因是通信故障和數(shù)據(jù)采集軟件故障。為了降低區(qū)域站數(shù)據(jù)缺測(cè)率,2018年下半年開始廣東省對(duì)新增區(qū)域站采集傳輸軟件進(jìn)行了全面升級(jí)改造,2019年開始區(qū)域自動(dòng)站通信系統(tǒng)也逐步進(jìn)行升級(jí),相信這些舉措都能有效改善區(qū)域自動(dòng)站數(shù)據(jù)質(zhì)量。

作者:侯靈 楊玉紅 陳曉慶 單位:廣東省氣象探測(cè)數(shù)據(jù)中心