摘要:本文從開展國庫統計分析大數據應用的可行性入手,剖析了國庫統計分析大數據中存在的問題,如數據資源分散,形成信息孤島;部分業務數據統計標準口徑不一,信息資源無法共享;業務系統處理能力和信息安全水平有待提高;傳統統計思維亟待轉變,信息價值未充分挖掘等。為此,本文提出培養大數據理念,建立大數據國庫統計工作機制;制定統一的業務數據標準,搭建高效的綜合數據平臺;全面提升系統性能,建立信息安全保障體系;注重人才培養等建議。
關鍵詞:大數據; 國庫; 統計分析; 數據標準;
以云計算為基礎的大數據時代的到來,正深入影響人類的生產和生活。大數據隱含著巨大的社會、經濟、科研價值,其使用范圍不斷延伸,發展空間不斷拓展。運用大數據開展國庫統計分析,對于提升國庫統計分析能力具有重要的意義。
一、開展國庫統計分析大數據應用的可行性
國庫統計分析始于20世紀90年代,從最初的對各級預算收支數據簡單計算列表,發展到現在通過數據整理、匯總、歸納、對比、繪圖,挖掘國庫資金運行特點和規律,反映經濟運行中存在的問題,已成為國庫管理工作的重要組成部分。就當前國庫制度建設、系統設置和數據特點、機構體系及人員配置而言,運用大數據開展國庫統計工作具有可行性。
。ㄒ唬﹪鴰熘贫冉ㄔO逐步推進,數據質量更有保障。
以往,地方財政部門常常用“以撥代支”的方式將國庫資金調入財政專戶,導致財政庫存虛降,國庫數據無法真實反映財政庫存情況,同時,部分預算收入因未能及時繳庫甚至沉淀在財政專戶中,難以及時納入國庫統計,也破壞了國庫數據的全面性和完整性。2015年,新出臺的《預算法》明確規定“政府的全部收入應當上繳國家金庫”,并對財政專戶進行了最嚴格的規定,此舉一方面,有利于全面清理、整頓財政專戶;另一方面,有利于將以往未能及時繳庫的部分預算收入及時納入國庫統計,提高國庫數據的真實性、全面性和準確度。
。ǘ﹪鴰煜到y不斷完善,數據內容更加豐富。
從系統配置看,國庫系統滲透國庫工作的各方面,涵蓋集中存儲、加工和處理各級國庫的所有業務數據。包括:國庫會計數據集中系統(TCBS)、國庫信息管理系統(TMIS)、國庫信息處理系統(TIPS)(簡稱“3T”系統)和地方特色業務系統(出口退稅無紙化系統、政府補貼發放系統等)(詳見圖1)。
圖1 國庫系統
其中,TIPS作為國庫核心業務系統與外部門信息傳輸的重要渠道,實現了國庫與財政、稅務、海關和商業銀行之間的信息交換和業務電子化處理。省級、市和縣覆蓋率達到100%,有利于信息的完整性;TCBS系統作為國庫賬務處理系統,與TIPS、TMIS相連接,實現了“3T”間的信息共享。規范的操作流程標準,確保了各級國庫會計核算業務統一處理,實現了風險多環節控制、收支及時到賬,并完整記錄每筆資金的原始信息及賬、簿、報表數據的集中存儲,由此保障了獲取數據的真實性和及時性。TMIS通過采集TCBS等系統的相關信息,按國債管理、收支統計、納稅分析、現金管理等各模塊加工處理、提取有用的信息,為國庫統計分析工作提供了數據篩選、匯總、整理功能。
從數據特點看,國庫系統所處理的數據量大,內容豐富,蘊含著大量有價值的信息。以TIPS為例,通過進入憑證查詢界面進行稅票信息查詢,隨機抽取一條稅票信息,該信息包括了納稅人基本信息、申報和繳稅數據、征收機關、收款人等內容?梢钥闯,國庫系統集中存儲的數據不僅數據結構多樣,有數值、邏輯、文本、日期、序列型等,且數據源廣,可按日、月、年獲取信息,數據更新及時,實效性強,滿足了大數據的“5V”(1)特點。
。ㄈC構體系較為健全,人員配備相對充足。
根據《中華人民共和國國家金庫條例》規定:“國庫機構按照國家財政管理體制設立,原則上一級財政設立一級國庫”。國庫設總庫、分庫、中心支庫和支庫。各級國庫根據工作需要逐級設置統計分析處、科、組及崗位,并指定專人負責。同時,國庫業務實現了“中央、省、地、縣”四級聯網,各級國庫統計分析工作人員除能及時準確編報統計報表外,還能根據掌握的數據反映一些經濟熱點問題。綜合而言,當前較為完善的國庫統計機構體系及相對充足的人員配備對于推進大數據應用奠定了良好的基礎。
二、國庫統計分析中大數據應用值得關注的問題
受原有制度、系統建設、人員資源等各方面條件束縛影響,大數據應用給傳統國庫統計分析帶來發展機遇的同時,不可避免也帶來一些挑戰。
。ㄒ唬⿺祿Y源分散碎片化,形成信息孤島。
一是國庫內部部分信息資源分散在各系統中,國庫統計分析主要通過TMIS查詢數據,由于TMIS對接TCBS對接,部分TIPS所含的信息無法直接獲;二是外部門間數據和信息相分割,對于各項宏觀、行業數據(如進出口額總量、房地產)主要通過查詢相關政府部門官網發布的統計資料,再進行手工提取錄入,數據獲取方式易出錯,且相對滯后;三是對于一些專題調研分析,我們一般通過傳統抽樣方法,對被調研對象發放調查問卷獲取數據,但一旦被調查對象未積極配合,則統計調查的結果可信度也大大降低。倘若國庫相關資料數據庫建立較為完善,部分數據直接從數據庫提取,就可以盡量減少人為因素干預,統計數據的質量較有保證。
。ǘ┎糠謽I務數據統計標準口徑不一,信息資源難以共享。
早期,由于政府各部門間缺乏統一規范的標準,使得同一統計科目數據可能不一致,信息很難相互共享。例如,國庫部門與財政部門存在部分支出科目統計口徑不一。
。ㄈI務系統處理能力和信息安全水平有待進一步提升。
雖然以往發生的系統故障影響均相對較小且都已及時升級完善,同時為應對突發事件,當前國庫部門也已建立了針對TCBS、TIPS及其他國庫業務系統在辦理業務方面的應急處置機制,但隨著國庫業務辦理實現電子化,二代TIPS的推廣和社保業務的開展,用戶和業務量不斷增長,對系統性能、運行維護、數據存儲以及安全防護等方面均提出了更高要求。
。ㄋ模﹤鹘y統計思維未轉變,信息價值未充分挖掘。
當前,國庫統計分析仍然沿用傳統的統計分析思路,先根據經濟理論或社會經驗提出假設,然后按照統計研究的目的進行數據的收集整理,再利用統計方法建立模型,最后通過所得到的結論對假設進行驗證。例如,以往按經驗認為“國內增值稅”與“工業增加值”關系緊密,就選取這兩變量歷史數據,進行模型估計,檢驗假設是否成立。而按大數據統計分析思維,則無需要事先設定研究目的和假設條件,直接從稅務、工商、銀行、水電等部門獲取企業用水、電、氣等記錄和財務數據,并通過數據挖掘技術建立模型,發現規律、形成結論。由于現階段我國國庫數據的利用仍以報表、報告為主,傳統分析方法和手段較為落后,國庫數據的價值未得到充分發揮。
三、政策建議
由于大數據應用對于進一步提升國庫數據分析能力,強化人民銀行履職水平具有重要的作用,筆者認為可以從以下幾個方面入手,建立健全國庫大數據分析體系。
。ㄒ唬淞⒋髷祿砟,建立大數據國庫統計工作機制。
一要積極主動轉變傳統國庫統計分析思維,培養大數據理念。國庫統計分析工作要從原有的因果關系分析擴大到相關關系分析,從最初的只關注國庫收入、支出、庫存等全局性宏觀數據,擴展到主要行業等中觀層面的數據,最后回歸到微觀層面,即關注企業、居民等數據,力求從這些個體數據中挖掘提煉出關鍵信息,進而反映宏觀經濟發展的特點。二要立足于我國目前國庫組織管理結構及大數據特點,開展國庫統計分析。國庫系統應建立一個自上而下,包含組織保障、綜合數據平臺建設、數據應用、用戶授權管理等一系列工作機制,做到從制度上、技術上、人員上等各方面保障大數據在國庫統計分析工作中的應用及推廣。
。ǘ┲贫ńy一的業務數據標準,搭建可共享的高效綜合數據平臺。
首先,統一大數據應用標準是關鍵,當務之急是需要各個政府部門、企事業單位、機構組織在國家大數據戰略框架下加強溝通協調,統一業務數據標準;其次,大數據一般來源于信息網絡系統,收集的數據不僅包括結構化數據,還包括難以用二維邏輯表來表現的數據,如圖像、音頻、視頻等,因此,隨著數據類型的不斷擴大,要注重建立統一的交換接口,以實現部門間信息交換的順暢便捷;最后,面對來源于內部的和外界的海量數據,可搭建一個基于Map Reduce和Hadoop等分布式基礎架構的綜合數據倉庫(見圖2),并運用云計算技術等高速數據處理技術對國庫數據進行挖掘,實現國庫收支統計分析、重點行業分析、現金管理分析、地方債分析、納稅分析等。
。ㄈ┤嫣嵘到y性能和安全系數,健全信息安全應急保障體系。
隨著國庫集中收付制度改革不斷推進,國庫業務量也在呈幾何級數增長,一方面,國庫系統應引進大型計算技術,并積極與云計算深度結合,全面提升國庫系統性能,保證國庫業務的順利開展。另一方面,由于國庫數據倉庫將集各種信息源于一身,保障數據的安全就成為重中之重。一要在日常業務中及時做好數據備份和恢復工作;二要設立國庫數據突發事件領導小組,并建立應急預案,加強日常應急演練工作,防止不法分子的潛在攻擊;三要做好崗位設置,對大數據的采集、使用、公布進行用戶授權管理,注重個人隱私、商業機密及各項涉及國家安全、經濟金融安全等相關敏感數據的保管,保障信息的安全應用。
。ㄋ模┳⒅鼐C合型人才培養,加強國庫統計分析人員隊伍建設。
一要引進科技人才。由于大數據應用需要廣泛借助云計算和虛擬化技術,傳統的國庫統計隊伍和工作方式將難以為繼,因此需要及時引進大數據維護人員、建模人員。二要注重對國庫相關人員內部培訓,可以通過邀請專家授課、召開經驗交流會等多種培訓形式,促進國庫統計人員了解并熟悉大數據理論,提高數據處理、挖掘、計算的能力,從而培養一批既懂國庫業務又懂信息化應用,能夠滿足大數據時代需求的現代化國庫統計工作者。
圖2 國庫系統大數據開發應用
參考文獻
[1] 劉貴生.現代國庫論[M].北京:中國金融出版社,2014.
[2]中國人民銀行國庫局,中國金融學會國庫專業委員會.中央銀行經理國庫理論與實踐(2015)上冊[M].北京:中國金融出版社,2015.
[3] 西南財經大學,中國人民銀行國庫局.國庫改革與發展[M].北京:中國金融出版社,2015.
[4] 劉貴生等.國庫觀察與思考[M].北京:中國金融出版社,2015.
[5]李國杰等.大數據研究:未來科技及經濟社會發展的重大戰略領域——大數據的研究現狀與科學思考[J].戰略與決策研究,2012,(6).
[6]高常水等.大數據在政府部門的應用[J].物聯網技術,2014,(6).
[7]謝資二.大數據在政府統計中的探索與應用思考——以南通市綜合數據管理平臺建設為例[J].統計科學與實踐,2013,(10).
[8]遼寧省國家稅務局課題組.國稅系統大數據開發與應用研究[J].地方財政研究,2015,(2).
[9]中國人民銀行國庫局,中國金融學會國庫專業委員會.中央銀行經理國庫理論與實踐(2019)下冊[M].北京:中國金融出版社,2020.
注釋
1指Volume(大量)、Velocity(高速)、Variety(多樣)、Value(價值)、Veracity(真實)。