稅務大數據解決方案

一、方案概述

  在國家稅務局提出的“互聯網+稅務”的號召下,增值稅發票網絡版上線、電子發票的開具,以及全國各地掀起的電子稅務局建設,進一步加強了國家稅務信息化建設。隨著各種稅務信息化系統的使用,信息系統中的數據增長量巨大,使用傳統的數據庫進行存儲和查詢逐漸不能滿足需求。海量數據的存儲,以及海量數據上的數據查詢和統計的需求,使得稅務數據分析業務需要從傳統的數據庫架構轉換為可擴展、并行計算能力更強的大數據架構。

  使用增值稅發票進行分析以往遇到的困境有:1)不能進行跨省的進銷項數據比對;2)不能進行基于商品明細的數據分析;3)不能進行實時的數據分析。隨著增值稅發票系統升級版的上線,進項發票將以電子底賬的形式清分到購貨方所在的省份,使得跨省進銷項分析成為可能;增值稅發票實現了實時開票,票面信息采集更加齊全,其中包括了商品明細、購貨清單等信息。

  在增值稅納稅人數量急劇增加和稅收管控風險加大的背景下,航天信息技術研究院基于航天信息在稅務行業長期耕耘所積累下來的豐富的行業經驗和海量的數據資源,提出了稅務大數據解決方案,該方案的目標是充分地利用各稅務信息化系統中的歷史數據和新增數據,通過全量數據獲得更加準確的數據分析結果,加強行政審批后續的稅務管理,最終建設成為智慧電子稅務局。未來電子稅務局的發展,將由大廳業務操作,轉變為后臺業務控制與審查。通過一線稅務工作人員不斷添加稅務業務規則和稅務數據分析系統不斷學習和迭代,系統將能提供實時的監控、預警、告警,并在一定程度上對新型違反稅法行為進行識別。除此之外,充分運用稅收大數據能從一個角度反映社會經濟的發展情況,服務于社會經濟發展的需要。

稅務行業大數據解決方案總體框架圖

二、主要功能

(1)稅務數據宏觀展示

  各種不同的稅務發票數據匯總,統計各個月的稅收情況,獲得稅收指標完成情況。可以知曉已完成的稅收,稅收貢獻率高的行業,稅收貢獻率高的地區,稅收貢獻率高的票種,便于稅務局有針對性地指定稅收政策。

  獲取進項發票省市分布圖,可查看跟該稅局有經濟往來的省市。

  對于某一個納稅人企業,可以查詢出其上下游企業情況,找出供應鏈上的關鍵企業,可以根據其上下游企業進行向后跟蹤和向前溯源。

(2)多維度數據展現

  進項分析可以按照區域、行業、票種等多個角度進行統計分析。

(3)風險監控與預警

  各地方稅務機關面臨的最主要的風險在于偷逃稅款、虛開發票與走逃。通過對企業一段時間的進項銷項差異分析,可以發現企業偷逃稅款的風險,追補稅款。通過對納稅人虛開發票行為的分析,可發現大量頂版開具的行為為虛開發票企業的普遍特征。頂版開具發票和走逃行為具有強關聯性,提前發現大量頂版開具的納稅人,可進行及時監控,避免稅款流失。

(4)高風險納稅人識別

  識別高風險納稅人。對于一些納稅人可疑行為,比如一址多照、法人/財務主管在其他企業存在違規歷史記錄、虛開發票高危行業、領鉤發票當月未開具等,給出其違規的可能性。稅務人員可及時監控,避免稅收風險。

三、方案特色

(1)技術優勢

  a) 近十年的稅務數據分析的業務優勢,以及稅務信息系統的幾乎全量數據,稅務數據具有完備性,可通過納稅人異常行為的歷史經驗標注,訓練出較準確的機器學習模型,對納稅人的開票行為進行識別,及時快速響應。

  b) 基于開源的大數據Hadoop集完成數據的導入、數據分析與處理、數據挖掘和機器學習、數據的導出,結合稅務數據分析業務進行個性化定制。

  c) 分布式數據庫OLAP提供全面的SQL支持,在查詢性能和擴展性等方面優勢突出。增加計算組可提升整體的IO能力和計算能力,以滿足百TB以上的在線和離線數據分析需求。實現大數據分析業務的快速響應。

  d) 分布式數據庫系統為OLAP場景進行了深度的優化,例如列式存儲、分布式優化器,塊級別的數據壓縮,并行的數據導入和導出,彈性擴容等。

(2)數據優勢

  系統的數據主要來源于五個部分:防偽稅控系統、貨運系統、電子底賬系統、金三征管系統、稽核系統。

  a) 通過防偽稅控系統采集專用發票和普通發票的銷項信息及明細數據

  b) 通過貨運系統采集電子發票、卷式發票、機動車統一發票及貨運發票

  c) 通過電子底賬系統采集專用發票的進項信息及明細數據。包含省內和由總局清分的省外抵扣聯信息。

  d) 通過金三征管系統采集本地的納稅人檔案信息、稅務機關信息、稅務人員信息、行業明細、發票庫存信息、納稅人資格認定,申報表等基礎信息。

  e) 通過稽核系統獲得海關繳款書貨物明細。

边吸奶边扎下面很爽,色噜噜狠狠综合在线-好紧好爽再浪一点