當(dāng)前,以大數(shù)據(jù)為重點(diǎn)的“金審三期”工程順利開展,審計(jì)大數(shù)據(jù)信息化的建設(shè)為實(shí)施審計(jì)全覆蓋提供了重要的數(shù)據(jù)資源與處理工具。運(yùn)用大數(shù)據(jù)技術(shù)推動(dòng)審計(jì)技術(shù)的革新和審計(jì)管理平臺(tái)的優(yōu)化,是實(shí)現(xiàn)審計(jì)全覆蓋、實(shí)現(xiàn)國(guó)家治理現(xiàn)代化與信息化的重要途徑。
一、理論梳理與回顧
(一)大數(shù)據(jù)審計(jì)在我國(guó)的應(yīng)用與發(fā)展新時(shí)代,大數(shù)據(jù)審計(jì)技術(shù)方法不斷更新和改進(jìn),在我國(guó)的應(yīng)用范圍也越來越廣。邱玉慧等[ 1] 利用海量微觀的社會(huì)保險(xiǎn)大數(shù)據(jù)進(jìn)行審計(jì)評(píng)價(jià),充分運(yùn)用可視化技術(shù),初步印證了海量微觀的社保大數(shù)據(jù)在評(píng)價(jià)養(yǎng)老金調(diào)整現(xiàn)狀、評(píng)估不同待遇調(diào)整方案方面的優(yōu)勢(shì)。鄭志元[ 2 ] 從全量審計(jì)、持續(xù)審計(jì)、風(fēng)險(xiǎn)導(dǎo)向、智能審計(jì)、人本審計(jì)思維分析商業(yè)銀行內(nèi)部審計(jì)理念的轉(zhuǎn)型。王李[ 3] 認(rèn)為商業(yè)銀行內(nèi)部審計(jì)廣泛應(yīng)用大數(shù)據(jù)的前提是區(qū)分全量與抽樣的差別、處理好效率與精確的關(guān)系以及注意數(shù)據(jù)挖掘?qū)ο蟮囊蚬P(guān)系。鄭偉等[ 4] 基于大數(shù)據(jù)環(huán)境下的數(shù)據(jù)式審計(jì)模式并從邏輯流程、網(wǎng)絡(luò)構(gòu)架和應(yīng)用架構(gòu)三個(gè)維度設(shè)計(jì)數(shù)據(jù)式審計(jì)模式與路徑。陳偉等[ 5] 研究了基于 Benford 定律的大數(shù)據(jù)審計(jì)方法。王會(huì)金等[ 6] 指出隨著大數(shù)據(jù)審計(jì)技術(shù)創(chuàng)新發(fā)展,數(shù)據(jù)量愈發(fā)龐大,大數(shù)據(jù)安全審計(jì)問題的解決更加依托于科學(xué)的審計(jì)技術(shù)方法,通過云提供商和云租戶之間的責(zé)任劃分建立政務(wù)云安全審計(jì)運(yùn)行框架,可以為大數(shù)據(jù)時(shí)代政務(wù)云安全管理實(shí)踐提供思路。趙圣偉等[ 7] 基于金融審計(jì)大數(shù)據(jù)的證券市場(chǎng)交易異常模型,創(chuàng)新了大數(shù)據(jù)環(huán)境下的審計(jì)數(shù)據(jù)分析和應(yīng)用模式。湖北省審計(jì)學(xué)會(huì)課題組[ 8] 以湖北省醫(yī)保審計(jì)實(shí)踐為例,在醫(yī)保審計(jì)中創(chuàng)新應(yīng)用軟硬件技術(shù)和大數(shù)據(jù)挖掘技術(shù),為審計(jì)全覆蓋提供了技術(shù)基礎(chǔ)和思路。
(二)審計(jì)全覆蓋理念對(duì)大數(shù)據(jù)審計(jì)的驅(qū)動(dòng)作用審計(jì)全覆蓋是新時(shí)期我國(guó)大數(shù)據(jù)審計(jì)發(fā)展的主要方向,是國(guó)家審計(jì)監(jiān)督能力提高的關(guān)鍵依據(jù)。審計(jì)監(jiān)督經(jīng)歷了財(cái)務(wù)審計(jì)、經(jīng)濟(jì)責(zé)任審計(jì)、績(jī)效審計(jì)等階段,大數(shù)據(jù)下審計(jì)環(huán)境的變化與國(guó)家治理共同要求審計(jì)監(jiān)督更具全面性。2015 年進(jìn)入包含離任審計(jì)在內(nèi)的全覆蓋審計(jì)階段,審計(jì)全覆蓋理念推動(dòng)了大數(shù)據(jù)審計(jì)的廣泛應(yīng)用。首先,審計(jì)全覆蓋背景下,傳統(tǒng)審計(jì)逐步轉(zhuǎn)變?yōu)槔萌鏄颖、更加追求效率、注重相關(guān)關(guān)系的大數(shù)據(jù)審計(jì),審計(jì)環(huán)境發(fā)生變化,政府審計(jì)模式發(fā)生轉(zhuǎn)變(魏祥健,2016)。Danielle 等[ 9] 認(rèn)為,大數(shù)據(jù)時(shí)代,模式識(shí)別、數(shù)據(jù)挖掘、自然語言處理等技術(shù)的應(yīng)用將提高數(shù)據(jù)分析的預(yù)測(cè)能力。Michael Alles 等[ 10] 基于理論證據(jù)研究大數(shù)據(jù)技術(shù)納入財(cái)務(wù)報(bào)表審計(jì)的優(yōu)勢(shì)與障礙,并確定了可能使審計(jì)師受益的大數(shù)據(jù)具體方面。陳偉等[ 11] 強(qiáng)調(diào)面對(duì)復(fù)雜的審計(jì)大數(shù)據(jù),大數(shù)據(jù)分析技術(shù)正處于發(fā)展階段,大數(shù)據(jù)環(huán)境下電子數(shù)據(jù)審計(jì)面臨機(jī)遇與挑戰(zhàn),審計(jì)的思路與理念應(yīng)緊隨時(shí)代的發(fā)展持續(xù)創(chuàng)新。其次,審計(jì)環(huán)境變化,審計(jì)技術(shù)進(jìn)步,為大數(shù)據(jù)審計(jì)帶來了應(yīng)用范圍、框架路徑、機(jī)制方法等方面的創(chuàng)新。戚振東和尹平[ 12] 從國(guó)家治理視角研究了國(guó)家審計(jì)全覆蓋的發(fā)展創(chuàng)新問題,分別是以資金權(quán)力運(yùn)行為主線拓展政府審計(jì)范圍、以協(xié)同審計(jì)創(chuàng)新國(guó)家審計(jì)運(yùn)行機(jī)制、以治理目標(biāo)導(dǎo)向創(chuàng)新國(guó)家審計(jì)模式、以職能分工授權(quán)拓展業(yè)務(wù)流程來完善國(guó)家審計(jì)職權(quán)等方面。Earley[ 13] 和朱玲玲[ 14] 分析大數(shù)據(jù)、云技術(shù)對(duì)審計(jì)監(jiān)督全覆蓋的影響,指出審計(jì)計(jì)劃、執(zhí)行等階段下大數(shù)據(jù)和云技術(shù)給審計(jì)監(jiān)督全覆蓋帶來機(jī)遇和挑戰(zhàn)。劉亞男等[ 15] 從機(jī)構(gòu)設(shè)置、人員力量、審計(jì)結(jié)果、整改落實(shí)、聯(lián)席會(huì)議制度執(zhí)行、領(lǐng)導(dǎo)干部權(quán)責(zé)、評(píng)價(jià)指標(biāo)體系等方面指出了我國(guó)高校經(jīng)濟(jì)責(zé)任審計(jì)普遍存在的問題,提出改進(jìn)對(duì)策,以充分發(fā)揮審計(jì)的免疫系統(tǒng)作用,進(jìn)一步促進(jìn)高校強(qiáng)化經(jīng)濟(jì)責(zé)任審計(jì)。陳桂云[ 16 ] 從突破組織邊界和借助資源共享兩個(gè)方面對(duì)審計(jì)全覆蓋的實(shí)現(xiàn)路徑進(jìn)行探索分析,為加快審計(jì)全覆蓋的實(shí)現(xiàn)提供了有益借鑒。陳駿和時(shí)現(xiàn)[ 17] 提出審計(jì)全覆蓋驅(qū)動(dòng)下的審計(jì)技術(shù)方法創(chuàng)新應(yīng)以目標(biāo)性、系統(tǒng)性、組織性為核心,探索審計(jì)技術(shù)方法創(chuàng)新的理論框架。
二、審計(jì)全覆蓋驅(qū)動(dòng)下大數(shù)據(jù)審計(jì)平臺(tái)構(gòu)建的現(xiàn)實(shí)需求
(一)要求審計(jì)人員擁有大數(shù)據(jù)思維從審計(jì)意識(shí)出發(fā),審計(jì)全覆蓋要求審計(jì)人員具備大數(shù)據(jù)思維,樹立全局觀念,實(shí)現(xiàn)審計(jì)工作的上下聯(lián)動(dòng)。傳統(tǒng)模式下的審計(jì)人員往往缺少大數(shù)據(jù)關(guān)鍵性技術(shù)與思維,大數(shù)據(jù)審計(jì)的高端知識(shí)型人才培養(yǎng)存在斷層,短時(shí)期內(nèi)難以達(dá)到理想的目標(biāo)與效果,這就要求當(dāng)代審計(jì)人員轉(zhuǎn)變思維。首先,由抽樣審計(jì)思維向具有完整性的總體審計(jì)思維轉(zhuǎn)變。傳統(tǒng)的審計(jì)模式根據(jù)局部抽樣總結(jié)個(gè)體特征,推斷全局規(guī)律,而大數(shù)據(jù)環(huán)境要求分析與審計(jì)對(duì)象所有的相關(guān)數(shù)據(jù),實(shí)現(xiàn)總體審計(jì)。其次,由追求數(shù)據(jù)精確度向追求數(shù)據(jù)及時(shí)性和使用效率轉(zhuǎn)變。大數(shù)據(jù)審計(jì)面對(duì)的海量數(shù)據(jù)大多是半結(jié)構(gòu)化與非結(jié)構(gòu)化數(shù)據(jù),數(shù)據(jù)量的規(guī)模性擴(kuò)大要求審計(jì)人員必須轉(zhuǎn)變思維,更加注重非結(jié)構(gòu)化數(shù)據(jù)的利用,學(xué)會(huì)處理海量數(shù)據(jù),追求樣本全貌,提高數(shù)據(jù)利用效率。再次,由事后審計(jì)思維向事前、事中審計(jì)思維轉(zhuǎn)變。傳統(tǒng)的事后審計(jì)逐步轉(zhuǎn)變?yōu)槊嫦蛉值娜^程審計(jì),大數(shù)據(jù)審計(jì)更加重視事前審計(jì)、事中審計(jì),同時(shí)要求審計(jì)人員更加注重對(duì)數(shù)據(jù)的實(shí)時(shí)監(jiān)控,在項(xiàng)目進(jìn)展過程中實(shí)時(shí)從業(yè)務(wù)活動(dòng)中抽取和控制審計(jì)信息,及時(shí)有效地進(jìn)行風(fēng)險(xiǎn)監(jiān)控和防范。最后,由因果關(guān)系思維向相關(guān)關(guān)系思維轉(zhuǎn)變。面對(duì)海量數(shù)據(jù),挖掘?qū)徲?jì)證據(jù)不必過于深究其因果關(guān)系,而是對(duì)所有的相關(guān)數(shù)據(jù)進(jìn)行采集、挖掘、分析和整理,找出隱含的關(guān)系,從多層次、多領(lǐng)域、多角度的海量數(shù)據(jù)中提煉問題,揭示共性規(guī)律,分析過去、捕獲現(xiàn)在、預(yù)測(cè)未來,滿足審計(jì)全覆蓋的要求。
(二)要求審計(jì)人員擁有強(qiáng)大的數(shù)據(jù)處理能力從審計(jì)技術(shù)應(yīng)用來講,審計(jì)全覆蓋要求運(yùn)用大數(shù)據(jù)技術(shù)提升數(shù)據(jù)采集、整理和分析能力。面對(duì)全覆蓋審計(jì)數(shù)據(jù)的海量化與審計(jì)對(duì)象的復(fù)雜化,加之信息化高端人才緊缺[ 25 ] ,采集提煉、存儲(chǔ)整理、分析處理數(shù)據(jù)的審計(jì)任務(wù)異常艱巨,因而審計(jì)人員需要具備相關(guān)的大數(shù)據(jù)分析處理能力。首先,要具備從宏觀角度處理海量數(shù)據(jù)的能力。在具備基礎(chǔ)技術(shù)及知識(shí)的基礎(chǔ)上,利用計(jì)算機(jī)軟件對(duì)所有相關(guān)數(shù)據(jù)進(jìn)行采集和整理,將結(jié)構(gòu)化的數(shù)據(jù)進(jìn)行分析,將半結(jié)構(gòu)化、非結(jié)構(gòu)化的跨領(lǐng)域、跨層次、跨行業(yè)的數(shù)據(jù)進(jìn)行加工和轉(zhuǎn)換,以易于理解的形式加入總體分析框架之中,對(duì)海量審計(jì)數(shù)據(jù)和資源實(shí)施整體、全面、深入地分析,避免管中窺豹、顧此失彼,為推進(jìn)審計(jì)監(jiān)督全覆蓋提供技術(shù)方面的支持。其次,要具備數(shù)據(jù)采集和挖掘能力。大數(shù)據(jù)之所以“大”,是因?yàn)橛袕V泛的數(shù)據(jù)。國(guó)家審計(jì)準(zhǔn)則要求政府各個(gè)部門的每一筆收支都備案,每一筆資金去向都可供檢查,然而一些人員為一己之利,將違法違紀(jì)的行為 “抹去”,進(jìn)而使得數(shù)據(jù)來源受限,審計(jì)監(jiān)督受到制約。因此,審計(jì)人員要注重從非結(jié)構(gòu)數(shù)據(jù)中獲取充分和適當(dāng)?shù)膶徲?jì)證據(jù),挖掘更細(xì)微、深入的信息,由“面”到“點(diǎn)”,具備多維度、深層次分析數(shù)據(jù)的能力,能夠發(fā)現(xiàn)隱藏在數(shù)據(jù)細(xì)節(jié)中更具價(jià)值的信息。最后,要具備大數(shù)據(jù)關(guān)聯(lián)分析的能力。掌握基本的計(jì)算機(jī)技能與大數(shù)據(jù)分析工具原理和運(yùn)行思路是推進(jìn)大數(shù)據(jù)時(shí)代發(fā)展的必要條件。審計(jì)人員需要具備專業(yè)知識(shí)和技能,利用信息技術(shù),綜合比對(duì)業(yè)務(wù)數(shù)據(jù)與財(cái)務(wù)數(shù)據(jù)、單位部門之間的數(shù)據(jù)、行業(yè)數(shù)據(jù)、跨行業(yè)和跨領(lǐng)域數(shù)據(jù),將最終的審計(jì)成果同被審計(jì)單位相關(guān)聯(lián),為今后的審計(jì)工作提供經(jīng)驗(yàn)基礎(chǔ),從而節(jié)省人力和時(shí)間成本,有效提高審計(jì)工作的效率。
三、審計(jì)全覆蓋驅(qū)動(dòng)下大數(shù)據(jù)審計(jì)平臺(tái)的構(gòu)建理念
(一)應(yīng)用開源 Hadoop 技術(shù),提高數(shù)據(jù)處理能力傳統(tǒng)的數(shù)據(jù)中心存儲(chǔ)能力是有限的,且存儲(chǔ)處理的數(shù)據(jù)大多為結(jié)構(gòu)化數(shù)據(jù),如 Oracle、MySQL 等關(guān)系型數(shù)據(jù)庫所存放的數(shù)據(jù)(謝志明等,2016),F(xiàn)如今,NoSQL 技術(shù)出現(xiàn),將來自數(shù)字媒體、物聯(lián)網(wǎng)、互聯(lián)網(wǎng)等機(jī)構(gòu)的多領(lǐng)域、多層次、多元化數(shù)據(jù)交織混雜在一起,數(shù)據(jù)類型不再是單一的結(jié)構(gòu)化數(shù)據(jù),更多的是半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)。傳統(tǒng)數(shù)據(jù)中心無法存儲(chǔ)如此龐大的數(shù)據(jù)量,存儲(chǔ)空間不足,不能滿足現(xiàn)代審計(jì)全覆蓋下大數(shù)據(jù)分析的要求,因而傳統(tǒng)的審計(jì)數(shù)據(jù)庫和數(shù)據(jù)分析系統(tǒng)應(yīng)有所改進(jìn),審計(jì)人員對(duì)大數(shù)據(jù)處理和分析的工作面臨挑戰(zhàn)。Hadoop 系統(tǒng)是基于 Java 技術(shù)的軟件框架,開源的 Hadoop 數(shù)據(jù)中心能夠很好地解決數(shù)據(jù)存儲(chǔ)和處理難題,核心技術(shù)是分布式文件系統(tǒng) HDFS 和分布式計(jì)算框架 MapReduce,它解決了大數(shù)據(jù)審計(jì)工作面臨的兩大難題:存儲(chǔ)和分析。隨著大數(shù)據(jù)應(yīng)用技術(shù)的不斷發(fā)展,Hadoop 系統(tǒng)進(jìn)一步引入 HBase(Hadoop Database)。HBase 強(qiáng)化系統(tǒng)存儲(chǔ)能力,性能更強(qiáng)、可靠性更高,為提高數(shù)據(jù)的存儲(chǔ)、分析和計(jì)算能力提供了更好的技術(shù)條件。
(二)重視非結(jié)構(gòu)化數(shù)據(jù),提升數(shù)據(jù)利用價(jià)值大數(shù)據(jù)環(huán)境下大量的非結(jié)構(gòu)化審計(jì)數(shù)據(jù)為處理分析工作增加了難度,研究如何對(duì)非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行有效利用具有重要的實(shí)踐意義。在 Hadoop 系統(tǒng)的不斷完善和優(yōu)化下,其具有存儲(chǔ)和計(jì)算海量非結(jié)構(gòu)化數(shù)據(jù)的能力。分布式文件系統(tǒng) HDFS、分布式數(shù)據(jù)庫 HBase 以及分布式計(jì)算框架 MapReduce 組成的 Hadoop 生態(tài)系統(tǒng),對(duì)非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行統(tǒng)一管理,有效實(shí)現(xiàn)了數(shù)據(jù)共享,有利于打破數(shù)據(jù)孤立的局面。大數(shù)據(jù)環(huán)境下,瀏覽和篩選等方法無法滿足非結(jié)構(gòu)化數(shù)據(jù)審計(jì)的需要,Hadoop 系統(tǒng)可以對(duì)一些過去無法采集到的數(shù)據(jù)進(jìn)行分析,通過大數(shù)據(jù)分析系統(tǒng)處理之后得到可視化信息,具體如圖 1 所示。大數(shù)據(jù)環(huán)境下,可利用網(wǎng)絡(luò)檢索相關(guān)數(shù)據(jù),再接入大數(shù)據(jù)審計(jì)平臺(tái),建立分析模型。大數(shù)據(jù)審計(jì)平臺(tái)為審計(jì)大數(shù)據(jù)的采集、存儲(chǔ)、挖掘和管理提供良好的服務(wù),為審計(jì)人員提供關(guān)聯(lián)分析和深度挖掘的相關(guān)工具和應(yīng)用界面,最終便于利用相應(yīng)的數(shù)據(jù)挖掘算法進(jìn)行預(yù)測(cè)性分析。同時(shí),服務(wù)平臺(tái)的可視化系統(tǒng)為提升數(shù)據(jù)利用價(jià)值提供了重要途徑。對(duì)網(wǎng)上公開數(shù)據(jù)源采集的相關(guān)非結(jié)構(gòu)化數(shù)據(jù),在數(shù)據(jù)預(yù)處理基礎(chǔ)上可對(duì)非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行可視化分析,將非結(jié)構(gòu)化數(shù)據(jù)中的內(nèi)容和規(guī)律化為視覺符號(hào),向?qū)徲?jì)人員展示,審計(jì)人員從中獲取信息和重點(diǎn),發(fā)現(xiàn)線索,找出審計(jì)證據(jù)。構(gòu)建這種數(shù)據(jù)平臺(tái)管理模式降低了審計(jì)數(shù)據(jù)管理風(fēng)險(xiǎn),通過開展聯(lián)網(wǎng)動(dòng)態(tài)監(jiān)測(cè)審計(jì)并深入挖掘,實(shí)現(xiàn)對(duì)非結(jié)構(gòu)化數(shù)據(jù)的最大利用效率。對(duì)此,審計(jì)人員有責(zé)任和義務(wù)遵循國(guó)家法律法規(guī),積極履行審計(jì)監(jiān)督全覆蓋職責(zé),保護(hù)國(guó)家和人民財(cái)產(chǎn)不受侵犯。
四、審計(jì)全覆蓋驅(qū)動(dòng)下大數(shù)據(jù)審計(jì)平臺(tái)的構(gòu)建策略
大數(shù)據(jù)審計(jì)平臺(tái)的建立是提高審計(jì)機(jī)關(guān)數(shù)據(jù)分析能力的基礎(chǔ)。多數(shù)在建的大數(shù)據(jù)審計(jì)平臺(tái)均屬于靜態(tài)批量模式,其特點(diǎn)是先儲(chǔ)存后計(jì)算,對(duì)數(shù)據(jù)的準(zhǔn)確性和全面性要求較高,以此為代表的有 Hadoop 系統(tǒng),經(jīng)過不斷地更新和優(yōu)化,其三大基礎(chǔ) HDFS、MapReduce 和 HBase 已經(jīng)發(fā)展為由 60 多個(gè)相關(guān)組件組成的龐大生態(tài)系統(tǒng),包括數(shù)據(jù)存儲(chǔ)、執(zhí)行引擎、編程和數(shù)據(jù)訪問框架等。本文應(yīng)用 Hadoop 系統(tǒng),將大數(shù)據(jù)審計(jì)平臺(tái)分為數(shù)據(jù)中心、采集、預(yù)處理、分析和可視化五個(gè)系統(tǒng),以期實(shí)現(xiàn)審計(jì)全覆蓋的總體目標(biāo),具體流程如圖 4 所示。
(一)數(shù)據(jù)中心隨著大數(shù)據(jù)技術(shù)的不斷發(fā)展,海量數(shù)據(jù)呈現(xiàn)集中化的趨勢(shì)。數(shù)據(jù)類型主要有結(jié)構(gòu)化數(shù)據(jù)(如被審計(jì)單位的財(cái)務(wù)數(shù)據(jù)、業(yè)務(wù)數(shù)據(jù)等)、半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)(如經(jīng)營(yíng)戰(zhàn)略、社會(huì)關(guān)系、組織結(jié)構(gòu)、經(jīng)驗(yàn)數(shù)據(jù)、管理數(shù)據(jù)、預(yù)測(cè)數(shù)據(jù)、Web 數(shù)據(jù)、日志數(shù)據(jù),包括所有格式的辦公文檔、文本、圖片、XML、HTML、報(bào)表、圖像、音頻和視頻等信息、被審計(jì)單位的非貨幣性數(shù)據(jù)等)。其中非結(jié)構(gòu)化數(shù)據(jù)占比巨大,潛藏著龐大的應(yīng)用價(jià)值。這些審計(jì)數(shù)據(jù)并非散亂式獲取與機(jī)械化堆砌,Hadoop 系統(tǒng)下可利用成熟的技術(shù)工具將其有機(jī)融合、合理存儲(chǔ)、有效處理。
(二)數(shù)據(jù)采集系統(tǒng)大數(shù)據(jù)審計(jì)的基礎(chǔ)任務(wù)是收集足夠的與審計(jì)項(xiàng)目相關(guān)的數(shù)據(jù)信息。建立專業(yè)化的數(shù)據(jù)采集系統(tǒng),有利于整體把握審計(jì)項(xiàng)目,有效獲取數(shù)據(jù),最終從海量數(shù)據(jù)中獲取具有潛在價(jià)值的規(guī)律和事實(shí),完成審計(jì)任務(wù)。采集系統(tǒng)是數(shù)據(jù)中心的重要保障,為數(shù)據(jù)預(yù)處理提供了可能。數(shù)據(jù)采集系統(tǒng)是指將審計(jì)機(jī)關(guān)和被審計(jì)單位的數(shù)據(jù)庫通過專業(yè)化工具方法連接起來,進(jìn)行數(shù)據(jù)共享。常用的審計(jì)數(shù)據(jù)采集方法主要有直接復(fù)制、通過中間文件、通過 ODBC 接口、遠(yuǎn)程聯(lián)網(wǎng)等。Hadoop 系統(tǒng)下的采集框架主要有 Apache Sqoop 實(shí)現(xiàn)數(shù)據(jù)的自動(dòng)傳輸 ,Apache Flume 收集可靠的日志數(shù)據(jù),Gobblin 負(fù)責(zé)整合數(shù)據(jù)源,同時(shí) Datax 負(fù)責(zé)異構(gòu)數(shù)據(jù)的穩(wěn)定性。除此之外還有大數(shù)據(jù)采集技術(shù),例如網(wǎng)絡(luò)爬蟲等網(wǎng)絡(luò)數(shù)據(jù)采集方法, Hadoop 系統(tǒng)的 Chukwa 等日志數(shù)據(jù)采集方法。數(shù)據(jù)存儲(chǔ)是數(shù)據(jù)采集之后存放數(shù)據(jù)的系統(tǒng),通過構(gòu)建 Hadoop 分布式框架的 HDFS 和 HBase,可以完成即時(shí)的操作讀寫功能,便于審計(jì)數(shù)據(jù)的即時(shí)儲(chǔ)存和利用。
(三)數(shù)據(jù)預(yù)處理系統(tǒng)大數(shù)據(jù)審計(jì)預(yù)處理系統(tǒng)主要起到了承上啟下的作用,系統(tǒng)針對(duì)采集之后的海量數(shù)據(jù)進(jìn)行預(yù)處理,包括對(duì)結(jié)構(gòu)化數(shù)據(jù)去重復(fù)值或有誤值,對(duì)半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)通過預(yù)處理系統(tǒng)轉(zhuǎn)化為可供理解、易分類、易分析的結(jié)構(gòu)化數(shù)據(jù)。目前常用的方法主要有數(shù)據(jù)類型轉(zhuǎn)換、名稱轉(zhuǎn)換、橫向縱向合并、空值處理等。大數(shù)據(jù)審計(jì)的預(yù)處理系統(tǒng)包括數(shù)據(jù)清洗、數(shù)據(jù)挖掘、數(shù)據(jù)轉(zhuǎn)換三項(xiàng)流程。數(shù)據(jù)清洗,需要多重清洗方法相結(jié)合,以迎合審計(jì)大數(shù)據(jù)的多樣化和多元性。通過設(shè)置規(guī)則,確保數(shù)據(jù)合法性;通過補(bǔ)全信息,提升數(shù)據(jù)完整性;通過去重,促進(jìn)數(shù)據(jù)的唯一性。數(shù)據(jù)挖掘,主要是運(yùn)用先進(jìn)的軟件技術(shù),根據(jù)不同的審計(jì)目標(biāo)選擇不同的方法,對(duì)清理過和篩選出的數(shù)據(jù)進(jìn)行分析。數(shù)據(jù)挖掘可以發(fā)現(xiàn)數(shù)據(jù)之間的異常關(guān)系,提取有價(jià)值的信息,提供精準(zhǔn)的審計(jì)證據(jù)。數(shù)據(jù)轉(zhuǎn)換,涵蓋數(shù)據(jù)內(nèi)容的截取、數(shù)據(jù)格式的轉(zhuǎn)化、數(shù)據(jù)的拆分與合并,是將不同格式與語義的源數(shù)據(jù)轉(zhuǎn)化為被審計(jì)用戶所理解、與目標(biāo)數(shù)據(jù)相一致的數(shù)據(jù)整合過程。審計(jì)人員必須明確轉(zhuǎn)換任務(wù),明晰轉(zhuǎn)換類型與轉(zhuǎn)換格式,進(jìn)行數(shù)據(jù)拆分與合并。
五、結(jié)語
當(dāng)前,大數(shù)據(jù)應(yīng)用已經(jīng)滲透到政治、經(jīng)濟(jì)、社會(huì)等各個(gè)層次和各個(gè)領(lǐng)域,以強(qiáng)大的沖擊力深刻地影響和改變著人們的工作、生活和思維方式。審計(jì)全覆蓋與大數(shù)據(jù)平臺(tái)的建設(shè)相互作用、相輔相成,共同推動(dòng)我國(guó)大數(shù)據(jù)審計(jì)的發(fā)展。在國(guó)家審計(jì)全覆蓋總目標(biāo)的驅(qū)動(dòng)下,為順應(yīng)時(shí)代發(fā)展的潮流,應(yīng)建立和優(yōu)化大數(shù)據(jù)審計(jì)平臺(tái),完善數(shù)據(jù)中心、采集、預(yù)處理、分析、可視化五個(gè)系統(tǒng),實(shí)現(xiàn)各系統(tǒng)相互配合、相互支持和無縫連接,同時(shí)建立國(guó)家級(jí)大數(shù)據(jù)審計(jì)平臺(tái),最大程度共享數(shù)據(jù),實(shí)現(xiàn)審計(jì)全覆蓋目標(biāo),有力推進(jìn)國(guó)家審計(jì)的常態(tài)化、流程化與智能化。
【參考文獻(xiàn)】
[1]邱玉慧,呂天陽,楊蘊(yùn)毅.基于大數(shù)據(jù)的企業(yè)基本養(yǎng)老保險(xiǎn)待遇調(diào)整績(jī)效審計(jì)分析:以 X 省為例[J].審計(jì)研究,2014(3):106-112.
[2]鄭志元.大數(shù)據(jù)下的銀行審計(jì)思維[J].中國(guó)金融,2016 (14):52-53.
[3]王李. 大數(shù)據(jù)關(guān)注點(diǎn)在商業(yè)銀行內(nèi)部審計(jì)中的應(yīng)用:以 M 銀行為例[J].會(huì)計(jì)之友,2016(16):110-112.
《審計(jì)全覆蓋驅(qū)動(dòng)下大數(shù)據(jù)審計(jì)平臺(tái)構(gòu)建研究》來源:《會(huì)計(jì)之友》,作者:劉國(guó)城 1 馬欣萌 1 徐 志 2
轉(zhuǎn)載請(qǐng)注明來自:http://www.jinnzone.com/jingjixuelw/72535.html