基于網(wǎng)絡(luò)爬蟲技術(shù)的審計大數(shù)據(jù)采集與應(yīng)用研究
發(fā)布時間:2021-06-28 05:40
黨的十九大對審計監(jiān)督提出更高的要求,要構(gòu)建集中統(tǒng)一,全面覆蓋,權(quán)威高效的審計監(jiān)督體系,國家審計要適應(yīng)新時代、新要求、新部署,及時反映和揭示經(jīng)濟社會各領(lǐng)域的新問題、新情況和新趨勢,與時俱進地開創(chuàng)審計事業(yè)發(fā)展的新局面。但隨著大數(shù)據(jù)、人工智能和區(qū)塊鏈等新技術(shù)的出現(xiàn),對審計工作的開展提出了新的挑戰(zhàn)。大數(shù)據(jù)時代,傳統(tǒng)審計技術(shù)方法難以滿足現(xiàn)代審計的要求,迫切需要審計人員轉(zhuǎn)變思維,創(chuàng)新審計技術(shù)和方法,運用大數(shù)據(jù)的思維和技術(shù)方法,擴大審計范圍和對內(nèi)外部關(guān)聯(lián)數(shù)據(jù)的對比分析,發(fā)現(xiàn)審計疑點,尋找審計線索。在大數(shù)據(jù)審計環(huán)境中,審計電子數(shù)據(jù)在審計過程中處于“核心位置”,其完整性、一致性、有效性是大數(shù)據(jù)審計分析的基礎(chǔ),是發(fā)現(xiàn)審計問題與線索的關(guān)鍵;是審計報告的重要依據(jù),能夠采集完整的、一致性的、有效性的審計電子數(shù)據(jù)尤為重要。目前,審計電子數(shù)據(jù)采集主要來源于兩方面:一方面是被審計單位提供的,其可靠性和真實性不得而知。另一方面是來自其他方面的支撐數(shù)據(jù),如上級主管部門的數(shù)據(jù),其他相關(guān)單位共享數(shù)據(jù),互聯(lián)網(wǎng)上的公開數(shù)據(jù)等。前面獲取容易,后者往往被人們忽略,尤其在互聯(lián)網(wǎng)網(wǎng)絡(luò)頁面中隱藏了可免費公開訪問的有效數(shù)據(jù)集,可對審計工作起...
【文章來源】:南京審計大學(xué)江蘇省
【文章頁數(shù)】:89 頁
【學(xué)位級別】:碩士
【部分圖文】:
論文演化路徑圖
11圖2.1傳感器數(shù)據(jù)主要來源而對于物聯(lián)網(wǎng)中的數(shù)據(jù)主要是通過傳感器進行數(shù)據(jù)采集。傳感器在日常生活中很常見,用于測量物理量并將物理量轉(zhuǎn)換為可讀數(shù)字信號,以便后續(xù)處理(和存儲)。感官數(shù)據(jù)可分為聲波,聲音,振動,汽車,化學(xué),電流,天氣,壓力,溫度等。感知信息通過有線或無線網(wǎng)絡(luò)傳輸?shù)綌?shù)據(jù)收集點。對于可以容易地部署和管理的應(yīng)用,例如視頻監(jiān)視系統(tǒng),有線傳感器網(wǎng)絡(luò)是獲取相關(guān)信息的便利解決方案。有時,特定現(xiàn)象的準確位置是未知的,有時受監(jiān)控的環(huán)境沒有能量或通信基礎(chǔ)設(shè)施。然后必須使用無線通信來在有限的能量和通信能力下實現(xiàn)傳感器節(jié)點之間的數(shù)據(jù)傳輸。近年來,無線傳感器網(wǎng)絡(luò)受到了廣泛的關(guān)注,并已應(yīng)用于許多應(yīng)用,如環(huán)境研究[34],水質(zhì)監(jiān)測[50],土木工程[36]等。②系統(tǒng)日志采集許多的業(yè)務(wù)平臺每天都會產(chǎn)生大量的日志數(shù)據(jù)。對于這些日志信息,可以得到出很多有價值的數(shù)據(jù)。通過對這些日志信息進行日志采集、收集,然后進行數(shù)據(jù)分析,挖掘公司業(yè)務(wù)平臺日志數(shù)據(jù)中的潛在價值。為公司決策和公司后臺服務(wù)器平臺性能評估提高可靠的數(shù)據(jù)保證。系統(tǒng)日志采集系統(tǒng)做的事情就是收集日志數(shù)據(jù)提供離線和在線的實時分析使用。日志文件采集作為一種廣泛使用的數(shù)據(jù)收集方法,日志文件是由數(shù)據(jù)源系統(tǒng)自動生成的記錄文件,以便以指定的文件格式記錄活動以供后續(xù)分析。日志文件通常用于幾乎所有數(shù)字設(shè)備。例如,Web服務(wù)器在日志文件中記錄網(wǎng)頁用戶的點擊次數(shù),點擊率,訪問次數(shù)和其他財產(chǎn)記錄[69]。為了捕獲網(wǎng)站上用戶的活動,Web服務(wù)器主要包括以下三種日志文件格式:公共日志文件格式(NCSA),擴展日志格式(W3C)和IIS日志格式(Microsoft)。所有這三種類型的日志文件都是ASCII文本格式。除文本文件之外的數(shù)據(jù)庫有時可用于?
17下,將不符合審計系統(tǒng)的文件轉(zhuǎn)換成符合審計系統(tǒng)讀取的文件。(6)開放數(shù)據(jù)互連(ODBC)采用數(shù)據(jù)庫連接中間件,如ODBC接口等直接對被審計單位的數(shù)據(jù)進行采集。在實際審計業(yè)務(wù)中,對于業(yè)務(wù)數(shù)據(jù)的采集可分為對于非數(shù)據(jù)庫數(shù)據(jù)的采集和數(shù)據(jù)庫數(shù)據(jù)的采集。對于非數(shù)據(jù)庫數(shù)據(jù)的采集,通常包括對文本數(shù)據(jù)、電子表格數(shù)據(jù)、XML數(shù)據(jù)以及其他常見格式數(shù)據(jù)的采集(如WORD、EXCEL、PDF、WPS和網(wǎng)頁文件的格式數(shù)據(jù)等)。而對被審計單位數(shù)據(jù)庫數(shù)據(jù)的采集,在審計業(yè)務(wù)中常見的有DBF數(shù)據(jù)采集、ACCESS數(shù)據(jù)采集、SQLServer數(shù)據(jù)采集和ORACLE數(shù)據(jù)采集。具體采集內(nèi)容和方法,如圖2.2。圖2.2審計業(yè)務(wù)數(shù)據(jù)采集審計數(shù)據(jù)采集是審計業(yè)務(wù)開展的重要環(huán)節(jié),審計數(shù)據(jù)采集不僅會影響最終審計結(jié)果的準確性,也會對審計計劃的投入產(chǎn)出比產(chǎn)生影響。同時,審計數(shù)據(jù)采集也是開展審計大數(shù)據(jù)的基本前提。因此,在審計數(shù)據(jù)采集中要遵循幾點數(shù)據(jù)采集原則,而不僅僅依靠被審計單位的數(shù)據(jù)滿足審計需求。首先,對于采集審計數(shù)據(jù)的選擇應(yīng)以能夠?qū)崿F(xiàn)審計項目計劃方案、查處審計疑點和線索為目標。其次,要在對被審計單位業(yè)務(wù)流程以及被審計單位應(yīng)用系統(tǒng)充分了解的前提下進行數(shù)據(jù)采集。最后,不僅要采集被審計單位內(nèi)部的數(shù)據(jù),更加要對與被審計單位相關(guān)的市嘗行業(yè)等外部關(guān)聯(lián)數(shù)據(jù)進行采集。隨著信息化技術(shù)的快速發(fā)展,尤其當(dāng)前大數(shù)據(jù)和人工智能技術(shù)的應(yīng)用,各行各業(yè)實現(xiàn)智能化辦公,導(dǎo)致審計數(shù)據(jù)的采集也成為了審計中的一個難題。目前,審計大數(shù)據(jù)的采集對審計數(shù)據(jù)采集方法提出了更高的要求:①全面性。審計采集
【參考文獻】:
期刊論文
[1]審計大數(shù)據(jù)分析人才需求及其培養(yǎng)——基于CDIO理念的模式建構(gòu)[J]. 陽杰,應(yīng)里孟. 財會月刊. 2019(04)
[2]審計全覆蓋驅(qū)動下的審計技術(shù)方法創(chuàng)新研究[J]. 陳駿,時現(xiàn). 審計研究. 2018(05)
[3]基于網(wǎng)絡(luò)爬蟲技術(shù)的大數(shù)據(jù)審計方法研究[J]. 陳偉,孫夢蝶. 中國注冊會計師. 2018(07)
[4]財政專項資金審計難點及應(yīng)對策略探析[J]. 徐海軍. 中國注冊會計師. 2018(03)
[5]審計大數(shù)據(jù)的提出、特征及挑戰(zhàn)[J]. 呂天陽,楊蘊毅,邱玉慧. 財會月刊. 2018(05)
[6]基于大數(shù)據(jù)可視化技術(shù)的審計線索特征挖掘方法研究[J]. 陳偉,居江寧. 審計研究. 2018(01)
[7]關(guān)于專項資金財務(wù)審計問題的研究[J]. 成沖. 財經(jīng)界(學(xué)術(shù)版). 2017(23)
[8]大數(shù)據(jù)價值鏈視角下的審計工作創(chuàng)新與實踐[J]. 牛艷芳,馮占國,孟祥宇. 審計研究. 2017(05)
[9]主題網(wǎng)絡(luò)爬蟲技術(shù)在高速公路信息采集中的應(yīng)用[J]. 張芳,王培進. 煙臺大學(xué)學(xué)報(自然科學(xué)與工程版). 2017(03)
[10]基于網(wǎng)絡(luò)爬蟲技術(shù)的健康醫(yī)療大數(shù)據(jù)采集整理系統(tǒng)[J]. 卞偉瑋,王永超,崔立真,郭偉,李暉,周苗,薛付忠,劉靜. 山東大學(xué)學(xué)報(醫(yī)學(xué)版). 2017(06)
碩士論文
[1]大數(shù)據(jù)環(huán)境下的專項資金審計研究與應(yīng)用[D]. 孫夢蝶.南京審計大學(xué) 2018
本文編號:3253735
【文章來源】:南京審計大學(xué)江蘇省
【文章頁數(shù)】:89 頁
【學(xué)位級別】:碩士
【部分圖文】:
論文演化路徑圖
11圖2.1傳感器數(shù)據(jù)主要來源而對于物聯(lián)網(wǎng)中的數(shù)據(jù)主要是通過傳感器進行數(shù)據(jù)采集。傳感器在日常生活中很常見,用于測量物理量并將物理量轉(zhuǎn)換為可讀數(shù)字信號,以便后續(xù)處理(和存儲)。感官數(shù)據(jù)可分為聲波,聲音,振動,汽車,化學(xué),電流,天氣,壓力,溫度等。感知信息通過有線或無線網(wǎng)絡(luò)傳輸?shù)綌?shù)據(jù)收集點。對于可以容易地部署和管理的應(yīng)用,例如視頻監(jiān)視系統(tǒng),有線傳感器網(wǎng)絡(luò)是獲取相關(guān)信息的便利解決方案。有時,特定現(xiàn)象的準確位置是未知的,有時受監(jiān)控的環(huán)境沒有能量或通信基礎(chǔ)設(shè)施。然后必須使用無線通信來在有限的能量和通信能力下實現(xiàn)傳感器節(jié)點之間的數(shù)據(jù)傳輸。近年來,無線傳感器網(wǎng)絡(luò)受到了廣泛的關(guān)注,并已應(yīng)用于許多應(yīng)用,如環(huán)境研究[34],水質(zhì)監(jiān)測[50],土木工程[36]等。②系統(tǒng)日志采集許多的業(yè)務(wù)平臺每天都會產(chǎn)生大量的日志數(shù)據(jù)。對于這些日志信息,可以得到出很多有價值的數(shù)據(jù)。通過對這些日志信息進行日志采集、收集,然后進行數(shù)據(jù)分析,挖掘公司業(yè)務(wù)平臺日志數(shù)據(jù)中的潛在價值。為公司決策和公司后臺服務(wù)器平臺性能評估提高可靠的數(shù)據(jù)保證。系統(tǒng)日志采集系統(tǒng)做的事情就是收集日志數(shù)據(jù)提供離線和在線的實時分析使用。日志文件采集作為一種廣泛使用的數(shù)據(jù)收集方法,日志文件是由數(shù)據(jù)源系統(tǒng)自動生成的記錄文件,以便以指定的文件格式記錄活動以供后續(xù)分析。日志文件通常用于幾乎所有數(shù)字設(shè)備。例如,Web服務(wù)器在日志文件中記錄網(wǎng)頁用戶的點擊次數(shù),點擊率,訪問次數(shù)和其他財產(chǎn)記錄[69]。為了捕獲網(wǎng)站上用戶的活動,Web服務(wù)器主要包括以下三種日志文件格式:公共日志文件格式(NCSA),擴展日志格式(W3C)和IIS日志格式(Microsoft)。所有這三種類型的日志文件都是ASCII文本格式。除文本文件之外的數(shù)據(jù)庫有時可用于?
17下,將不符合審計系統(tǒng)的文件轉(zhuǎn)換成符合審計系統(tǒng)讀取的文件。(6)開放數(shù)據(jù)互連(ODBC)采用數(shù)據(jù)庫連接中間件,如ODBC接口等直接對被審計單位的數(shù)據(jù)進行采集。在實際審計業(yè)務(wù)中,對于業(yè)務(wù)數(shù)據(jù)的采集可分為對于非數(shù)據(jù)庫數(shù)據(jù)的采集和數(shù)據(jù)庫數(shù)據(jù)的采集。對于非數(shù)據(jù)庫數(shù)據(jù)的采集,通常包括對文本數(shù)據(jù)、電子表格數(shù)據(jù)、XML數(shù)據(jù)以及其他常見格式數(shù)據(jù)的采集(如WORD、EXCEL、PDF、WPS和網(wǎng)頁文件的格式數(shù)據(jù)等)。而對被審計單位數(shù)據(jù)庫數(shù)據(jù)的采集,在審計業(yè)務(wù)中常見的有DBF數(shù)據(jù)采集、ACCESS數(shù)據(jù)采集、SQLServer數(shù)據(jù)采集和ORACLE數(shù)據(jù)采集。具體采集內(nèi)容和方法,如圖2.2。圖2.2審計業(yè)務(wù)數(shù)據(jù)采集審計數(shù)據(jù)采集是審計業(yè)務(wù)開展的重要環(huán)節(jié),審計數(shù)據(jù)采集不僅會影響最終審計結(jié)果的準確性,也會對審計計劃的投入產(chǎn)出比產(chǎn)生影響。同時,審計數(shù)據(jù)采集也是開展審計大數(shù)據(jù)的基本前提。因此,在審計數(shù)據(jù)采集中要遵循幾點數(shù)據(jù)采集原則,而不僅僅依靠被審計單位的數(shù)據(jù)滿足審計需求。首先,對于采集審計數(shù)據(jù)的選擇應(yīng)以能夠?qū)崿F(xiàn)審計項目計劃方案、查處審計疑點和線索為目標。其次,要在對被審計單位業(yè)務(wù)流程以及被審計單位應(yīng)用系統(tǒng)充分了解的前提下進行數(shù)據(jù)采集。最后,不僅要采集被審計單位內(nèi)部的數(shù)據(jù),更加要對與被審計單位相關(guān)的市嘗行業(yè)等外部關(guān)聯(lián)數(shù)據(jù)進行采集。隨著信息化技術(shù)的快速發(fā)展,尤其當(dāng)前大數(shù)據(jù)和人工智能技術(shù)的應(yīng)用,各行各業(yè)實現(xiàn)智能化辦公,導(dǎo)致審計數(shù)據(jù)的采集也成為了審計中的一個難題。目前,審計大數(shù)據(jù)的采集對審計數(shù)據(jù)采集方法提出了更高的要求:①全面性。審計采集
【參考文獻】:
期刊論文
[1]審計大數(shù)據(jù)分析人才需求及其培養(yǎng)——基于CDIO理念的模式建構(gòu)[J]. 陽杰,應(yīng)里孟. 財會月刊. 2019(04)
[2]審計全覆蓋驅(qū)動下的審計技術(shù)方法創(chuàng)新研究[J]. 陳駿,時現(xiàn). 審計研究. 2018(05)
[3]基于網(wǎng)絡(luò)爬蟲技術(shù)的大數(shù)據(jù)審計方法研究[J]. 陳偉,孫夢蝶. 中國注冊會計師. 2018(07)
[4]財政專項資金審計難點及應(yīng)對策略探析[J]. 徐海軍. 中國注冊會計師. 2018(03)
[5]審計大數(shù)據(jù)的提出、特征及挑戰(zhàn)[J]. 呂天陽,楊蘊毅,邱玉慧. 財會月刊. 2018(05)
[6]基于大數(shù)據(jù)可視化技術(shù)的審計線索特征挖掘方法研究[J]. 陳偉,居江寧. 審計研究. 2018(01)
[7]關(guān)于專項資金財務(wù)審計問題的研究[J]. 成沖. 財經(jīng)界(學(xué)術(shù)版). 2017(23)
[8]大數(shù)據(jù)價值鏈視角下的審計工作創(chuàng)新與實踐[J]. 牛艷芳,馮占國,孟祥宇. 審計研究. 2017(05)
[9]主題網(wǎng)絡(luò)爬蟲技術(shù)在高速公路信息采集中的應(yīng)用[J]. 張芳,王培進. 煙臺大學(xué)學(xué)報(自然科學(xué)與工程版). 2017(03)
[10]基于網(wǎng)絡(luò)爬蟲技術(shù)的健康醫(yī)療大數(shù)據(jù)采集整理系統(tǒng)[J]. 卞偉瑋,王永超,崔立真,郭偉,李暉,周苗,薛付忠,劉靜. 山東大學(xué)學(xué)報(醫(yī)學(xué)版). 2017(06)
碩士論文
[1]大數(shù)據(jù)環(huán)境下的專項資金審計研究與應(yīng)用[D]. 孫夢蝶.南京審計大學(xué) 2018
本文編號:3253735
本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/3253735.html
最近更新
教材專著