基于情感分析的上市公司年報舞弊預警研究
發(fā)布時間:2021-08-14 21:38
上市公司年度報告作為反映企業(yè)經營情況的權威發(fā)布文件,相比于其他輿論信息更加正式,給讀者帶來視覺匿名感,內含大量的主觀性文本。主觀性文本內容可操縱性強,在描述時可能存在過度美化、避重就輕等情況,在實際監(jiān)管中,如果管理者有意隱瞞或會計作假,在文本部分可能存在異于往常的情感變化,將在一定程度上誤導投資者的決策判斷。因此,對這部分文本進行情感分析,對于觸發(fā)財務審計具有很好的預警作用。由于文本的非結構化特性,分析難度更大,財務審計人員使用常規(guī)的分析方法不能準確的挖掘文本信息。因此,本文以年報為研究對象,利用人工智能技術挖掘披露報告的情感信息,探究其在舞弊檢測方面的影響。具體研究內容如下:(1)基于語義的上市公司年報文本情感分析研究。該研究結合語料庫和知識庫的特點,借助通用情感詞典自動標引訓練語料,利用詞向量的方法判別報告中候選情感詞的極性,結合權威的金融詞典構建了面向年報的中文情感詞典,通過匹配語義規(guī)則實現(xiàn)篇章級年報文本的情感分析。(2)基于深度學習的細粒度年報文本情感分析研究。該研究采用人工標注的數(shù)據(jù)集,引入BERT預訓練模型實現(xiàn)年報文本句子的向量化表達,以解決目前其他語言模型不能有效考慮上下...
【文章來源】:東北林業(yè)大學黑龍江省 211工程院校 教育部直屬院校
【文章頁數(shù)】:65 頁
【學位級別】:碩士
【部分圖文】:
圖2-1網絡爬蟲的一般流程??
句子B,通過模型訓練來判定句子B是否是句子A的下一??句。訓練過程如下:??(1)利用預訓練的語料構造訓練集,其中50%的樣本,句子A和句子B是上下文的??關系,將這類樣本標簽記為“IsNext”。??(2)另外50%的樣本,句子B是隨機從語料庫中抽取的,與A無上下文關系,將這??類樣本標簽記為“NotNext”。??(3)將句子A與句子B拼接后輸入預訓練的模型,利用“[CLS]”標記每一次輸入的??樣本,最后利用[CLS]對應的輸出向量來預測標簽的類別。??BERT模型的結構如圖2-3所示。??Tl?。?...?Tn??Transformer?Transfomier?...?Transformer??Transformer?Transformer?…?Transformer??E.?E:?…?En??圖2-3?BERT預訓練語言模型【42]??BERT模型采用雙向Transformer作為特征抽取器,通過查詢字向量表將文本的每個字??符轉換為向量作為模型的輸入,輸入字符對應的融合全文語義信息后的向量表示則為模型的??輸出。特別的是,BERT模型的輸入除了字符向量(Token?Embeddings)還包括文本向量??-12-??
d&Norm?—??"?I?I??x.?,?"?j^f?Masked?^??MAUl"-Head?Mulf-Head??Attention?A??、?Attention?^??-??J?L?/??Positional?^?4?Positional??Econding?W?Econding??^?Input?Embedding〕?^?Output?Embedding??^r^.’?————「:??Inputs?Outputs??圖24?Transformer模型結構圖??作為-種雙向模型,Transformer的編碼器摒棄了傳統(tǒng)的CNN和RNN的祌經網絡結??構,僅使用自注意力機制,能夠一次性地從前往后或者從后往前來獲取輸入義本序列的所冇??信息。Transformer的網絡結構特征使得模型可以利用某一詞周圍的所冇文木農進行丨:K文??的學習可并行捕獲長距離依賴關系,且運算速度快。??由于生成語言模型并不需要Transformer中解H器的部分,閃此BERT模型進行語言建??模只需要Transformer中作為特征抽取器的編朽部分,由多個Transformer模型的編碼器結??構堆疊形成。Transformer的編碼器部分將字符向量和位置向量直接加和作為輸入,經過多??-13-??
【參考文獻】:
期刊論文
[1]基于深度學習的APP-Store評論情感分析[J]. 李鑫,李曉戈. 計算機與數(shù)字工程. 2019(10)
[2]基于情感詞典的課程評論情感分析[J]. 胡榮,崔榮一,趙亞慧. 延邊大學學報(自然科學版). 2019(02)
[3]基于深度學習的中英文混合短文本情感分析[J]. 龔澤陽,徐華韞,何正杰,崔金真,吳珂. 信息與電腦(理論版). 2019(05)
[4]基于機器學習與情感詞典的文本主題概括及情感分析[J]. 宋祖康,閻瑞霞,辜麗瓊. 軟件導刊. 2019(04)
[5]基于深度神經網絡和LSTM的文本情感分析[J]. 王子牛,吳建華,高建瓴,陳婭先,王許. 軟件. 2018(12)
[6]基于CNN和BiLSTM網絡特征融合的文本情感分析[J]. 李洋,董紅斌. 計算機應用. 2018(11)
[7]基于卷積神經網絡與多特征融合的Twitter情感分類方法[J]. 王汝嬌,姬東鴻. 計算機工程. 2018(02)
[8]細粒度情感分析研究綜述[J]. 唐曉波,劉廣超. 圖書情報工作. 2017(05)
[9]會計舞弊的財務預警分析[J]. 羅昕煒,彭茜. 行政事業(yè)資產與財務. 2017(10)
[10]常用中文分詞軟件在中醫(yī)文本文獻研究領域的適用性研究[J]. 楊海豐,陳明亮,趙臻. 世界科學技術-中醫(yī)藥現(xiàn)代化. 2017(03)
碩士論文
[1]基于情感分析的旅游景點推薦[D]. 何雪琴.新疆大學 2019
[2]基于域對抗網絡的跨領域文本情感分析[D]. 林強.桂林電子科技大學 2019
[3]產品評論文本的情感分析方法研究[D]. 原多多.蘭州財經大學 2019
[4]管理層討論與分析的語言特征和企業(yè)未來業(yè)績關系研究[D]. 李勝男.哈爾濱工業(yè)大學 2018
[5]情感分析方法在金融語料庫中的應用[D]. 張道玲.暨南大學 2018
[6]詞向量的改進及其在作品風格識別中的應用[D]. 王賀.大連理工大學 2018
[7]企業(yè)財務舞弊特征與審計方法研究[D]. 龍鳳.西南財經大學 2012
本文編號:3343231
【文章來源】:東北林業(yè)大學黑龍江省 211工程院校 教育部直屬院校
【文章頁數(shù)】:65 頁
【學位級別】:碩士
【部分圖文】:
圖2-1網絡爬蟲的一般流程??
句子B,通過模型訓練來判定句子B是否是句子A的下一??句。訓練過程如下:??(1)利用預訓練的語料構造訓練集,其中50%的樣本,句子A和句子B是上下文的??關系,將這類樣本標簽記為“IsNext”。??(2)另外50%的樣本,句子B是隨機從語料庫中抽取的,與A無上下文關系,將這??類樣本標簽記為“NotNext”。??(3)將句子A與句子B拼接后輸入預訓練的模型,利用“[CLS]”標記每一次輸入的??樣本,最后利用[CLS]對應的輸出向量來預測標簽的類別。??BERT模型的結構如圖2-3所示。??Tl?。?...?Tn??Transformer?Transfomier?...?Transformer??Transformer?Transformer?…?Transformer??E.?E:?…?En??圖2-3?BERT預訓練語言模型【42]??BERT模型采用雙向Transformer作為特征抽取器,通過查詢字向量表將文本的每個字??符轉換為向量作為模型的輸入,輸入字符對應的融合全文語義信息后的向量表示則為模型的??輸出。特別的是,BERT模型的輸入除了字符向量(Token?Embeddings)還包括文本向量??-12-??
d&Norm?—??"?I?I??x.?,?"?j^f?Masked?^??MAUl"-Head?Mulf-Head??Attention?A??、?Attention?^??-??J?L?/??Positional?^?4?Positional??Econding?W?Econding??^?Input?Embedding〕?^?Output?Embedding??^r^.’?————「:??Inputs?Outputs??圖24?Transformer模型結構圖??作為-種雙向模型,Transformer的編碼器摒棄了傳統(tǒng)的CNN和RNN的祌經網絡結??構,僅使用自注意力機制,能夠一次性地從前往后或者從后往前來獲取輸入義本序列的所冇??信息。Transformer的網絡結構特征使得模型可以利用某一詞周圍的所冇文木農進行丨:K文??的學習可并行捕獲長距離依賴關系,且運算速度快。??由于生成語言模型并不需要Transformer中解H器的部分,閃此BERT模型進行語言建??模只需要Transformer中作為特征抽取器的編朽部分,由多個Transformer模型的編碼器結??構堆疊形成。Transformer的編碼器部分將字符向量和位置向量直接加和作為輸入,經過多??-13-??
【參考文獻】:
期刊論文
[1]基于深度學習的APP-Store評論情感分析[J]. 李鑫,李曉戈. 計算機與數(shù)字工程. 2019(10)
[2]基于情感詞典的課程評論情感分析[J]. 胡榮,崔榮一,趙亞慧. 延邊大學學報(自然科學版). 2019(02)
[3]基于深度學習的中英文混合短文本情感分析[J]. 龔澤陽,徐華韞,何正杰,崔金真,吳珂. 信息與電腦(理論版). 2019(05)
[4]基于機器學習與情感詞典的文本主題概括及情感分析[J]. 宋祖康,閻瑞霞,辜麗瓊. 軟件導刊. 2019(04)
[5]基于深度神經網絡和LSTM的文本情感分析[J]. 王子牛,吳建華,高建瓴,陳婭先,王許. 軟件. 2018(12)
[6]基于CNN和BiLSTM網絡特征融合的文本情感分析[J]. 李洋,董紅斌. 計算機應用. 2018(11)
[7]基于卷積神經網絡與多特征融合的Twitter情感分類方法[J]. 王汝嬌,姬東鴻. 計算機工程. 2018(02)
[8]細粒度情感分析研究綜述[J]. 唐曉波,劉廣超. 圖書情報工作. 2017(05)
[9]會計舞弊的財務預警分析[J]. 羅昕煒,彭茜. 行政事業(yè)資產與財務. 2017(10)
[10]常用中文分詞軟件在中醫(yī)文本文獻研究領域的適用性研究[J]. 楊海豐,陳明亮,趙臻. 世界科學技術-中醫(yī)藥現(xiàn)代化. 2017(03)
碩士論文
[1]基于情感分析的旅游景點推薦[D]. 何雪琴.新疆大學 2019
[2]基于域對抗網絡的跨領域文本情感分析[D]. 林強.桂林電子科技大學 2019
[3]產品評論文本的情感分析方法研究[D]. 原多多.蘭州財經大學 2019
[4]管理層討論與分析的語言特征和企業(yè)未來業(yè)績關系研究[D]. 李勝男.哈爾濱工業(yè)大學 2018
[5]情感分析方法在金融語料庫中的應用[D]. 張道玲.暨南大學 2018
[6]詞向量的改進及其在作品風格識別中的應用[D]. 王賀.大連理工大學 2018
[7]企業(yè)財務舞弊特征與審計方法研究[D]. 龍鳳.西南財經大學 2012
本文編號:3343231
本文鏈接:http://www.sikaile.net/guanlilunwen/bankxd/3343231.html