基于神經(jīng)網(wǎng)絡(luò)與自適應(yīng)分形分析的股評(píng)情感分析
發(fā)布時(shí)間:2021-06-23 03:59
經(jīng)典金融學(xué)以有效性市場(chǎng)為假說(shuō),認(rèn)為金融市場(chǎng)的價(jià)值始終等于其基本價(jià)值,但卻無(wú)法解釋現(xiàn)實(shí)生活中的“異象”,行為金融學(xué)強(qiáng)調(diào)市場(chǎng)投資者的認(rèn)知與情緒會(huì)對(duì)其決策產(chǎn)生影響,從而引起資本市場(chǎng)價(jià)格波動(dòng)。股市作為投資市場(chǎng)的重要組成部分,其指數(shù)變動(dòng)也會(huì)受到投資者情緒的影響。有很多學(xué)者利用機(jī)器學(xué)習(xí)方法對(duì)與股市投資者相關(guān)的文本進(jìn)行過(guò)情感挖掘,但鮮有人提及現(xiàn)實(shí)應(yīng)用環(huán)境下由于文本噪聲過(guò)多產(chǎn)生的不均衡文本分類(lèi)問(wèn)題。本文針對(duì)此問(wèn)題采用序列生成對(duì)抗網(wǎng)絡(luò)算法作為文本生成器,對(duì)不均衡的股民評(píng)論等數(shù)據(jù)集完成過(guò)采樣工作,通過(guò)在隨機(jī)森林分類(lèi)器上進(jìn)行分類(lèi)比較得出,利用序列生成對(duì)抗網(wǎng)絡(luò)算法進(jìn)行文本過(guò)采樣的方法要比傳統(tǒng)的基于插值的SMOTE、Borderline-SMOTE、ADASYN等過(guò)采樣方法有效,更適合用于不均衡文本分類(lèi)任務(wù)。其次針對(duì)傳統(tǒng)的卷積神經(jīng)網(wǎng)絡(luò)不能捕捉到語(yǔ)料中的長(zhǎng)期的上下文關(guān)系以及非連續(xù)詞之間的關(guān)系,本文將注意力機(jī)制引入到經(jīng)典的短文本分類(lèi)卷積神經(jīng)網(wǎng)絡(luò)模型,并通過(guò)實(shí)驗(yàn)證明改進(jìn)結(jié)構(gòu)的有效性。最后本文利用隨機(jī)分形理論里的自適應(yīng)分形分析(AFA),結(jié)合構(gòu)建出的投資者情緒指數(shù)與股市對(duì)數(shù)收益率,對(duì)已經(jīng)分出了情感傾向的股民評(píng)論進(jìn)行情感...
【文章來(lái)源】:廣西大學(xué)廣西壯族自治區(qū) 211工程院校
【文章頁(yè)數(shù)】:70 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖2-1隨機(jī)過(guò)采樣示意圖??
ft?^??圖2-2二維平面SMOTE采樣示意圖??Fig.?2-2?SMOTE?sampling?in?2D??可以看到,SMOTE合成的新樣本點(diǎn)相當(dāng)于舊樣本點(diǎn)與其最近鄰點(diǎn)連線上以一定的??概率選取的點(diǎn),所以算法可視為“插值”生成新樣本。??SMOTE算法以“插值”的方式生成新樣本點(diǎn),主要存在兩方面的問(wèn)題:??一是在近鄰選擇時(shí)存在一定的盲目性,從算法流程可以看出,K的值需要由用戶(hù)指??定,K值的上下限難以根據(jù)實(shí)際應(yīng)用情況確定;??二是算法容易生成一些噪音,將原樣本點(diǎn)與其對(duì)立類(lèi)別的點(diǎn)混合到一起,具體可如??圖2-3所示:??SMOTE??60-j??4〇?■?、*?.fd???1??1?1?T??1?1??????-60?-40?-20?0?20?40?60??圖2-3?SMOTE生成采樣點(diǎn)示意圖??Fig.?2-3?Sample?generated?using?SMOTE??圖2-3所示的是圖2-1中的樣本經(jīng)過(guò)SMOTE采樣后的結(jié)果,可以看到,中間紅色??方框框起來(lái)的是少數(shù)類(lèi)經(jīng)過(guò)過(guò)采樣生成的部分?jǐn)?shù)據(jù)點(diǎn)
K值的上下限難以根據(jù)實(shí)際應(yīng)用情況確定;??二是算法容易生成一些噪音,將原樣本點(diǎn)與其對(duì)立類(lèi)別的點(diǎn)混合到一起,具體可如??圖2-3所示:??SMOTE??60-j??4〇?■?、*?.fd???1??1?1?T??1?1??????-60?-40?-20?0?20?40?60??圖2-3?SMOTE生成采樣點(diǎn)示意圖??Fig.?2-3?Sample?generated?using?SMOTE??圖2-3所示的是圖2-1中的樣本經(jīng)過(guò)SMOTE采樣后的結(jié)果,可以看到,中間紅色??方框框起來(lái)的是少數(shù)類(lèi)經(jīng)過(guò)過(guò)采樣生成的部分?jǐn)?shù)據(jù)點(diǎn),這些數(shù)據(jù)點(diǎn)模糊了多數(shù)類(lèi)與少數(shù)??9??
【參考文獻(xiàn)】:
期刊論文
[1]不平衡數(shù)據(jù)分類(lèi)方法綜述[J]. 李艷霞,柴毅,胡友強(qiáng),尹宏鵬. 控制與決策. 2019(04)
[2]基于類(lèi)重疊度欠采樣的不平衡模糊多類(lèi)支持向量機(jī)[J]. 吳園園,申立勇. 中國(guó)科學(xué)院大學(xué)學(xué)報(bào). 2018(04)
[3]投資者情緒與股票市場(chǎng)收益的相關(guān)性研究——基于多重分形分析方法[J]. 孫凌蕓,張金林. 金融評(píng)論. 2017(05)
[4]社交媒體投資者關(guān)注、投資者情緒對(duì)中國(guó)股票市場(chǎng)的影響[J]. 石勇,唐靜,郭琨. 中央財(cái)經(jīng)大學(xué)學(xué)報(bào). 2017(07)
[5]基于多次隨機(jī)欠采樣和POSS方法的軟件缺陷檢測(cè)[J]. 方昊,李云. 山東大學(xué)學(xué)報(bào)(工學(xué)版). 2017(01)
[6]投資者情緒對(duì)股票市場(chǎng)收益和波動(dòng)的影響——基于開(kāi)放式股票型基金資金凈流入的實(shí)證研究[J]. 王春. 中國(guó)管理科學(xué). 2014(09)
[7]投資者情緒、資產(chǎn)估值與股票市場(chǎng)波動(dòng)[J]. 胡昌生,池陽(yáng)春. 金融研究. 2013(10)
[8]中國(guó)股市投資者情緒與股票收益的實(shí)證研究[J]. 張強(qiáng),楊淑娥,楊紅. 系統(tǒng)工程. 2007(07)
[9]投資者情緒與股市的互動(dòng)研究[J]. 程昆,劉仁和. 上海經(jīng)濟(jì)研究. 2005(11)
[10]投資者情感假說(shuō)及其在中國(guó)股市的應(yīng)用[J]. 張圣平,張崢,吳毛利. 經(jīng)濟(jì)學(xué)動(dòng)態(tài). 2004(09)
博士論文
[1]面向不平衡數(shù)據(jù)的特征選擇與半監(jiān)督分類(lèi)算法研究[D]. 杜利敏.西南交通大學(xué) 2017
本文編號(hào):3244183
【文章來(lái)源】:廣西大學(xué)廣西壯族自治區(qū) 211工程院校
【文章頁(yè)數(shù)】:70 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖2-1隨機(jī)過(guò)采樣示意圖??
ft?^??圖2-2二維平面SMOTE采樣示意圖??Fig.?2-2?SMOTE?sampling?in?2D??可以看到,SMOTE合成的新樣本點(diǎn)相當(dāng)于舊樣本點(diǎn)與其最近鄰點(diǎn)連線上以一定的??概率選取的點(diǎn),所以算法可視為“插值”生成新樣本。??SMOTE算法以“插值”的方式生成新樣本點(diǎn),主要存在兩方面的問(wèn)題:??一是在近鄰選擇時(shí)存在一定的盲目性,從算法流程可以看出,K的值需要由用戶(hù)指??定,K值的上下限難以根據(jù)實(shí)際應(yīng)用情況確定;??二是算法容易生成一些噪音,將原樣本點(diǎn)與其對(duì)立類(lèi)別的點(diǎn)混合到一起,具體可如??圖2-3所示:??SMOTE??60-j??4〇?■?、*?.fd???1??1?1?T??1?1??????-60?-40?-20?0?20?40?60??圖2-3?SMOTE生成采樣點(diǎn)示意圖??Fig.?2-3?Sample?generated?using?SMOTE??圖2-3所示的是圖2-1中的樣本經(jīng)過(guò)SMOTE采樣后的結(jié)果,可以看到,中間紅色??方框框起來(lái)的是少數(shù)類(lèi)經(jīng)過(guò)過(guò)采樣生成的部分?jǐn)?shù)據(jù)點(diǎn)
K值的上下限難以根據(jù)實(shí)際應(yīng)用情況確定;??二是算法容易生成一些噪音,將原樣本點(diǎn)與其對(duì)立類(lèi)別的點(diǎn)混合到一起,具體可如??圖2-3所示:??SMOTE??60-j??4〇?■?、*?.fd???1??1?1?T??1?1??????-60?-40?-20?0?20?40?60??圖2-3?SMOTE生成采樣點(diǎn)示意圖??Fig.?2-3?Sample?generated?using?SMOTE??圖2-3所示的是圖2-1中的樣本經(jīng)過(guò)SMOTE采樣后的結(jié)果,可以看到,中間紅色??方框框起來(lái)的是少數(shù)類(lèi)經(jīng)過(guò)過(guò)采樣生成的部分?jǐn)?shù)據(jù)點(diǎn),這些數(shù)據(jù)點(diǎn)模糊了多數(shù)類(lèi)與少數(shù)??9??
【參考文獻(xiàn)】:
期刊論文
[1]不平衡數(shù)據(jù)分類(lèi)方法綜述[J]. 李艷霞,柴毅,胡友強(qiáng),尹宏鵬. 控制與決策. 2019(04)
[2]基于類(lèi)重疊度欠采樣的不平衡模糊多類(lèi)支持向量機(jī)[J]. 吳園園,申立勇. 中國(guó)科學(xué)院大學(xué)學(xué)報(bào). 2018(04)
[3]投資者情緒與股票市場(chǎng)收益的相關(guān)性研究——基于多重分形分析方法[J]. 孫凌蕓,張金林. 金融評(píng)論. 2017(05)
[4]社交媒體投資者關(guān)注、投資者情緒對(duì)中國(guó)股票市場(chǎng)的影響[J]. 石勇,唐靜,郭琨. 中央財(cái)經(jīng)大學(xué)學(xué)報(bào). 2017(07)
[5]基于多次隨機(jī)欠采樣和POSS方法的軟件缺陷檢測(cè)[J]. 方昊,李云. 山東大學(xué)學(xué)報(bào)(工學(xué)版). 2017(01)
[6]投資者情緒對(duì)股票市場(chǎng)收益和波動(dòng)的影響——基于開(kāi)放式股票型基金資金凈流入的實(shí)證研究[J]. 王春. 中國(guó)管理科學(xué). 2014(09)
[7]投資者情緒、資產(chǎn)估值與股票市場(chǎng)波動(dòng)[J]. 胡昌生,池陽(yáng)春. 金融研究. 2013(10)
[8]中國(guó)股市投資者情緒與股票收益的實(shí)證研究[J]. 張強(qiáng),楊淑娥,楊紅. 系統(tǒng)工程. 2007(07)
[9]投資者情緒與股市的互動(dòng)研究[J]. 程昆,劉仁和. 上海經(jīng)濟(jì)研究. 2005(11)
[10]投資者情感假說(shuō)及其在中國(guó)股市的應(yīng)用[J]. 張圣平,張崢,吳毛利. 經(jīng)濟(jì)學(xué)動(dòng)態(tài). 2004(09)
博士論文
[1]面向不平衡數(shù)據(jù)的特征選擇與半監(jiān)督分類(lèi)算法研究[D]. 杜利敏.西南交通大學(xué) 2017
本文編號(hào):3244183
本文鏈接:http://www.sikaile.net/jingjilunwen/jinrongzhengquanlunwen/3244183.html
最近更新
教材專(zhuān)著