互聯(lián)網(wǎng)財(cái)經(jīng)新聞對股市影響的定量分析
發(fā)布時間:2017-10-24 04:19
本文關(guān)鍵詞:互聯(lián)網(wǎng)財(cái)經(jīng)新聞對股市影響的定量分析
更多相關(guān)文章: 文本挖掘 支持向量機(jī) 互聯(lián)網(wǎng)新聞 股市波動 多元線性回歸
【摘要】:影響股市波動的因素很多,有市場行情、通貨膨脹、交易策略、公司本身等等因素。實(shí)際上,所有與財(cái)經(jīng)相關(guān)的信息都會影響證券市場股價的波動。這些信息、最終可以歸結(jié)為定量信息和定性信息。定量信息是指可以直接獲得的實(shí)際觀測數(shù)據(jù),即技術(shù)指標(biāo),例如紅利股價比、賬面市值比、利潤等。而定性信息、是指不能直接用數(shù)據(jù)精確描述的因素,例如商業(yè)環(huán)境、文化程度、技術(shù)優(yōu)勢、戰(zhàn)爭、自然災(zāi)害、政府經(jīng)濟(jì)政策變動等等,互聯(lián)網(wǎng)財(cái)經(jīng)新聞中就包含了大量的這種定性信息。 新聞對股市有影響,這已經(jīng)是學(xué)術(shù)界和實(shí)業(yè)界公認(rèn)的事實(shí);ヂ(lián)網(wǎng)財(cái)經(jīng)新聞作為信息時代公眾獲取財(cái)經(jīng)信息的主要渠道,其與股市波動之間必然有著某種關(guān)聯(lián),但其對上市公司的報(bào)道將是如何影響證券市場股票的價格波動,即:新聞報(bào)道對股市的影響第幾天最為顯著?新聞報(bào)道對股市影響的持續(xù)時間是多長?中國股票市場分為滬深兩市,那么互聯(lián)財(cái)經(jīng)網(wǎng)新聞對滬深兩市股票產(chǎn)生的影響強(qiáng)度、影響周期是否一致?如果不同,那么分別又體現(xiàn)在哪些方面。這一系列問題的解決,對于監(jiān)管者進(jìn)行股市制度改革、投資者投資策略選擇、承銷商承銷方案制訂等都具有重要的參考意義。 然而目前為止,計(jì)算機(jī)科學(xué)領(lǐng)域?qū)W者對新聞與股市波動之間關(guān)系的研究,僅局限于預(yù)測新聞對股價的影響,并未系統(tǒng)分析兩者之間的種種關(guān)聯(lián)。然而,影響股價波動的因素很多,這使得用新聞預(yù)測股價的準(zhǔn)確度較低,從而實(shí)用價值一直不高。計(jì)算機(jī)領(lǐng)域?qū)W者之所以并未系統(tǒng)分析新聞與股市之間關(guān)系,是因?yàn)榇藛栴}的解決需要借助計(jì)量經(jīng)濟(jì)學(xué)的分析方法。目前,經(jīng)濟(jì)學(xué)領(lǐng)域?qū)W者對新聞與股市的研究,由于技術(shù)的局限性,僅是簡單地分析新聞標(biāo)題、新聞數(shù)量等與股市波動之間的關(guān)系,并未挖掘新聞文本信息,而新聞文本中通常包含大量有價值的軟信息。造成這種現(xiàn)狀的原因是挖掘新聞文本中包含的信息需要計(jì)算機(jī)領(lǐng)域的文本挖掘技術(shù)?傊,各領(lǐng)域都存在技術(shù)局限性,使得系統(tǒng)地分析新聞文本信息與股市波動之間關(guān)系這項(xiàng)研究還處于知識空白。 基于此,本篇文章跨計(jì)算機(jī)科學(xué)與經(jīng)濟(jì)學(xué)兩學(xué)科,利用文本挖掘技術(shù)中的支持向量回歸模型和計(jì)量經(jīng)濟(jì)學(xué)中多元回歸分析方法,將新聞內(nèi)容量化為造成股市波動的一個影響因子,首次從宏觀層面上,系統(tǒng)地分析互聯(lián)網(wǎng)新聞文本信息對中國股市的影響。本文采用如下技術(shù)方案來研究新聞對股市的影響: (1)采用文本挖掘技術(shù),量化定性新聞這種無結(jié)構(gòu)的文本信息對股市的影響,量化結(jié)果作為定性新聞對股市影響的一個因子。此階段涉及的文本挖掘技術(shù)有向量空間模型、TFIDF加權(quán)方法、特征降維、中文分詞、支持向量回歸等等。如何選擇最優(yōu)方法,提高量化結(jié)果的準(zhǔn)確性,這是此階段需要解決的問題,也本篇文章的關(guān)鍵點(diǎn)。本文根據(jù)股市特性,建立股市特有的特征詞庫來進(jìn)行文本向量化,從而將無結(jié)構(gòu)的文本信息轉(zhuǎn)換為結(jié)構(gòu)化的向量形式。在向量化過程中,本文采用TFIDF來進(jìn)行特征加權(quán),采用同義詞詞庫進(jìn)行特征降維,從而得到最終的新聞文本向量。然后采用支持向量回歸來建立新聞文本向量與股票收益率之間的回歸模型,用此模型來量化新聞對股市的影響,量化結(jié)果作為定性新聞影響股市的因子。 (2)將定性新聞對股市影響的因子與定量的影響股市的主要技術(shù)指標(biāo)相結(jié)合,采用計(jì)量經(jīng)濟(jì)學(xué)的多元線性回歸模型,依據(jù)各種假設(shè)檢驗(yàn)來分析新聞是如何影響股市,影響的顯著性等問題。具體而言,本文將量化后的新聞對股市影響的因子作為多元回歸模型的解釋變量之一,將股票累計(jì)異常收益率作為被解釋變量,采用統(tǒng)計(jì)檢驗(yàn)方法來檢驗(yàn)多元回歸模型的擬合優(yōu)度、方程顯著性和新聞等因子的顯著性問題,從而具體分析新聞因子與股市波動之間的關(guān)系。 通過實(shí)驗(yàn),我們發(fā)現(xiàn):滬深兩市上市公司的新聞報(bào)道后都會影響該上市公司的股票的波動,但對深市上市公司股票的影響要強(qiáng)于滬市股票,而且,滬市上市公司的新聞影響力度和持續(xù)時間均小于深市上市公司。同時,我們發(fā)現(xiàn),新聞報(bào)道后滬市上市公司的收益明顯受到公司規(guī)模的影響,經(jīng)分析可得,對于規(guī)模越大的公司,新聞報(bào)道對其股票產(chǎn)生的影響越不明顯,對于規(guī)模越小的公司,新聞報(bào)道對其產(chǎn)生的影響越大,且持續(xù)時間越長。 本文的創(chuàng)新之處可以從以下方面加以詳述。 (1)本文從研究方法上來講,創(chuàng)新之處在于:融合計(jì)算機(jī)領(lǐng)域的文本挖掘技術(shù)與經(jīng)濟(jì)學(xué)領(lǐng)域的計(jì)量方法,跨學(xué)科角度解決新聞與股市波動之間的關(guān)系問題。財(cái)經(jīng)新聞內(nèi)容中包含大量影響股市的信息,本文采用計(jì)算機(jī)領(lǐng)域中的文本挖掘技術(shù)來量化這些信息對股市的影響,并將量化結(jié)果作為影響股市收益率的一個指標(biāo)因子,融合影響股市的幾個主要技術(shù)指標(biāo),采用計(jì)量經(jīng)濟(jì)學(xué)中多元線性回歸分析的各種假設(shè)檢驗(yàn)方法,來分析新聞如何影響股市,影響持續(xù)時間以及影響強(qiáng)度等問題。 (2)本文從研究角度來講,創(chuàng)新之處在于:目前大部分研究還主要集中在用新聞預(yù)測股價方面。本文利用文本挖掘技術(shù)和計(jì)量經(jīng)濟(jì)學(xué)方法,將新聞內(nèi)容量化為影響股市波動的一個因子,系統(tǒng)分析互聯(lián)網(wǎng)財(cái)經(jīng)新聞對中國股市的影響。同時,中國股市分為滬深兩市,但目前為止,很少有研究將滬深兩市進(jìn)行對比分析。本文致力于研究互聯(lián)網(wǎng)財(cái)經(jīng)新聞對滬市和深市股票產(chǎn)生的影響強(qiáng)度、影響周期是否一致等問題。 (3)本文從技術(shù)方面來講,創(chuàng)新之處在于:針對股市特性,本文建立了股市專有的特征詞以及同義詞詞庫。在對新聞文本進(jìn)行中文分詞時,將股市特征詞庫加入分詞字典,增加分詞準(zhǔn)確性。在用文本挖掘技術(shù)進(jìn)行新聞文本向量化時,本文采用的方法是基于特征詞庫的向量化方法,同時根據(jù)同義詞詞庫對文本向量化結(jié)果進(jìn)行特征降維,從而得到一個較為合理的向量化結(jié)果。 本文的內(nèi)容結(jié)構(gòu)安排如下:第一部分介紹論文的研究背景、研究意義以及研究方法;第二部分對本文涉及的相關(guān)技術(shù)進(jìn)行介紹,本文涉及兩個領(lǐng)域的相關(guān)知識,故此部分按領(lǐng)域分別進(jìn)行介紹;第三部分介紹實(shí)驗(yàn)過程所需數(shù)據(jù)的準(zhǔn)備工作,本實(shí)驗(yàn)所需數(shù)據(jù)分為兩大塊,即新聞數(shù)據(jù)和股票交易日數(shù)據(jù),故此部分分別介紹兩塊數(shù)據(jù)的獲取以及預(yù)處理工作;第四部分介紹實(shí)驗(yàn)步驟以及實(shí)驗(yàn)結(jié)果;第五部分對整篇論文做總結(jié)以及展望。
【關(guān)鍵詞】:文本挖掘 支持向量機(jī) 互聯(lián)網(wǎng)新聞 股市波動 多元線性回歸
【學(xué)位授予單位】:西南財(cái)經(jīng)大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2012
【分類號】:F49;F832.51;F224
【目錄】:
- 摘要4-7
- Abstract7-12
- 1. 引言12-24
- 1.1 研究背景12-16
- 1.2 研究目的及意義16-18
- 1.2.1 研究目的17
- 1.2.2 研究意義17-18
- 1.3 研究方法18-21
- 1.3.1 文本挖掘技術(shù)19
- 1.3.2 計(jì)量經(jīng)濟(jì)學(xué)19-20
- 1.3.3 CAPM模型20-21
- 1.4 研究內(nèi)容21-22
- 1.5 本文主要貢獻(xiàn)22-24
- 2. 相關(guān)知識24-35
- 2.1 文本挖掘技術(shù)24-28
- 2.1.1 向量空間模型25-26
- 2.1.2 特征權(quán)重計(jì)算26
- 2.1.3 特征選擇26-27
- 2.1.4 中文分詞27-28
- 2.2 支持向量機(jī)28-30
- 2.3 經(jīng)濟(jì)學(xué)30-32
- 2.3.1 計(jì)量經(jīng)濟(jì)學(xué)31
- 2.3.2 CAPM模型31-32
- 2.4 網(wǎng)頁抓爬器及新聞內(nèi)容提取32-34
- 2.5 本章小結(jié)34-35
- 3. 數(shù)據(jù)準(zhǔn)備35-39
- 3.1 新聞數(shù)據(jù)獲取以及預(yù)處理35-37
- 3.2 股市交易日數(shù)據(jù)37-38
- 3.3 本章小結(jié)38-39
- 4. 實(shí)驗(yàn)設(shè)計(jì)與分析39-51
- 4.1 量化新聞指標(biāo)39-41
- 4.2 計(jì)量分析方法41-42
- 4.3 評測指標(biāo)42-43
- 4.4 實(shí)驗(yàn)環(huán)境以及實(shí)驗(yàn)步驟43-44
- 4.5 實(shí)驗(yàn)結(jié)果分析44-49
- 4.5.1 上海市場新聞對股市影響的定量分析44-46
- 4.5.2 深圳市場新聞對股市影響的定量分析46-48
- 4.5.3 滬深兩市新聞對股市影響的對比分析48-49
- 4.6 本章小結(jié)49-51
- 5. 總結(jié)與展望51-54
- 5.1 研究工作總結(jié)51-52
- 5.2 未來的研究內(nèi)容展望52-54
- 參考文獻(xiàn)54-57
- 后記57-58
- 致謝58-60
- 在讀期間科研成果目錄60
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前6條
1 趙靜梅;何欣;吳風(fēng)云;;中國股市謠言研究:傳謠、辟謠及其對股價的沖擊[J];管理世界;2010年11期
2 何誠穎;中國股市市盈率分布特征及國際比較研究[J];經(jīng)濟(jì)研究;2003年09期
3 楊繼東;;媒體影響了投資者行為嗎?——基于文獻(xiàn)的一個思考[J];金融研究;2007年11期
4 饒育蕾;王攀;;媒體關(guān)注度對新股表現(xiàn)的影響——來自中國股票市場的證據(jù)[J];財(cái)務(wù)與金融;2010年03期
5 徐筱鳳,李壽喜;中國企業(yè)市盈率:理論分析與經(jīng)驗(yàn)證據(jù)[J];世界經(jīng)濟(jì)文匯;2005年Z1期
6 趙偉;梁循;;互聯(lián)網(wǎng)金融信息量與收益率波動關(guān)聯(lián)研究[J];計(jì)算機(jī)技術(shù)與發(fā)展;2009年12期
,本文編號:1086999
本文鏈接:http://www.sikaile.net/guanlilunwen/sjfx/1086999.html
最近更新
教材專著