面向排名預測的上市公司股價收益研究
發(fā)布時間:2021-01-25 09:43
對于在深圳證券交易所上市的公司,通過分析和挖掘其季度報表或者相關交易網(wǎng)站中的數(shù)據(jù),提取到排名預測任務中相關的數(shù)據(jù)特征以及通過爬蟲獲得的文本特征,成功構建了公司每股收益預測排名的模型,實現(xiàn)了對股價收益排名的合理預測.實驗結果表明,我們的提出的模型能夠有效的提高股價排名預測任務的性能,其中SPRP-Random Forests模型在NDCG@10評價指標中可以達到0. 9583.在為股民選擇股票,公司經(jīng)營模式調(diào)整等方面具有一定的實用價值.
【文章來源】:小型微型計算機系統(tǒng). 2020,41(01)北大核心
【文章頁數(shù)】:5 頁
【部分圖文】:
面向股價排名預測的排序學習模型
除去以上因素,考慮到公司的運營狀況也受到非系統(tǒng)性因素的影響,譬如說企業(yè)的新聞報導就會極大程度的影響公司的運營,負面新聞過多勢必會給企業(yè)帶來消極影響,從而影響公司的股票價格.企業(yè)員工對公司的評價也是一項影響公司股價的重要指標,風評較好的企業(yè)勢必擁有著良好的企業(yè)文化和經(jīng)營方向,這樣的企業(yè)便擁有良好的發(fā)展前景.所以實驗中便又提取了員工評價和企業(yè)新聞作為文本特征,其中員工評價主要來自于看準網(wǎng)的公司評價,我們對實驗中公司評價進行爬取,對評級為1到2星的公司標簽置為-1,3星置為0,4到5星置為1.企業(yè)新聞主要是對指定時間內(nèi)的公司的新聞進行爬取,并利用詞語極性字典對新聞中的詞頻進行統(tǒng)計,其中消極詞頻大于積極詞頻我們將標簽置為-1,消極詞頻小于積極詞頻我們將標簽置為1,否則為0.實驗特征具體如圖2所示.3.1.3 數(shù)據(jù)預處理
為了更加充分和系統(tǒng)地對股價收益排名任務進行研究,本文首次將排序學習方法和股價收益排名任務相結合,并構建了SPRP模型.排序學習在信息檢索領域[8]已經(jīng)有著非常成熟的研究,并延伸到多個熱門領域,憑借著機器學習手段不斷地提高排序結果.為了使SPRP模型與股價收益預測任務充分契合,我們構建了兩個領域的概映射關系,如圖3所示.實驗中以季度作為時間點,并以行業(yè)類別對公司進行了劃分,用每個季度對應信息檢索領域的查詢(query),某個行業(yè)的某個季度的公司股價收益排行與查詢結果的相關文檔集合(document set)相對應,某季度內(nèi)特定行業(yè)的公司股價收益排名與文檔相關等級(relevant level)相對應.通過映射預測公司股價收益排名便轉化為成功檢索出來的相關文檔在文檔集合中的排序問題.
【參考文獻】:
期刊論文
[1]皮爾森優(yōu)化結合Xgboost算法的股價預測研究[J]. 陳宇韶,唐振軍,羅揚,楊潔. 信息技術. 2018(09)
[2]一種魯棒性增強的LambdaMART算法[J]. 李金忠,劉關俊. 小型微型計算機系統(tǒng). 2017(05)
本文編號:2999006
【文章來源】:小型微型計算機系統(tǒng). 2020,41(01)北大核心
【文章頁數(shù)】:5 頁
【部分圖文】:
面向股價排名預測的排序學習模型
除去以上因素,考慮到公司的運營狀況也受到非系統(tǒng)性因素的影響,譬如說企業(yè)的新聞報導就會極大程度的影響公司的運營,負面新聞過多勢必會給企業(yè)帶來消極影響,從而影響公司的股票價格.企業(yè)員工對公司的評價也是一項影響公司股價的重要指標,風評較好的企業(yè)勢必擁有著良好的企業(yè)文化和經(jīng)營方向,這樣的企業(yè)便擁有良好的發(fā)展前景.所以實驗中便又提取了員工評價和企業(yè)新聞作為文本特征,其中員工評價主要來自于看準網(wǎng)的公司評價,我們對實驗中公司評價進行爬取,對評級為1到2星的公司標簽置為-1,3星置為0,4到5星置為1.企業(yè)新聞主要是對指定時間內(nèi)的公司的新聞進行爬取,并利用詞語極性字典對新聞中的詞頻進行統(tǒng)計,其中消極詞頻大于積極詞頻我們將標簽置為-1,消極詞頻小于積極詞頻我們將標簽置為1,否則為0.實驗特征具體如圖2所示.3.1.3 數(shù)據(jù)預處理
為了更加充分和系統(tǒng)地對股價收益排名任務進行研究,本文首次將排序學習方法和股價收益排名任務相結合,并構建了SPRP模型.排序學習在信息檢索領域[8]已經(jīng)有著非常成熟的研究,并延伸到多個熱門領域,憑借著機器學習手段不斷地提高排序結果.為了使SPRP模型與股價收益預測任務充分契合,我們構建了兩個領域的概映射關系,如圖3所示.實驗中以季度作為時間點,并以行業(yè)類別對公司進行了劃分,用每個季度對應信息檢索領域的查詢(query),某個行業(yè)的某個季度的公司股價收益排行與查詢結果的相關文檔集合(document set)相對應,某季度內(nèi)特定行業(yè)的公司股價收益排名與文檔相關等級(relevant level)相對應.通過映射預測公司股價收益排名便轉化為成功檢索出來的相關文檔在文檔集合中的排序問題.
【參考文獻】:
期刊論文
[1]皮爾森優(yōu)化結合Xgboost算法的股價預測研究[J]. 陳宇韶,唐振軍,羅揚,楊潔. 信息技術. 2018(09)
[2]一種魯棒性增強的LambdaMART算法[J]. 李金忠,劉關俊. 小型微型計算機系統(tǒng). 2017(05)
本文編號:2999006
本文鏈接:http://www.sikaile.net/jingjilunwen/jinrongzhengquanlunwen/2999006.html
教材專著