天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 經(jīng)濟論文 > 股票論文 >

基于多因子選股的半監(jiān)督核聚類算法改進研究

發(fā)布時間:2020-06-04 14:33
【摘要】:研究了一種附有引力影響因子的半監(jiān)督K-means核函數(shù)聚類算法,并將該方法應(yīng)用于多因子選股模型中。研究表明,相比傳統(tǒng)的聚類模型,改進的模型具有較強的泛化能力,模型在處理樣本線性不可分、樣本分布非球狀簇等問題上具有明顯的優(yōu)勢,能選出較優(yōu)的股票組合。
【圖文】:

函數(shù)圖像,高斯核,核函數(shù),多項式


試點距離較大時,多項式核函數(shù)值逐漸增大,并將趨于無窮。因此,多項式核函數(shù)具有較強的泛化能力,但學(xué)習(xí)能力較弱。圖2多項式核函數(shù)高斯核函數(shù)將樣本向量映射到高維特征空間中,會使得樣本點變得非常稀疏,要改變這一特性必須滿足兩個條件,第一是在測試點附近有較快衰減,第二是在無限遠處仍保持適度衰減。本文基于核函數(shù)理論,引入了一種修正的高斯核函數(shù)[10],其表達式為:K(xi,xj)=expσ2‖xi-xj‖2+γ2+()λ(4)其中,σ是核函數(shù)的帶寬變量,γ為位移參數(shù),λ為微調(diào)參數(shù)變量,該核函數(shù)兼具全局性核函數(shù)與局部性核函數(shù)的性質(zhì)。通過修正后的高斯核函數(shù)可知,當(dāng)樣本點接近于測試點時,函數(shù)取值較大;離測試點越遠,則函數(shù)取值越校σ值為函數(shù)帶寬變量,通過控制σ值可以靈活地控制函數(shù)的帶寬,且σ取值越大函數(shù)圖像帶寬越校γ的取值主要影響的是核函數(shù)的“胖瘦”程度;γ取值越大,核函數(shù)圖形越“胖”。λ為微調(diào)參數(shù),該參數(shù)能夠確保隨著輸入值與測試值的距離增加,,核函數(shù)值不會趨于無窮校相較于原始的高斯核函數(shù),在方差σ相同的情況下,修正的高斯核函數(shù)具有較大的峰度,距離較近的點對核函數(shù)影響較大,隨著距離增加,該核函數(shù)值會迅速衰減,但不會趨于無窮小,該核函數(shù)兼顧較強的泛化能力和學(xué)習(xí)能力。從圖3可知,相比于原始高斯核函數(shù),修正的高斯核函數(shù)樣本點在離測試點較近的區(qū)域,函數(shù)值衰減較快,在離測試點較遠的區(qū)域,修正的高斯核函數(shù)的函數(shù)值衰減速度相比于原始的高斯核函數(shù)要慢很多。通過調(diào)整修正后的高斯核函數(shù)的參數(shù)γ,可以靈活控制函數(shù)值的衰減速度。修正后

函數(shù)圖像,高斯核,函數(shù),聚類


值越校σ值為函數(shù)帶寬變量,通過控制σ值可以靈活地控制函數(shù)的帶寬,且σ取值越大函數(shù)圖像帶寬越校γ的取值主要影響的是核函數(shù)的“胖瘦”程度;γ取值越大,核函數(shù)圖形越“胖”。λ為微調(diào)參數(shù),該參數(shù)能夠確保隨著輸入值與測試值的距離增加,核函數(shù)值不會趨于無窮校相較于原始的高斯核函數(shù),在方差σ相同的情況下,修正的高斯核函數(shù)具有較大的峰度,距離較近的點對核函數(shù)影響較大,隨著距離增加,該核函數(shù)值會迅速衰減,但不會趨于無窮小,該核函數(shù)兼顧較強的泛化能力和學(xué)習(xí)能力。從圖3可知,相比于原始高斯核函數(shù),修正的高斯核函數(shù)樣本點在離測試點較近的區(qū)域,函數(shù)值衰減較快,在離測試點較遠的區(qū)域,修正的高斯核函數(shù)的函數(shù)值衰減速度相比于原始的高斯核函數(shù)要慢很多。通過調(diào)整修正后的高斯核函數(shù)的參數(shù)γ,可以靈活控制函數(shù)值的衰減速度。修正后的高斯核函數(shù)能夠在一定程度上彌補原始高斯核函數(shù)值在無限遠處趨于無窮小的不足。因此,修正后的高斯核函數(shù)同時具備了較強的泛化能力和學(xué)習(xí)能力。圖3修正后的高斯核函數(shù)(二)改進的半監(jiān)督K-means核聚類改進的半監(jiān)督K-means核聚類將修正后的高斯核函數(shù)用于樣本之間相似度的測量,使得半監(jiān)督K-means聚類方法在處理線性不可分樣本時具有較好的效果。本文基于帶引力參數(shù)的半監(jiān)督K-means聚類算法,通過引入修正后的高斯核函數(shù)算法,使得新的模型在處理模型局部最優(yōu)、樣本分布為非球狀簇及樣本線性不可分等問題上具有較好的效果。改進半監(jiān)督K-means核聚類算法主要基于以下兩個方面考慮:第一,在引力影響因子計算過程中引入核函數(shù)。引力影響因子算法通過引入核函數(shù),使得已標(biāo)

【相似文獻】

相關(guān)期刊論文 前1條

1 ;技術(shù)指標(biāo)選股[J];股市動態(tài)分析;2014年20期

相關(guān)碩士學(xué)位論文 前8條

1 司曉彤;基于回歸法的多因子選股模型的投資組合分析[D];青島大學(xué);2017年

2 王慧琳;醫(yī)藥主題私募基金選股策略及其產(chǎn)品設(shè)計[D];南京大學(xué);2017年

3 李璐;基于數(shù)據(jù)挖掘的量化選股策略的研究[D];天津商業(yè)大學(xué);2017年

4 李想;基于XGBoost算法的多因子量化選股方案策劃[D];上海師范大學(xué);2017年

5 鄧尚洲;基于長期投資的A股選股方法研究[D];南昌大學(xué);2017年

6 蘭強太;基于主成分分析和BP神經(jīng)網(wǎng)絡(luò)算法的綜合選股實證研究[D];暨南大學(xué);2017年

7 汪涌;多因子量化投資風(fēng)險分散策略研究[D];重慶郵電大學(xué);2017年

8 馬晴雪;基于公告分類校準(zhǔn)的多指標(biāo)SVM創(chuàng)業(yè)板選股方案設(shè)計[D];上海師范大學(xué);2017年



本文編號:2696522

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/jingjilunwen/jinrongzhengquanlunwen/2696522.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶d0f97***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com