基于回歸分析的馬爾科夫毯學(xué)習(xí)算法研究及其應(yīng)用
發(fā)布時間:2022-01-11 11:46
特征選擇是數(shù)據(jù)挖掘和機器學(xué)習(xí)領(lǐng)域的重要研究部分,是從特征集合中選擇相關(guān)的特征,并剔除不相關(guān)特征和冗余特征。特征選擇可以有效減少問題求解中的變量,解決“維度災(zāi)難”的問題。貝葉斯網(wǎng)絡(luò)是將概率論與圖論相結(jié)合,定性和定量的描述數(shù)據(jù)倉庫中變量之間關(guān)系的模型。貝葉斯網(wǎng)絡(luò)中一個變量的馬爾科夫毯包括該變量的父結(jié)點、子結(jié)點和配偶結(jié)點(子結(jié)點的父結(jié)點)。一個變量的馬爾科夫毯可以屏蔽網(wǎng)絡(luò)中其它變量對該變量的影響。本文首先介紹了馬爾科夫毯學(xué)習(xí)算法的研究現(xiàn)狀,部分算法中存在著包含錯誤冗余結(jié)點的問題。回歸分析是確定變量之間相關(guān)關(guān)系的統(tǒng)計分析方法,通過假設(shè)檢驗,剔除與因變量相關(guān)性弱及不相關(guān)的變量。將馬爾科夫毯學(xué)習(xí)算法和回歸分析相結(jié)合,剔除候選馬爾科夫毯中與目標變量相關(guān)性弱和不相關(guān)的變量,并利用條件獨立測試返回最終的馬爾科夫毯。將該方法在經(jīng)典網(wǎng)絡(luò)上的實驗結(jié)果與已有的馬爾科夫毯學(xué)習(xí)算法進行比較,表明了該方法的有效性和可靠性。股市的行業(yè)板塊間具有很強的相關(guān)性,而房地產(chǎn)行業(yè)在我國經(jīng)濟中發(fā)揮著重要作用。利用本文算法對上證股市行業(yè)板塊收盤指數(shù)數(shù)據(jù)進行處理,從股市行業(yè)板塊中選擇與房地產(chǎn)板塊具有特征相關(guān)的行業(yè)板塊,利用Grange...
【文章來源】:合肥工業(yè)大學(xué)安徽省 211工程院校 教育部直屬院校
【文章頁數(shù)】:63 頁
【學(xué)位級別】:碩士
【部分圖文】:
貝葉斯網(wǎng)絡(luò),陰影結(jié)點為T的馬爾科夫毯設(shè)有離散變量集合V={A,B,C,D,E,F(xiàn),G,T},圖2-1中的結(jié)點分別代表集合V中的變量,以結(jié)點T為例,B和E是它的父結(jié)點,C和D是它的子結(jié)點
T |{Y } s) ,那么 Y 一定是 T 的子結(jié)點,X 一定是 T 的配偶結(jié)點這樣的變量 Y,那么 X 就不是 T 的配偶結(jié)點。 2.4 MMMB(Max-Min Markov Blanket)算法:)得到 MB(T)的候選馬爾科夫毯T)=MMPC(T);=PC(T);( )( ) ( ) \ {T}C PC T PC T MMPC C ;)找到 T 的配偶結(jié)點ach X CMB \ PC( T )flag=false;尋找集合s,使得 Ind ( X ; T | s );for each Y PC( T ){ if Dep ( X ; T |{ Y } s) flag=true; }if(flag) { MB MB { X} ;} }rn MB;
25(2)在邏輯回歸對話框里選擇因變量(目標變量)和自變量(候選馬圖 3-1 SPSS 軟件里對數(shù)據(jù)進行邏輯回歸分析3.3.2 實驗標準本文采用 PCMB 算法所在的文獻[36]中提出的查準率(precis(recall)以及它們之間的歐氏距離 d 來衡量學(xué)習(xí)馬爾科夫毯的算法的一個目標變量 T,查準率是指算法輸出的 MB(T)中包含正確變量的率越高,表明算法引入錯誤變量越少;查全率是指算法輸出的 M量的個數(shù)占實際 MB(T)變量個數(shù)的比率,查全率越高,表明算法漏量越少。
【參考文獻】:
期刊論文
[1]中國金融中心城市房地產(chǎn)價格與銀行信貸的關(guān)系[J]. 車欣薇,郭琨,李斌,王玨. 系統(tǒng)工程理論與實踐. 2011(04)
[2]中國A股市場行業(yè)板塊間領(lǐng)滯關(guān)系的動態(tài)變化實證研究[J]. 陳暮紫,陳敏,吳武清,繆柏其. 系統(tǒng)工程理論與實踐. 2009(06)
[3]我國房地產(chǎn)宏觀調(diào)控政策效果的實證分析[J]. 王要武,金海燕. 土木工程學(xué)報. 2008(08)
[4]基于貝葉斯網(wǎng)絡(luò)的復(fù)雜系統(tǒng)故障預(yù)測[J]. 許麗佳,王厚軍,龍兵. 系統(tǒng)工程與電子技術(shù). 2008(04)
[5]用于風(fēng)險管理的貝葉斯網(wǎng)絡(luò)學(xué)習(xí)[J]. 王雙成,唐海燕,劉喜華. 控制與決策. 2007(05)
[6]Logistic回歸模型分析[J]. 施朝健,張明銘. 計算機輔助工程. 2005(03)
[7]中國房地產(chǎn)市場與金融市場的Granger因果關(guān)系分析[J]. 皮舜. 系統(tǒng)工程理論與實踐. 2004(12)
[8]中國股票市場流動性與收益動態(tài)關(guān)系研究[J]. 張維,梁朝暉. 系統(tǒng)工程理論與實踐. 2004(10)
[9]中國股市的Granger因果關(guān)系分析[J]. 朱宏泉,盧祖帝,汪壽陽. 管理科學(xué)學(xué)報. 2001(05)
本文編號:3582727
【文章來源】:合肥工業(yè)大學(xué)安徽省 211工程院校 教育部直屬院校
【文章頁數(shù)】:63 頁
【學(xué)位級別】:碩士
【部分圖文】:
貝葉斯網(wǎng)絡(luò),陰影結(jié)點為T的馬爾科夫毯設(shè)有離散變量集合V={A,B,C,D,E,F(xiàn),G,T},圖2-1中的結(jié)點分別代表集合V中的變量,以結(jié)點T為例,B和E是它的父結(jié)點,C和D是它的子結(jié)點
T |{Y } s) ,那么 Y 一定是 T 的子結(jié)點,X 一定是 T 的配偶結(jié)點這樣的變量 Y,那么 X 就不是 T 的配偶結(jié)點。 2.4 MMMB(Max-Min Markov Blanket)算法:)得到 MB(T)的候選馬爾科夫毯T)=MMPC(T);=PC(T);( )( ) ( ) \ {T}C PC T PC T MMPC C ;)找到 T 的配偶結(jié)點ach X CMB \ PC( T )flag=false;尋找集合s,使得 Ind ( X ; T | s );for each Y PC( T ){ if Dep ( X ; T |{ Y } s) flag=true; }if(flag) { MB MB { X} ;} }rn MB;
25(2)在邏輯回歸對話框里選擇因變量(目標變量)和自變量(候選馬圖 3-1 SPSS 軟件里對數(shù)據(jù)進行邏輯回歸分析3.3.2 實驗標準本文采用 PCMB 算法所在的文獻[36]中提出的查準率(precis(recall)以及它們之間的歐氏距離 d 來衡量學(xué)習(xí)馬爾科夫毯的算法的一個目標變量 T,查準率是指算法輸出的 MB(T)中包含正確變量的率越高,表明算法引入錯誤變量越少;查全率是指算法輸出的 M量的個數(shù)占實際 MB(T)變量個數(shù)的比率,查全率越高,表明算法漏量越少。
【參考文獻】:
期刊論文
[1]中國金融中心城市房地產(chǎn)價格與銀行信貸的關(guān)系[J]. 車欣薇,郭琨,李斌,王玨. 系統(tǒng)工程理論與實踐. 2011(04)
[2]中國A股市場行業(yè)板塊間領(lǐng)滯關(guān)系的動態(tài)變化實證研究[J]. 陳暮紫,陳敏,吳武清,繆柏其. 系統(tǒng)工程理論與實踐. 2009(06)
[3]我國房地產(chǎn)宏觀調(diào)控政策效果的實證分析[J]. 王要武,金海燕. 土木工程學(xué)報. 2008(08)
[4]基于貝葉斯網(wǎng)絡(luò)的復(fù)雜系統(tǒng)故障預(yù)測[J]. 許麗佳,王厚軍,龍兵. 系統(tǒng)工程與電子技術(shù). 2008(04)
[5]用于風(fēng)險管理的貝葉斯網(wǎng)絡(luò)學(xué)習(xí)[J]. 王雙成,唐海燕,劉喜華. 控制與決策. 2007(05)
[6]Logistic回歸模型分析[J]. 施朝健,張明銘. 計算機輔助工程. 2005(03)
[7]中國房地產(chǎn)市場與金融市場的Granger因果關(guān)系分析[J]. 皮舜. 系統(tǒng)工程理論與實踐. 2004(12)
[8]中國股票市場流動性與收益動態(tài)關(guān)系研究[J]. 張維,梁朝暉. 系統(tǒng)工程理論與實踐. 2004(10)
[9]中國股市的Granger因果關(guān)系分析[J]. 朱宏泉,盧祖帝,汪壽陽. 管理科學(xué)學(xué)報. 2001(05)
本文編號:3582727
本文鏈接:http://www.sikaile.net/jingjilunwen/fangdichanjingjilunwen/3582727.html
最近更新
教材專著