基于集成學習的軟件缺陷預測方法研究
發(fā)布時間:2022-01-02 12:37
在軟件工程領(lǐng)域中軟件缺陷預測技術(shù)能有效地輔助軟件測試、保障軟件產(chǎn)品質(zhì)量和增強軟件的安全性。本文結(jié)合軟件度量方法和集成學習算法對缺陷代碼進行研究,提出了基于不平衡率閾值移動的異質(zhì)集成算法和基于遞歸特征消除的極端隨機樹特征選擇算法來預測軟件源代碼的缺陷,主要內(nèi)容如下:首先,分析了軟件缺陷預測的研究現(xiàn)狀,對軟件安全缺陷庫中不同類型的缺陷進行了研究,采用結(jié)構(gòu)化的軟件度量方法預測軟件缺陷,結(jié)合集成學習方法研究軟件缺陷預測中類不平衡的問題,針對軟件缺陷中最危險的內(nèi)存安全缺陷結(jié)合搜索策略進行特征分析。其次,為了解決軟件缺陷預測中缺陷代碼不平衡的問題,本文提出一種基于不平衡率閾值移動的異質(zhì)集成算法。通過引入異質(zhì)集成算法思想,在不影響缺陷數(shù)據(jù)分布的前提下,將決策樹和邏輯回歸算法作為基分類器進行模型融合,增加基分類器結(jié)構(gòu)的多樣性,并結(jié)合缺陷歷史數(shù)據(jù)的不平衡率進行閾值移動,有效地提高了集成算法預測軟件缺陷的準確性。再次,為了分析軟件內(nèi)存安全缺陷的特征,本文從函數(shù)級別對缺陷代碼進行結(jié)構(gòu)化度量,提取基于數(shù)據(jù)流分析的函數(shù)類別,提出一種基于遞歸特征消除的極端隨機樹特征選擇算法。通過引入啟發(fā)式規(guī)則,來分析內(nèi)存安全缺陷...
【文章來源】:燕山大學河北省
【文章頁數(shù)】:66 頁
【學位級別】:碩士
【部分圖文】:
缺陷、錯誤、故障、失效基本關(guān)系圖
第 2 章 軟件缺陷預測的相關(guān)分析的錯誤數(shù),定義如式(2-7)所示,Halst的容量成正比。3000VB 中操作符的總數(shù),2N 為程序中操作數(shù)作數(shù)類型的數(shù)目。法根據(jù)軟件拓撲結(jié)構(gòu)來衡量復雜程度,夠通過計算流程圖上的數(shù)據(jù)流條數(shù)和數(shù)如圖 2-2 所示。這些復雜度主要包含了等。
燕山大學工學碩士學位論文軟件度量得到的指標建立缺陷預測模型,進一步挖掘軟件缺陷與度聯(lián)關(guān)系,可以有效的指導軟件開發(fā)和軟件測試,保障軟件產(chǎn)品的質(zhì)件缺陷預測模型ll 等人[33]對度量指標與缺陷的關(guān)系提出了有效的論述,一般在軟件缺,首先通過軟件度量的方法對軟件的舊版本進行量化,生成度量數(shù)后基于機器學習、統(tǒng)計學習或其他方法建立缺陷預測的模型,最后型對未標記的模塊進行預測。基本框架如圖 2-3 所示,它能夠有效陷的歷史信息,為軟件開發(fā)提供有利的決策。
【參考文獻】:
期刊論文
[1]集成學習方法:研究綜述[J]. 徐繼偉,楊云. 云南大學學報(自然科學版). 2018(06)
[2]基于改進Adaboost軟件缺陷數(shù)據(jù)特征選擇方法[J]. 李克文,鄒晶杰. 計算機工程與設(shè)計. 2017(11)
[3]一種面向軟件缺陷預測的相似性度量特征選擇方法(英文)[J]. Qiao YU,Shu-juan JIANG,Rong-cun WANG,Hong-yang WANG. Frontiers of Information Technology & Electronic Engineering. 2017(11)
[4]基于Boosting的代價敏感軟件缺陷預測方法[J]. 楊杰,燕雪峰,張德平. 計算機科學. 2017(08)
[5]基于組合機器學習算法的軟件缺陷預測模型[J]. 傅藝綺,董威,尹良澤,杜雨晴. 計算機研究與發(fā)展. 2017(03)
[6]面向軟件缺陷預測的聚類欠采樣集成方法[J]. 陸鵬程,邱建林,卞彩峰,陳璐璐,陳翔. 計算機工程與設(shè)計. 2016(07)
[7]分類不平衡對軟件缺陷預測模型性能的影響研究[J]. 于巧,姜淑娟,張艷梅,王興亞,高鵬飛,錢俊彥. 計算機學報. 2018(04)
[8]HFS:一種面向軟件缺陷預測的混合特征選擇方法[J]. 陳翔,賀成,王宇,管懷文. 計算機應用研究. 2016(06)
[9]基于程序特征譜整數(shù)溢出錯誤定位技術(shù)研究[J]. 惠戰(zhàn)偉,黃松,嵇孟雨. 計算機學報. 2012(10)
本文編號:3564191
【文章來源】:燕山大學河北省
【文章頁數(shù)】:66 頁
【學位級別】:碩士
【部分圖文】:
缺陷、錯誤、故障、失效基本關(guān)系圖
第 2 章 軟件缺陷預測的相關(guān)分析的錯誤數(shù),定義如式(2-7)所示,Halst的容量成正比。3000VB 中操作符的總數(shù),2N 為程序中操作數(shù)作數(shù)類型的數(shù)目。法根據(jù)軟件拓撲結(jié)構(gòu)來衡量復雜程度,夠通過計算流程圖上的數(shù)據(jù)流條數(shù)和數(shù)如圖 2-2 所示。這些復雜度主要包含了等。
燕山大學工學碩士學位論文軟件度量得到的指標建立缺陷預測模型,進一步挖掘軟件缺陷與度聯(lián)關(guān)系,可以有效的指導軟件開發(fā)和軟件測試,保障軟件產(chǎn)品的質(zhì)件缺陷預測模型ll 等人[33]對度量指標與缺陷的關(guān)系提出了有效的論述,一般在軟件缺,首先通過軟件度量的方法對軟件的舊版本進行量化,生成度量數(shù)后基于機器學習、統(tǒng)計學習或其他方法建立缺陷預測的模型,最后型對未標記的模塊進行預測。基本框架如圖 2-3 所示,它能夠有效陷的歷史信息,為軟件開發(fā)提供有利的決策。
【參考文獻】:
期刊論文
[1]集成學習方法:研究綜述[J]. 徐繼偉,楊云. 云南大學學報(自然科學版). 2018(06)
[2]基于改進Adaboost軟件缺陷數(shù)據(jù)特征選擇方法[J]. 李克文,鄒晶杰. 計算機工程與設(shè)計. 2017(11)
[3]一種面向軟件缺陷預測的相似性度量特征選擇方法(英文)[J]. Qiao YU,Shu-juan JIANG,Rong-cun WANG,Hong-yang WANG. Frontiers of Information Technology & Electronic Engineering. 2017(11)
[4]基于Boosting的代價敏感軟件缺陷預測方法[J]. 楊杰,燕雪峰,張德平. 計算機科學. 2017(08)
[5]基于組合機器學習算法的軟件缺陷預測模型[J]. 傅藝綺,董威,尹良澤,杜雨晴. 計算機研究與發(fā)展. 2017(03)
[6]面向軟件缺陷預測的聚類欠采樣集成方法[J]. 陸鵬程,邱建林,卞彩峰,陳璐璐,陳翔. 計算機工程與設(shè)計. 2016(07)
[7]分類不平衡對軟件缺陷預測模型性能的影響研究[J]. 于巧,姜淑娟,張艷梅,王興亞,高鵬飛,錢俊彥. 計算機學報. 2018(04)
[8]HFS:一種面向軟件缺陷預測的混合特征選擇方法[J]. 陳翔,賀成,王宇,管懷文. 計算機應用研究. 2016(06)
[9]基于程序特征譜整數(shù)溢出錯誤定位技術(shù)研究[J]. 惠戰(zhàn)偉,黃松,嵇孟雨. 計算機學報. 2012(10)
本文編號:3564191
本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/3564191.html
最近更新
教材專著