基于極限學(xué)習(xí)機(jī)的軟件缺陷預(yù)測(cè)研究
發(fā)布時(shí)間:2021-08-29 22:56
當(dāng)前互聯(lián)網(wǎng)行業(yè)下,軟件的規(guī)模愈來愈大,導(dǎo)致其復(fù)雜度也愈來愈高,這意味著軟件中隱藏的缺陷會(huì)隨之增多,嚴(yán)重時(shí)還會(huì)給軟件公司造成經(jīng)濟(jì)損失,甚至?xí){人們的安全。因此,如何有效地發(fā)現(xiàn)軟件缺陷顯得尤為重要。軟件缺陷預(yù)測(cè)是借助于已有項(xiàng)目數(shù)據(jù)構(gòu)建預(yù)測(cè)模型,預(yù)測(cè)目標(biāo)項(xiàng)目中的缺陷。目前主流方法主要基于機(jī)器學(xué)習(xí)構(gòu)建缺陷預(yù)測(cè)模型,且大多已取得較好的預(yù)測(cè)效果。然而,現(xiàn)有缺陷預(yù)測(cè)模型仍存在不足,如:模型性能提高,數(shù)據(jù)集不平衡和部分目標(biāo)項(xiàng)目數(shù)據(jù)稀少等問題。因此,針對(duì)現(xiàn)有問題,本文提出基于極限學(xué)習(xí)機(jī)(extreme learning machine,ELM)的軟件缺陷預(yù)測(cè)模型,具體包括以下工作:1)在缺陷預(yù)測(cè)模型的預(yù)測(cè)精度和訓(xùn)練速度有待提高的問題上,本文借助于極限學(xué)習(xí)機(jī)泛化能力強(qiáng)、訓(xùn)練速度快的特點(diǎn),在軟件缺陷預(yù)測(cè)上構(gòu)造了有監(jiān)督分類和無監(jiān)督聚類兩種預(yù)測(cè)模型,提出了ELM-CLA(ELM-Classification)和ELM-CLU(ELM-Clustering)兩種算法。在NASA的11個(gè)數(shù)據(jù)集上,所提方法ELM-CLA和現(xiàn)有分類算法相比,得到較好的預(yù)測(cè)結(jié)果,且大大提高了模型的訓(xùn)練速度。同時(shí),ELM-CLU方法,較...
【文章來源】:江蘇科技大學(xué)江蘇省
【文章頁數(shù)】:80 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
軟件缺陷預(yù)測(cè)的整體處理過程
圖 2. 2 同項(xiàng)目缺陷預(yù)測(cè)與跨項(xiàng)目缺陷預(yù)測(cè)模型Fig 2. 2 With-project defect prediction and cross-project defect prediction model盡管研究人員從預(yù)測(cè)精度、代價(jià)敏感、實(shí)際應(yīng)用等方面初步驗(yàn)證了 CPDP 的可行性,但較之 WPDP,其預(yù)測(cè)性能并不樂觀。研究者們針對(duì)跨項(xiàng)目缺陷預(yù)測(cè)的問題提出了多種方法,大致可分為三類:有監(jiān)督學(xué)習(xí)方法、半監(jiān)督學(xué)習(xí)方法和無監(jiān)督學(xué)習(xí)方法。[1] 有監(jiān)督學(xué)習(xí)基于有監(jiān)督的學(xué)習(xí)方法,適用于僅存在和目標(biāo)項(xiàng)目相關(guān)的候選源項(xiàng)目的場(chǎng)景,該類方法將候選源項(xiàng)目中有標(biāo)簽的數(shù)據(jù)作為訓(xùn)練集,在該訓(xùn)練集上構(gòu)建缺陷預(yù)測(cè)模型,然后對(duì)目標(biāo)項(xiàng)目進(jìn)行預(yù)測(cè)。[2] 半監(jiān)督學(xué)習(xí)基于半監(jiān)督的學(xué)習(xí)方法適用的場(chǎng)景為:除了存在一些和目標(biāo)項(xiàng)目相關(guān)的候選源項(xiàng)目外,還在目標(biāo)項(xiàng)目中含有少量含標(biāo)簽的目標(biāo)項(xiàng)目模塊。該方法主要將候選源項(xiàng)目中含標(biāo)簽的所有數(shù)據(jù)和目標(biāo)項(xiàng)目中少量的標(biāo)簽數(shù)據(jù)放在一起作為訓(xùn)練集,構(gòu)建缺陷預(yù)測(cè)模型,然后對(duì)目標(biāo)項(xiàng)目中的無標(biāo)簽數(shù)據(jù)進(jìn)行預(yù)測(cè)。
圖 2. 3 跨項(xiàng)目缺陷預(yù)測(cè)的研究框架圖Fig 2. 3 Framework of the research on CPDP陷預(yù)測(cè)性能評(píng)價(jià)指標(biāo)軟件缺陷預(yù)測(cè)中,合理的評(píng)價(jià)指標(biāo)能更好地評(píng)估預(yù)測(cè)結(jié)果。下文將介中的常用評(píng)價(jià)指標(biāo)。件缺陷預(yù)測(cè)可以看作是二分類問題,若將有缺陷模塊設(shè)為正例,無缺,則每個(gè)實(shí)例的分類過程中可能出現(xiàn)以下四種情況:實(shí)際為有缺陷類缺陷類,即真正例(true positive, TP);實(shí)際為無缺陷類被錯(cuò)誤劃分為有例(false positive, FP);實(shí)際為無缺陷類被正確劃分為無缺陷類,即真反, TN);實(shí)際為有缺陷類被錯(cuò)誤劃分為無缺陷類,即假反例(false negat智能中,混淆矩陣是表示精度評(píng)價(jià)的一種標(biāo)準(zhǔn)格式,用 n 行 n 列的矩本章所用混淆矩陣如表 2.1 所示:表 2. 1 混淆矩陣Tab 2. 1 Confusion matrix
【參考文獻(xiàn)】:
期刊論文
[1]跨項(xiàng)目軟件缺陷預(yù)測(cè)方法研究綜述[J]. 陳翔,王莉萍,顧慶,王贊,倪超,劉望舒,王秋萍. 計(jì)算機(jī)學(xué)報(bào). 2018(01)
碩士論文
[1]基于遷移學(xué)習(xí)的軟件缺陷預(yù)測(cè)方法研究[D]. 倪超.南京大學(xué) 2017
本文編號(hào):3371532
【文章來源】:江蘇科技大學(xué)江蘇省
【文章頁數(shù)】:80 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
軟件缺陷預(yù)測(cè)的整體處理過程
圖 2. 2 同項(xiàng)目缺陷預(yù)測(cè)與跨項(xiàng)目缺陷預(yù)測(cè)模型Fig 2. 2 With-project defect prediction and cross-project defect prediction model盡管研究人員從預(yù)測(cè)精度、代價(jià)敏感、實(shí)際應(yīng)用等方面初步驗(yàn)證了 CPDP 的可行性,但較之 WPDP,其預(yù)測(cè)性能并不樂觀。研究者們針對(duì)跨項(xiàng)目缺陷預(yù)測(cè)的問題提出了多種方法,大致可分為三類:有監(jiān)督學(xué)習(xí)方法、半監(jiān)督學(xué)習(xí)方法和無監(jiān)督學(xué)習(xí)方法。[1] 有監(jiān)督學(xué)習(xí)基于有監(jiān)督的學(xué)習(xí)方法,適用于僅存在和目標(biāo)項(xiàng)目相關(guān)的候選源項(xiàng)目的場(chǎng)景,該類方法將候選源項(xiàng)目中有標(biāo)簽的數(shù)據(jù)作為訓(xùn)練集,在該訓(xùn)練集上構(gòu)建缺陷預(yù)測(cè)模型,然后對(duì)目標(biāo)項(xiàng)目進(jìn)行預(yù)測(cè)。[2] 半監(jiān)督學(xué)習(xí)基于半監(jiān)督的學(xué)習(xí)方法適用的場(chǎng)景為:除了存在一些和目標(biāo)項(xiàng)目相關(guān)的候選源項(xiàng)目外,還在目標(biāo)項(xiàng)目中含有少量含標(biāo)簽的目標(biāo)項(xiàng)目模塊。該方法主要將候選源項(xiàng)目中含標(biāo)簽的所有數(shù)據(jù)和目標(biāo)項(xiàng)目中少量的標(biāo)簽數(shù)據(jù)放在一起作為訓(xùn)練集,構(gòu)建缺陷預(yù)測(cè)模型,然后對(duì)目標(biāo)項(xiàng)目中的無標(biāo)簽數(shù)據(jù)進(jìn)行預(yù)測(cè)。
圖 2. 3 跨項(xiàng)目缺陷預(yù)測(cè)的研究框架圖Fig 2. 3 Framework of the research on CPDP陷預(yù)測(cè)性能評(píng)價(jià)指標(biāo)軟件缺陷預(yù)測(cè)中,合理的評(píng)價(jià)指標(biāo)能更好地評(píng)估預(yù)測(cè)結(jié)果。下文將介中的常用評(píng)價(jià)指標(biāo)。件缺陷預(yù)測(cè)可以看作是二分類問題,若將有缺陷模塊設(shè)為正例,無缺,則每個(gè)實(shí)例的分類過程中可能出現(xiàn)以下四種情況:實(shí)際為有缺陷類缺陷類,即真正例(true positive, TP);實(shí)際為無缺陷類被錯(cuò)誤劃分為有例(false positive, FP);實(shí)際為無缺陷類被正確劃分為無缺陷類,即真反, TN);實(shí)際為有缺陷類被錯(cuò)誤劃分為無缺陷類,即假反例(false negat智能中,混淆矩陣是表示精度評(píng)價(jià)的一種標(biāo)準(zhǔn)格式,用 n 行 n 列的矩本章所用混淆矩陣如表 2.1 所示:表 2. 1 混淆矩陣Tab 2. 1 Confusion matrix
【參考文獻(xiàn)】:
期刊論文
[1]跨項(xiàng)目軟件缺陷預(yù)測(cè)方法研究綜述[J]. 陳翔,王莉萍,顧慶,王贊,倪超,劉望舒,王秋萍. 計(jì)算機(jī)學(xué)報(bào). 2018(01)
碩士論文
[1]基于遷移學(xué)習(xí)的軟件缺陷預(yù)測(cè)方法研究[D]. 倪超.南京大學(xué) 2017
本文編號(hào):3371532
本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/3371532.html
最近更新
教材專著