天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

循環(huán)神經(jīng)網(wǎng)絡(luò)在缺陷報(bào)告重復(fù)檢測(cè)上的研究及應(yīng)用

發(fā)布時(shí)間:2021-04-16 18:03
  研究表明處理大量的重復(fù)缺陷會(huì)對(duì)人力造成極大的浪費(fèi),特別對(duì)于大型的項(xiàng)目來(lái)說(shuō)尤其明顯。為了減輕人工檢測(cè)重復(fù)報(bào)告的工作量,縮減人工管理缺陷的時(shí)間,開(kāi)展缺陷報(bào)告自動(dòng)重復(fù)檢測(cè)方法的研究是具有價(jià)值的。本文系統(tǒng)的分析了重復(fù)缺陷報(bào)告產(chǎn)生的原因,發(fā)展現(xiàn)狀及其意義,并對(duì)國(guó)內(nèi)外的重復(fù)缺陷研究方法及深度學(xué)習(xí)在文本相似度上的方法進(jìn)行了綜述。最終基于循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Networks,簡(jiǎn)稱(chēng)RNN)與Attention機(jī)制的理論及技術(shù),將LSTM(Long Short-Term Memory)模型,BI-LSTM(Bi-directional Long Short-Term Memory)模型,雙層BI-LSTM模型及使用Attention機(jī)制的雙層BI-LSTM模型,應(yīng)用于重復(fù)缺陷報(bào)告領(lǐng)域,用于計(jì)算兩個(gè)缺陷報(bào)告間的相似度。并以開(kāi)源項(xiàng)目Eclipse產(chǎn)生的缺陷報(bào)告作為數(shù)據(jù)集,對(duì)比前人經(jīng)驗(yàn)篩選出數(shù)據(jù)源對(duì)上述模型進(jìn)行實(shí)驗(yàn),之后對(duì)各模型結(jié)果進(jìn)行了對(duì)比與分析,并進(jìn)行了一定程度的調(diào)優(yōu)。整體思路是將缺陷報(bào)告分為相似與不相似兩類(lèi),當(dāng)兩個(gè)缺陷報(bào)告計(jì)算出的結(jié)果大于某個(gè)閾值時(shí),即判定為兩文本相似。并在各個(gè)... 

【文章來(lái)源】:北京林業(yè)大學(xué)北京市 211工程院校 教育部直屬院校

【文章頁(yè)數(shù)】:64 頁(yè)

【學(xué)位級(jí)別】:碩士

【部分圖文】:

循環(huán)神經(jīng)網(wǎng)絡(luò)在缺陷報(bào)告重復(fù)檢測(cè)上的研究及應(yīng)用


圖3.4標(biāo)題長(zhǎng)度對(duì)實(shí)驗(yàn)結(jié)果的影響??Figure?3.4?Effect?of?title?length?on?experiment?results??

長(zhǎng)度,準(zhǔn)確率,標(biāo)題,召回率


3基于LSTM的重復(fù)缺陷報(bào)告檢測(cè)??96.00%??94.00%??92.00%??90.00%??H?H?_??80.00%?——_??20?30?40?50??■準(zhǔn)確率■召回率■?FI值??圖3.4標(biāo)題長(zhǎng)度對(duì)實(shí)驗(yàn)結(jié)果的影響??Figure?3.4?Effect?of?title?length?on?experiment?results??由圖3.4可知,標(biāo)題長(zhǎng)度選擇為40時(shí),模型的三種評(píng)價(jià)指標(biāo)都有所提升,此時(shí)??準(zhǔn)確率達(dá)到LSTM模型的最高。??96.00%??94.00%??92.00%??90.00%??88.00%?■?H?_??i?I?I?I?III?III??78.00%?^?^?^?^?,.h_??100?125?135?150??■準(zhǔn)確率■召回率■?FI值??圖3.5描述長(zhǎng)度對(duì)實(shí)驗(yàn)結(jié)果的影響??Figure?3.5?Describe?the?eflfect?of?length?on?experimental?results??由圖3.5可知,在標(biāo)題長(zhǎng)度達(dá)到最優(yōu)之后,對(duì)描述長(zhǎng)度進(jìn)行對(duì)比實(shí)驗(yàn),當(dāng)描述長(zhǎng)??度為125時(shí),該模型的準(zhǔn)確率達(dá)到了最優(yōu),為87.42%。??25??

示意圖,神經(jīng)網(wǎng)絡(luò),示意圖,特征檢測(cè)


Dropout?技術(shù)??Dropout技術(shù)的提出,主要為了解決過(guò)擬合問(wèn)題,使模型能夠更好的完成訓(xùn)練。??其在2012年Hinton的論文中首次被提出,它能夠提高神經(jīng)網(wǎng)絡(luò)的性能,它主要是通??過(guò)減少特征檢測(cè)器的共同作用實(shí)現(xiàn)(Hinton?etal,2012)。在每次訓(xùn)練過(guò)程中,將部分隱??藏層的節(jié)點(diǎn)設(shè)置成0,忽略部分特征檢測(cè),可以明顯地減少過(guò)擬合現(xiàn)象。即在前向傳??播的時(shí)候,設(shè)置一定的幾率讓?zhuān)π┥窠?jīng)元的激活值停止工作,這樣可以使模型不會(huì)太??依賴(lài)菜些局部的特征,從而提高泛化能力。??圖3.7神經(jīng)網(wǎng)絡(luò)Dropout示意圖??Figure?3.7?Neural?network?dropout?schematic??27??

【參考文獻(xiàn)】:
期刊論文
[1]雙向循環(huán)神經(jīng)網(wǎng)絡(luò)在語(yǔ)音識(shí)別中的應(yīng)用[J]. 更藏措毛,黃鶴鳴.  計(jì)算機(jī)與現(xiàn)代化. 2019(10)
[2]融合文本與分類(lèi)信息的重復(fù)缺陷報(bào)告檢測(cè)方法[J]. 范道遠(yuǎn),孫吉紅,王煒,涂吉屏,何欣.  計(jì)算機(jī)科學(xué). 2019(12)
[3]基于深度學(xué)習(xí)的文本相似度計(jì)算[J]. 邵恒,馮興樂(lè),包芬.  鄭州大學(xué)學(xué)報(bào)(理學(xué)版). 2020(01)
[4]基于CNN和BiLSTM的短文本相似度計(jì)算方法[J]. 郭浩,許偉,盧凱,唐球.  信息技術(shù)與網(wǎng)絡(luò)安全. 2019(06)
[5]文本相似度計(jì)算方法研究綜述[J]. 王春柳,楊永輝,鄧霏,賴(lài)輝源.  情報(bào)科學(xué). 2019(03)
[6]軟件測(cè)試自動(dòng)化方法研究[J]. 彭迪.  電子質(zhì)量. 2018(11)
[7]OSDR:一種開(kāi)源軟件的缺陷修復(fù)人推薦方法[J]. 張文,李自強(qiáng),杜宇航,趙博揚(yáng).  計(jì)算機(jī)應(yīng)用與軟件. 2017(08)
[8]面向自然語(yǔ)言處理的深度學(xué)習(xí)研究[J]. 奚雪峰,周?chē)?guó)棟.  自動(dòng)化學(xué)報(bào). 2016(10)
[9]一種新的基于N-gram模型的重復(fù)軟件缺陷報(bào)告檢測(cè)方法[J]. 李寧,李戰(zhàn)懷,張利軍.  西北工業(yè)大學(xué)學(xué)報(bào). 2010(02)
[10]軟件缺陷數(shù)據(jù)處理研究綜述[J]. 李寧,李戰(zhàn)懷.  計(jì)算機(jī)科學(xué). 2009(08)

博士論文
[1]眾包測(cè)試報(bào)告的挖掘與評(píng)估[D]. 陳信.大連理工大學(xué) 2018
[2]軟件缺陷報(bào)告管理關(guān)鍵技術(shù)研究[D]. 喻維.華南理工大學(xué) 2018
[3]軟件測(cè)試及評(píng)價(jià)的復(fù)用策略研究及其實(shí)現(xiàn)[D]. 夏啟明.武漢大學(xué) 2010

碩士論文
[1]基于深度學(xué)習(xí)的短文本相似度分析與實(shí)現(xiàn)[D]. 韓建輝.北方工業(yè)大學(xué) 2019
[2]軟件測(cè)試信息管理系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D]. 胡畔.電子科技大學(xué) 2018
[3]基于Attention Bi-LSTM的文本分類(lèi)方法研究[D]. 王恰.華南理工大學(xué) 2018
[4]基于LSTM的文本相似度識(shí)別方法研究[D]. 楊飛.吉林大學(xué) 2018
[5]軟件缺陷管理系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D]. 王漢雄.哈爾濱工業(yè)大學(xué) 2017
[6]基于多平臺(tái)應(yīng)用的軟件缺陷管理系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D]. 袁林艷.天津大學(xué) 2017
[7]基于雙向LSTMN神經(jīng)網(wǎng)絡(luò)的中文分詞研究分析[D]. 黃積楊.南京大學(xué) 2016
[8]自動(dòng)重復(fù)缺陷報(bào)告檢測(cè)方法研究[D]. 王彬.華東師范大學(xué) 2016
[9]基于LDA模型的重復(fù)缺陷報(bào)告檢測(cè)的研究[D]. 蔣欣志.重慶大學(xué) 2013



本文編號(hào):3141911

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/3141911.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶9fcdd***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com