基于關(guān)鍵類判定的代碼提交理解輔助方法
本文選題:代碼修改 + 代碼修改理解 ; 參考:《軟件學(xué)報(bào)》2017年06期
【摘要】:軟件代碼提交是最重要的軟件版本演化數(shù)據(jù)之一,被廣泛應(yīng)用于軟件審查和軟件理解中.對(duì)于程序員,提交的理解難度隨著受影響的類數(shù)量、修改的代碼量的增加而增加.通過(guò)對(duì)大量數(shù)據(jù)的分析發(fā)現(xiàn):識(shí)別出提交中核心的修改類(關(guān)鍵類)以及為了完成這個(gè)核心修改所進(jìn)行的依賴性改動(dòng)的類(非關(guān)鍵類),能夠輔助代碼提交的理解.受機(jī)器學(xué)習(xí)技術(shù)在分類領(lǐng)域有效性的啟發(fā),提出一種基于機(jī)器學(xué)習(xí)的關(guān)鍵類識(shí)別方法,將判定提交中的關(guān)鍵類建模為二分類問(wèn)題(即關(guān)鍵和非關(guān)鍵類),從軟件演化過(guò)程中產(chǎn)生的海量提交數(shù)據(jù)中抽取可判別性特征來(lái)度量類的關(guān)鍵性.在多個(gè)數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明:該方法判定關(guān)鍵類的綜合準(zhǔn)確率達(dá)到了87%;相比于開(kāi)發(fā)人員直接理解提交,使用關(guān)鍵類信息提示來(lái)輔助理解提交,能夠顯著提高開(kāi)發(fā)人員的效率和正確率.
[Abstract]:Software code submission is one of the most important software version evolution data, which is widely used in software review and software understanding. For programmers, the difficulty of understanding submission increases with the number of affected classes and the amount of code modified. Through the analysis of a large number of data, it is found that the core modification class (key class) in the submission and the dependent change class (non-critical class) in order to complete the core modification can assist in the understanding of code submission. Inspired by the effectiveness of machine learning technology in classification field, a key class recognition method based on machine learning is proposed. The key class in decision submission is modeled as a two-class problem (i.e. key and non-critical classes), and the discriminability features are extracted from the massive submitted data generated in the process of software evolution to measure the criticality of the class. The experimental results on several data sets show that the synthetic accuracy of this method is 87%, compared with the developer's direct understanding of submission, the key class information hint is used to assist in understanding the submission. It can significantly improve the developer's efficiency and accuracy.
【作者單位】: 中山大學(xué)數(shù)據(jù)科學(xué)與計(jì)算機(jī)學(xué)院;國(guó)家數(shù)字家庭工程技術(shù)研究中心;中山大學(xué)先進(jìn)技術(shù)研究院;北京大學(xué)信息科學(xué)技術(shù)學(xué)院軟件研究所;高可信軟件技術(shù)教育部重點(diǎn)實(shí)驗(yàn)室(北京大學(xué));
【基金】:NSFC-廣東聯(lián)合基金(U1201252) 國(guó)家重點(diǎn)研發(fā)計(jì)劃(2016YFB1000101) 國(guó)家自然科學(xué)基金(61672545,61672045) 廣東科技計(jì)劃(2015B040403005)~~
【分類號(hào)】:TP181;TP311.5
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 ;第十屆中國(guó)機(jī)器學(xué)習(xí)會(huì)議征文通知2006年10月13~15日,海口[J];計(jì)算機(jī)研究與發(fā)展;2005年10期
2 邵平;;機(jī)器學(xué)習(xí)與人臉識(shí)別方法概述[J];玉林師范學(xué)院學(xué)報(bào);2006年03期
3 ;第12屆中國(guó)機(jī)器學(xué)習(xí)會(huì)議征文通知 2010年8月6—8日 濟(jì)南[J];計(jì)算機(jī)研究與發(fā)展;2009年11期
4 ;第12屆中國(guó)機(jī)器學(xué)習(xí)會(huì)議征文通知[J];計(jì)算機(jī)研究與發(fā)展;2009年12期
5 ;第12屆中國(guó)機(jī)器學(xué)習(xí)會(huì)議征文通知 2010年8月6-8日 濟(jì)南[J];計(jì)算機(jī)研究與發(fā)展;2010年01期
6 柏宏權(quán);韓慶年;;機(jī)器學(xué)習(xí)在適應(yīng)性教學(xué)系統(tǒng)中的應(yīng)用研究[J];南京師范大學(xué)學(xué)報(bào)(工程技術(shù)版);2007年04期
7 吳肖炎;郭瑞;;基于機(jī)器學(xué)習(xí)的計(jì)算機(jī)安全技術(shù)綜述(上)[J];保密科學(xué)技術(shù);2013年03期
8 楊升;常勝;侯麗;;機(jī)器學(xué)習(xí)在計(jì)算機(jī)免疫中的應(yīng)用[J];微計(jì)算機(jī)信息;2007年30期
9 ;《軟件學(xué)報(bào)》統(tǒng)計(jì)學(xué)習(xí)研究與應(yīng)用?魑耐ㄖ猍J];軟件學(xué)報(bào);2012年11期
10 黃健;;何清:挖掘數(shù)據(jù)開(kāi)啟新知[J];科學(xué)中國(guó)人;2013年12期
相關(guān)會(huì)議論文 前5條
1 李剛;郭崇慧;林鴻飛;楊志豪;唐煥文;;基于詞典法和機(jī)器學(xué)習(xí)法相結(jié)合的蛋白質(zhì)名識(shí)別[A];大連理工大學(xué)生物醫(yī)學(xué)工程學(xué)術(shù)論文集(第2卷)[C];2005年
2 周軍;何力;韓偉紅;鄧璐;;基于機(jī)器學(xué)習(xí)的中文評(píng)論傾向性分類實(shí)證研究[A];第28次全國(guó)計(jì)算機(jī)安全學(xué)術(shù)交流會(huì)論文集[C];2013年
3 陳文亮;朱靖波;姚天順;張宇新;;基于Bootstrapping的領(lǐng)域詞匯自動(dòng)獲取[A];語(yǔ)言計(jì)算與基于內(nèi)容的文本處理——全國(guó)第七屆計(jì)算語(yǔ)言學(xué)聯(lián)合學(xué)術(shù)會(huì)議論文集[C];2003年
4 陳振興;賁可榮;;機(jī)器學(xué)習(xí)在軟件預(yù)測(cè)與評(píng)估中的應(yīng)用[A];2006年全國(guó)理論計(jì)算機(jī)科學(xué)學(xué)術(shù)年會(huì)論文集[C];2006年
5 焦妍;王厚峰;;基于機(jī)器學(xué)習(xí)方法與搜索引擎驗(yàn)證的縮略語(yǔ)預(yù)測(cè)[A];中國(guó)計(jì)算語(yǔ)言學(xué)研究前沿進(jìn)展(2009-2011)[C];2011年
相關(guān)重要報(bào)紙文章 前5條
1 百度公司技術(shù)副總監(jiān) 多媒體部負(fù)責(zé)人 余凱;深度學(xué)習(xí)與多媒體搜索技術(shù)演進(jìn)[N];中國(guó)信息化周報(bào);2013年
2 本報(bào)記者 余建斌;機(jī)器學(xué)習(xí)與互聯(lián)網(wǎng)搜索[N];人民日?qǐng)?bào);2011年
3 本報(bào)記者 張曄邋通訊員 李瑋;周志華:永不墨守成規(guī)[N];科技日?qǐng)?bào);2008年
4 沈建苗 編譯;如何成為大數(shù)據(jù)科學(xué)家[N];計(jì)算機(jī)世界;2013年
5 本報(bào)記者 閔杰;大數(shù)據(jù):價(jià)值創(chuàng)造“殺手锏”[N];中國(guó)電子報(bào);2013年
相關(guān)博士學(xué)位論文 前7條
1 劉章林;基于機(jī)器學(xué)習(xí)的編譯優(yōu)化適應(yīng)性研究[D];中國(guó)科學(xué)院研究生院(計(jì)算技術(shù)研究所);2006年
2 杜偉;機(jī)器學(xué)習(xí)及數(shù)據(jù)挖掘在生物信息學(xué)中的應(yīng)用研究[D];吉林大學(xué);2011年
3 王秉卿;基于機(jī)器學(xué)習(xí)的查詢優(yōu)化研究[D];復(fù)旦大學(xué);2012年
4 陳東成;基于機(jī)器學(xué)習(xí)的目標(biāo)跟蹤技術(shù)研究[D];中國(guó)科學(xué)院研究生院(長(zhǎng)春光學(xué)精密機(jī)械與物理研究所);2015年
5 毛慧蕓;人臉美麗吸引力的特征分析與機(jī)器學(xué)習(xí)[D];華南理工大學(xué);2011年
6 譚治英;核機(jī)器學(xué)習(xí)方法及其在視覺(jué)檢測(cè)中的應(yīng)用研究[D];電子科技大學(xué);2013年
7 文學(xué)志;基于機(jī)器學(xué)習(xí)的路面對(duì)象識(shí)別關(guān)鍵技術(shù)研究[D];東北大學(xué);2008年
相關(guān)碩士學(xué)位論文 前10條
1 毛海斌;基于半監(jiān)督機(jī)器學(xué)習(xí)的情感分類領(lǐng)域適應(yīng)問(wèn)題研究[D];南京理工大學(xué);2015年
2 王成;基于半監(jiān)督機(jī)器學(xué)習(xí)的文本情感分析技術(shù)[D];南京理工大學(xué);2015年
3 孫科;基于Spark的機(jī)器學(xué)習(xí)應(yīng)用框架研究與實(shí)現(xiàn)[D];上海交通大學(xué);2015年
4 劉江龍;基于機(jī)器學(xué)習(xí)的射頻指紋定位方法研究[D];電子科技大學(xué);2015年
5 周文U,
本文編號(hào):2096792
本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/2096792.html