基于組合分類算法的源代碼注釋質(zhì)量評估方法
發(fā)布時間:2017-11-12 03:06
本文關(guān)鍵詞:基于組合分類算法的源代碼注釋質(zhì)量評估方法
更多相關(guān)文章: 源碼注釋 質(zhì)量評估 文本分類 組合算法 自然語言處理
【摘要】:源代碼注釋是軟件的重要組成部分,研究者往往需要利用人工或自動化的方法產(chǎn)生分析注釋,注釋的質(zhì)量評估也往往是通過人工來完成,這無疑是低效不客觀的。為此,首先從注釋的格式、語言形式、內(nèi)容以及與代碼相關(guān)度4個方面出發(fā)構(gòu)建注釋評估準(zhǔn)則;進而,基于這一準(zhǔn)則提出了一種基于組合分類算法的注釋質(zhì)量評估方法。該方法將機器學(xué)習(xí)以及自然語言處理技術(shù)引入到注釋質(zhì)量評估中來,利用分類算法將注釋分為不合格、合格、良好、優(yōu)秀四個等級。通過對基本分類算法的組合使用,使得評估效果進一步提高。組合分類算法的準(zhǔn)確率和F1值較單獨使用某一種分類算法提高20個百分點左右,除宏平均F1值外,各項指標(biāo)都達(dá)到了70%以上。實驗結(jié)果表明,所提方法能夠很好地應(yīng)用于注釋質(zhì)量評估。
【作者單位】: 中國科學(xué)院軟件研究所互聯(lián)網(wǎng)軟件技術(shù)實驗室;中國科學(xué)院大學(xué);中國科學(xué)院軟件研究所總體部;中國科學(xué)院軟件研究所基礎(chǔ)軟件國家工程研究中心;
【基金】:國家科技重大專項(2014ZX01029101-002)~~
【分類號】:TP391.1
【正文快照】: 0引言源代碼注釋是軟件的重要組成部分[1],對代碼理解和軟件維護有著極其重要的作用,然而,多數(shù)軟件項目并不能提供完整的注釋和文檔[2-3],因此,研究者試圖利用人工以及自動化的方法為代碼添加注釋。其中,自動化方法主要包括注釋復(fù)用[4-5]以及摘要抽取[6-8]。注釋復(fù)用技術(shù)先從
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 鄭智捷;幻序合并分類算法[J];計算機學(xué)報;1984年05期
2 劉t,
本文編號:1174041
本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/1174041.html
最近更新
教材專著