天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 搜索引擎論文 >

基于代碼模式的軟件問答文檔檢索優(yōu)化方法

發(fā)布時間:2018-08-24 19:29
【摘要】:開發(fā)人員通常通過問答網(wǎng)站的搜索引擎進行相關(guān)軟件問答文檔的搜索。在檢索結(jié)果中,包含優(yōu)質(zhì)代碼片段(使用示例)的問答文檔往往更受青睞,但如何度量這些文檔中代碼片段的質(zhì)量仍是個巨大的挑戰(zhàn)。針對這個問題,提出了一種基于代碼模式的軟件問答文檔檢索優(yōu)化方法。該方法能夠基于當(dāng)前檢索結(jié)果,抽取文檔中的代碼片段,分析代碼片段中的公共代碼模式,并基于代碼模式度量文檔中代碼片段的質(zhì)量,從原有檢索結(jié)果中向用戶推薦高質(zhì)量的軟件問答文檔。以軟件開發(fā)人員在實踐過程中遇到的真實問題為基礎(chǔ)進行了實驗,對比Stack Overflow的搜索結(jié)果,所提方法在準(zhǔn)確率指標(biāo)NDCG@5上提升了40%。
[Abstract]:Developers usually search software Q&A documents through the search engines of Q&A websites. Q&A documents containing high-quality code fragments (using examples) are often preferred in search results, but how to measure the quality of code fragments in these documents is still a great challenge. To solve this problem, a new Q&A document based on Q&A is proposed. This method can extract code fragments from documents based on current retrieval results, analyze common code patterns in code fragments, and measure the quality of code fragments in documents based on code patterns. Based on the real problems encountered by software developers in the process of practice, the proposed method is compared with the Stack Overflow search results, and the accuracy index NDCG@5 is improved by 40%.
【作者單位】: 北京大學(xué)信息科學(xué)技術(shù)學(xué)院;高可信軟件技術(shù)教育部重點實驗室;北京大學(xué)(天津濱海)新一代信息技術(shù)研究院;
【基金】:國家重點研發(fā)計劃No.2016YFB1000804 國家杰出青年科學(xué)基金No.61525201~~
【分類號】:TP391.3

【相似文獻】

相關(guān)期刊論文 前10條

1 賈西平;彭宏;鄭啟倫;石時需;江焯林;;基于主題的文檔檢索模型[J];華南理工大學(xué)學(xué)報(自然科學(xué)版);2008年09期

2 毓鈞;多層次文檔檢索軟件的實施方法[J];鐵路計算機應(yīng)用;1994年01期

3 王洪俊;施水才;俞士汶;肖詩斌;;跨語言相似文檔檢索[J];中文信息學(xué)報;2007年01期

4 孫成立;;混淆網(wǎng)絡(luò)在音頻文檔檢索系統(tǒng)中的應(yīng)用研究[J];計算機工程與應(yīng)用;2010年28期

5 韓海清;陳頡;;基于用戶興趣偏好的網(wǎng)絡(luò)文檔檢索[J];計算機光盤軟件與應(yīng)用;2012年08期

6 賈西平;劉海珠;;面向服務(wù)的文檔智能檢索平臺[J];廣東技術(shù)師范學(xué)院學(xué)報;2010年03期

7 李勝;胡和平;;語義桌面環(huán)境下一種基于概念圖的文檔檢索方法[J];計算機工程與科學(xué);2009年08期

8 羊帥;王鋒;林蘭芬;朱曉偉;謝非;;基于自動查詢擴展的專利文檔檢索方法[J];中國科技論文;2013年10期

9 楊毅;;一種Word文檔關(guān)鍵詞自動整理方法[J];信息與電腦(理論版);2014年01期

10 李培國;葉嫣;;多類型文檔檢索和轉(zhuǎn)換技術(shù)研究[J];微型機與應(yīng)用;2014年10期

相關(guān)會議論文 前2條

1 王洪俊;施水才;俞士汶;肖詩斌;;跨語言文檔對齊[A];NCIRCS2004第一屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集[C];2004年

2 何莉;林鴻飛;;基于主題劃分的分布式檢索混合結(jié)果合并技術(shù)研究[A];中國計算機語言學(xué)研究前沿進展(2007-2009)[C];2009年

相關(guān)重要報紙文章 前1條

1 實習(xí)記者 史紫薇;布局“點”與“面”,,大數(shù)據(jù)落地醫(yī)療行業(yè)[N];中國計算機報;2013年

相關(guān)博士學(xué)位論文 前2條

1 鄭鐵然;基于音節(jié)網(wǎng)格的漢語語音文檔檢索方法研究[D];哈爾濱工業(yè)大學(xué);2008年

2 黃亮;脫機中文手寫文檔檢索關(guān)鍵技術(shù)研究[D];武漢大學(xué);2013年

相關(guān)碩士學(xué)位論文 前10條

1 金鑫;多媒體文檔檢索研究[D];西安電子科技大學(xué);2012年

2 張國良;基于改進詞袋的多媒體文檔檢索研究[D];西安電子科技大學(xué);2013年

3 付興剛;基于筆畫距離的手寫文檔檢索算法研究[D];哈爾濱工業(yè)大學(xué);2009年

4 羊帥;基于自動查詢擴展的專利文檔檢索方法[D];浙江大學(xué);2013年

5 廖興偉;文檔復(fù)制檢測方法研究與系統(tǒng)實現(xiàn)[D];哈爾濱工業(yè)大學(xué);2012年

6 武文博;基于能量彈性網(wǎng)格的手寫文檔檢索方法[D];哈爾濱工業(yè)大學(xué);2008年

7 李化;基于圖像內(nèi)容的文檔檢索方法研究[D];延邊大學(xué);2010年

8 郭永明;XML文檔檢索技術(shù)研究[D];太原理工大學(xué);2003年

9 李興隆;基于Ontology的文檔檢索[D];東北大學(xué);2005年

10 江騰蛟;XML文本文檔檢索技術(shù)研究[D];江西財經(jīng)大學(xué);2006年



本文編號:2201803

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/sousuoyinqinglunwen/2201803.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶cf42e***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com