一種結(jié)合同義詞典和詞對共現(xiàn)距離的查詢擴展方法
【圖文】:
增加計算復雜程度,而且可能引入噪聲。實驗中,取相關(guān)詞的前10個來表征該詞在上下文中語義,并在不同w下,計算相關(guān)詞平均權(quán)重,實驗結(jié)果見圖1。 從實驗可以看出,當0<w<30時,相關(guān)詞的平均權(quán)重隨著共現(xiàn)窗口的增大而增大;當30<w<50時,相關(guān)詞的平均權(quán)重基本穩(wěn)定;當w>50時,相關(guān)詞的平均權(quán)重微有下降。從語義上來講,詞與詞的潛在相關(guān)性在上下文中只在一定范圍內(nèi)才具有有效,如果超出詞的語義映射范圍,就會增加不必要的計算
慮用戶查看搜索結(jié)果的習慣,人工統(tǒng)計前60條搜索結(jié)果的查準率Pr@ 60(由于涉及到具體的搜索引擎的網(wǎng)頁數(shù)據(jù)庫,暫時不統(tǒng)計查全率)。為了說明該查詢擴展方法的有效性,將本文提出的方法與不擴展、上下文擴展方法和同義詞典擴展作比較,結(jié)果見圖2。圖1 共現(xiàn)窗口和相關(guān)詞平均權(quán)重的關(guān)系圖Fig·1 Relation between cooccurrencew indow and relevant term s weight圖2 四種擴展的查準率比較Fig·2 Comparison of four expansion strategy308
【作者單位】: 廣西大學計算機與電子信息學院;
【基金】:國家863項目資助項目(2007AA01Z403)
【分類號】:TP391.3
【參考文獻】
相關(guān)期刊論文 前6條
1 李莉;高慶獅;;一種基于語義單元的查詢擴展方法[J];計算機科學;2008年02期
2 章志凌;虞立群;陳奕秋;羅海飛;邵曉敏;;基于Corpus庫的詞語相似度計算方法[J];計算機應(yīng)用;2006年03期
3 胡俊峰 ,俞士汶;唐宋詩中詞匯語義相似度的統(tǒng)計分析及應(yīng)用[J];中文信息學報;2002年04期
4 王斌,劉群,張祥;漢英雙語庫自動分段對齊研究[J];軟件學報;2000年11期
5 崔航,文繼榮,李敏強;基于用戶日志的查詢擴展統(tǒng)計模型[J];軟件學報;2003年09期
6 田萱;杜小勇;李海華;;語義查詢擴展中詞語-概念相關(guān)度的計算[J];軟件學報;2008年08期
【共引文獻】
相關(guān)期刊論文 前10條
1 李智;;義素分析法與詞典釋義[J];北方論叢;2007年02期
2 余正濤,樊孝忠,宋麗榮;基于特定問題類別的漢語問答系統(tǒng)查詢擴展[J];北京理工大學學報;2005年10期
3 秦莉;;從“工薪族”、“上班族”二個詞語看民族人的詞類觀[J];才智;2008年19期
4 田久樂;趙蔚;;基于同義詞詞林的詞語相似度計算方法[J];吉林大學學報(信息科學版);2010年06期
5 齊波;王成良;;現(xiàn)代漢語短語的機器識別[J];重慶工學院學報(自然科學版);2007年12期
6 尚福華;韓開旭;;基于相關(guān)術(shù)語群和同義詞的查詢擴展研究[J];長江大學學報(自然科學版)理工卷;2010年03期
7 吳佳娣;;現(xiàn)代漢語方位詞的界定和甄別[J];時代教育(教育教學);2011年04期
8 張俐,李晶皎,胡明涵,姚天順;中文WordNet的研究及實現(xiàn)[J];東北大學學報;2003年04期
9 郗君甫;劉國華;唐軍軍;祁瑞麗;朱鶴;;基于本體的關(guān)系數(shù)據(jù)庫關(guān)鍵詞語義查詢擴展方法[J];燕山大學學報;2010年03期
10 李慧穎;瞿裕忠;;基于關(guān)鍵詞的RDF數(shù)據(jù)查詢方法[J];東南大學學報(自然科學版);2010年02期
相關(guān)會議論文 前10條
1 徐海;;英、漢分類詞典編纂芻議[A];中國辭書學會雙語詞典專業(yè)委員會第四屆年會暨學術(shù)研討會論文集[C];2001年
2 ;THE ECOMMERCE INFORMATION MODEL DRIVEN SEMANTIC SEARCHING ALGORITHM[A];Proceedings of 2006 International Symposium on Distributed Computing and Applications to Business, Engineering and Science[C];2006年
3 章志凌;虞立群;羅海飛;邵曉敏;;基于改進Corpus庫的詞語相似度計算方法[A];第二十四屆中國控制會議論文集(下冊)[C];2005年
4 李永宏;周一心;于洪志;;倉央嘉措情歌的詞匯組合與節(jié)律的關(guān)系研究[A];第十屆全國人機語音通訊學術(shù)會議暨國際語音語言處理研討會論文摘要集[C];2009年
5 李月雷;師瑞峰;林麗冰;周一民;;漢語語句語義相似度的計算方法[A];2008'中國信息技術(shù)與應(yīng)用學術(shù)論壇論文集(一)[C];2008年
6 張威;張博剛;廖飛雄;陳月寧;;基于軟件運行記錄的交互測試研究[A];第六屆中國測試學術(shù)會議論文集[C];2010年
7 高建忠;;漢語動賓搭配的自動識別研究[A];自然語言理解與機器翻譯——全國第六屆計算語言學聯(lián)合學術(shù)會議論文集[C];2001年
8 魯松;白碩;;詞距離的計算方法[A];自然語言理解與機器翻譯——全國第六屆計算語言學聯(lián)合學術(shù)會議論文集[C];2001年
9 李維剛;劉挺;王震;李生;;雙語語料庫段落重組對齊方法研究[A];語言計算與基于內(nèi)容的文本處理——全國第七屆計算語言學聯(lián)合學術(shù)會議論文集[C];2003年
10 顏偉;荀恩東;;基于WordNet的英語詞語相似度計算[A];第二屆全國學生計算語言學研討會論文集[C];2004年
相關(guān)博士學位論文 前10條
1 齊璇;漢語語義知識的表示及其在漢英機譯中的應(yīng)用[D];國防科學技術(shù)大學;2002年
2 馬紅妹;漢英機器翻譯中漢語上下文語境的表示與應(yīng)用研究[D];中國人民解放軍國防科學技術(shù)大學;2002年
3 吳健;基于Web服務(wù)的網(wǎng)絡(luò)化產(chǎn)品配置技術(shù)研究[D];浙江大學;2004年
4 余衛(wèi)宇;幾種圖像結(jié)構(gòu)語義模型和圖像[D];華南理工大學;2005年
5 李智;機器學習方法及其在基金項目評審中的應(yīng)用研究[D];天津大學;2004年
6 曹海龍;基于詞匯化統(tǒng)計模型的漢語句法分析研究[D];哈爾濱工業(yè)大學;2006年
7 王斌;漢英雙語語料庫自動對齊研究[D];中國科學院研究生院(計算技術(shù)研究所);1999年
8 李曉黎;WEB信息檢索與分類中的數(shù)據(jù)采掘研究[D];中國科學院研究生院(計算技術(shù)研究所);2001年
9 魯松;自然語言處理中詞相關(guān)性知識無導獲取和均衡分類器構(gòu)建[D];中國科學院研究生院(計算技術(shù)研究所);2001年
10 郭巖;網(wǎng)絡(luò)日志中用戶興趣的挖掘及利用[D];中國科學院研究生院(計算技術(shù)研究所);2004年
相關(guān)碩士學位論文 前10條
1 呂晨;搜索競價廣告關(guān)鍵詞優(yōu)化問題研究[D];山東科技大學;2010年
2 羅義兵;領(lǐng)域文本相似度計算方法研究[D];山東科技大學;2010年
3 程國斌;基于指示詞語義擴展的詞義識別方法的研究[D];哈爾濱工程大學;2010年
4 張瑤;英漢機器翻譯中的英語動詞漢譯研究[D];大連理工大學;2010年
5 劉金盼;新聞?wù)Z料庫中基于概念網(wǎng)絡(luò)的詞語相關(guān)度計算[D];華東師范大學;2011年
6 姚賢明;領(lǐng)域概念自動抽取研究[D];昆明理工大學;2010年
7 李春;基于本體的文本信息檢索技術(shù)研究與實現(xiàn)[D];南京航空航天大學;2009年
8 高建忠;漢語動賓搭配的自動識別研究[D];北京語言文化大學;2000年
9 王春霞;基于語料庫的離合詞研究[D];北京語言文化大學;2001年
10 張春國;工藝語句漢英計算機輔助翻譯系統(tǒng)關(guān)鍵技術(shù)研究[D];南京航空航天大學;2004年
【二級參考文獻】
相關(guān)期刊論文 前10條
1 胡俊峰,俞士汶;唐宋詩之計算機輔助深層研究[J];北京大學學報(自然科學版);2001年05期
2 顧榕,王小平,曹立明;一種基于潛在語義分析的查詢擴展算法[J];計算機工程與應(yīng)用;2004年18期
3 魯松,白碩;自然語言處理中詞語上下文有效范圍的定量描述[J];計算機學報;2001年07期
4 張敏,宋睿華,馬少平;基于語義關(guān)系查詢擴展的文檔重構(gòu)方法[J];計算機學報;2004年10期
5 胡俊峰 ,俞士汶;唐宋詩中詞匯語義相似度的統(tǒng)計分析及應(yīng)用[J];中文信息學報;2002年04期
6 盛秋艷,何文廣;基于Hopfield神經(jīng)網(wǎng)絡(luò)的概念檢索技術(shù)[J];情報科學;2004年03期
7 羅威;基于向量空間的中文概念檢索技術(shù)研究[J];情報理論與實踐;2003年03期
8 崔航,文繼榮,李敏強;基于用戶日志的查詢擴展統(tǒng)計模型[J];軟件學報;2003年09期
9 高小宇,高慶獅,胡s,
本文編號:2540026
本文鏈接:http://www.sikaile.net/kejilunwen/sousuoyinqinglunwen/2540026.html