基于偽文檔的偽相關(guān)反饋方法
本文關(guān)鍵詞:基于偽文檔的偽相關(guān)反饋方法
更多相關(guān)文章: 偽相關(guān)反饋 偽文檔 主題分析 隱含主題
【摘要】:傳統(tǒng)的偽相關(guān)反饋(Pseudo Relevance Feedback,PRF)方法通常是以文檔作為擴(kuò)展源單元提取擴(kuò)展詞,提取粒度過(guò)大造成擴(kuò)展源質(zhì)量下降,使得檢索結(jié)果魯棒性差。該文研究利用主題分析技術(shù),嘗試將文本語(yǔ)義內(nèi)容作為擴(kuò)展源單元,緩解擴(kuò)展源質(zhì)量不高的問(wèn)題。提出并實(shí)現(xiàn)了對(duì)文本集中各文檔內(nèi)容的偽文檔描述,通過(guò)對(duì)其進(jìn)行隱式多樣化處理,實(shí)現(xiàn)了從更細(xì)微的文本內(nèi)容角度出發(fā)提取擴(kuò)展詞。通過(guò)在真實(shí)NTCIR8中文語(yǔ)料的檢索結(jié)果表明,該方法可以有效地提升偽相關(guān)反饋的檢索性能。
【作者單位】: 內(nèi)蒙古大學(xué)計(jì)算機(jī)學(xué)院;
【關(guān)鍵詞】: 偽相關(guān)反饋 偽文檔 主題分析 隱含主題
【基金】:國(guó)家自然科學(xué)基金(61263037;61662053) 內(nèi)蒙古自然科學(xué)基金(2014BS0604)
【分類(lèi)號(hào)】:TP391.1
【正文快照】: 1引言對(duì)于基于關(guān)鍵詞的檢索方式,通常用戶是通過(guò)構(gòu)造短查詢(xún)來(lái)表達(dá)其查詢(xún)需求的。這樣的結(jié)果是,檢索效果會(huì)因?yàn)橛脩舨樵?xún)需求表達(dá)不全而表現(xiàn)不佳。為了彌補(bǔ)用戶查詢(xún)表達(dá)不全的問(wèn)題,查詢(xún)擴(kuò)展(Query Expansion)技術(shù)[1]通過(guò)將與用戶查詢(xún)意思相近的詞語(yǔ)引入用戶初始查詢(xún),達(dá)到提高檢
【參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前1條
1 徐博;林鴻飛;林原;王健;;一種基于排序?qū)W習(xí)方法的查詢(xún)擴(kuò)展技術(shù)[J];中文信息學(xué)報(bào);2015年03期
【共引文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前1條
1 閆蓉;高光來(lái);;基于偽文檔的偽相關(guān)反饋方法[J];中文信息學(xué)報(bào);2016年06期
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 張建鋼;;文獻(xiàn)的主題分析[J];圖書(shū)情報(bào)工作;1986年03期
2 馬緒超;檔案主題分析初探[J];湖南檔案;1997年05期
3 馬緒超;檔案主題分析質(zhì)量初探[J];城建檔案;1998年04期
4 馬緒超;;論檔案主題分析質(zhì)量問(wèn)題[J];黑龍江檔案;1998年04期
5 裴少紅;檔案主題分析常見(jiàn)誤差與對(duì)策[J];山東檔案;2003年02期
6 ;國(guó)家社會(huì)科學(xué)基金“圖書(shū)館·情報(bào)與文獻(xiàn)學(xué)”立項(xiàng)主題分析[J];當(dāng)代圖書(shū)館;2007年04期
7 陳晉;;我國(guó)開(kāi)放獲取研究文獻(xiàn)的主題分析[J];現(xiàn)代情報(bào);2011年06期
8 里帆;;檔案主題分析的一般方法[J];檔案工作;1986年02期
9 周亞男;;主題分析是文獻(xiàn)標(biāo)引的基礎(chǔ)[J];圖書(shū)館學(xué)刊;1991年01期
10 姚效秋;主題分析誤檢透析[J];江西圖書(shū)館學(xué)刊;1998年S1期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前2條
1 黃熔秋;;醫(yī)學(xué)論文關(guān)鍵詞標(biāo)引與主題分析[A];學(xué)報(bào)編輯論叢(第十二集)[C];2004年
2 宋昭勛;;組織文化的幻想主題分析:理論架構(gòu)與分析步驟[A];全球信息化時(shí)代的華人傳播研究:力量匯聚與學(xué)術(shù)創(chuàng)新——2003中國(guó)傳播學(xué)論壇暨CAC/CCA中華傳播學(xué)術(shù)研討會(huì)論文集(上冊(cè))[C];2004年
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前1條
1 周亦鵬;基于軟件人的情境主題分析及應(yīng)用研究[D];北京科技大學(xué);2012年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 文博;面向智能客服機(jī)器人的交互式問(wèn)句理解研究[D];哈爾濱工業(yè)大學(xué);2014年
2 王立人;基于主題分析和社交圈發(fā)現(xiàn)的微博朋友推薦[D];昆明理工大學(xué);2016年
3 彭中正;基于Spark的社交主題分析與應(yīng)用[D];電子科技大學(xué);2016年
4 王偉祿;探尋生活之意——大衛(wèi)·馬梅特早期劇作主題分析[D];內(nèi)蒙古大學(xué);2010年
5 車(chē)?guó)P成;約翰·霍克斯《第二張皮》的主題分析[D];西北師范大學(xué);2001年
6 董麗;服務(wù)的信息抓取和分析模塊的設(shè)計(jì)與實(shí)現(xiàn)[D];北京郵電大學(xué);2015年
7 徐宏玲;《他們》的異化主題分析[D];安徽大學(xué);2010年
8 趙秀蘭;《五號(hào)屠場(chǎng)》的主題分析[D];西北師范大學(xué);2002年
9 靳君;《追風(fēng)箏的人》多重主題分析[D];遼寧大學(xué);2012年
10 李慧淑;及物性、態(tài)度系統(tǒng)與短篇小說(shuō)主題分析[D];東北林業(yè)大學(xué);2009年
,本文編號(hào):750876
本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/750876.html