用戶查詢意圖的層次化識別方法
本文關(guān)鍵詞:用戶查詢意圖的層次化識別方法
更多相關(guān)文章: 信息檢索 查詢意圖 層次化識別 意圖模板
【摘要】:【目的】向搜索引擎提交的查詢均有其潛在的查詢意圖,準(zhǔn)確識別查詢意圖可以提高查詢的效率!痉椒ā酷槍τ忻黠@意圖的查詢,采用滑動窗口尋找最大公共子串的策略抽取用戶的意圖模板,然后用模板匹配的方法識別用戶查詢意圖。對無明顯意圖的查詢,采用多特征融合的分類方法進行識別。【結(jié)果】實驗結(jié)果表明,采用層次化識別方法和單獨使用分類器方法相比,識別查詢意圖的實驗結(jié)果正確率得到19.04%的提升。【局限】可獲得的意圖模板是有限的,因此顯式意圖查詢的識別存在局限性。大規(guī)模數(shù)據(jù)情況下,模式匹配及機器學(xué)習(xí)算法的運算量很大,需要進一步優(yōu)化算法!窘Y(jié)論】實驗證明該方法在Web意圖識別中是有效的,對意圖識別率的提高有積極意義。
【作者單位】: 北京信息科技大學(xué)網(wǎng)絡(luò)文化與數(shù)字傳播北京市重點實驗室;中國標(biāo)準(zhǔn)化研究院;
【關(guān)鍵詞】: 信息檢索 查詢意圖 層次化識別 意圖模板
【基金】:國家自然科學(xué)基金項目“基于本體的專利自動標(biāo)引研究”(項目編號:61271304) 北京市教委科技發(fā)展計劃重點項目暨北京市自然科學(xué)基金B(yǎng)類重點項目“面向領(lǐng)域的互聯(lián)網(wǎng)多模態(tài)信息精準(zhǔn)搜索方法研究”(項目編號:KZ201311232037)的研究成果之一
【分類號】:TP391.3
【正文快照】: 1引言互聯(lián)網(wǎng)上數(shù)據(jù)龐大,以指數(shù)級形式增長,搜索引擎已經(jīng)成為人們?yōu)g覽互聯(lián)網(wǎng)信息的一個主要手段。獲取用戶查詢意圖以及對用戶查詢意圖分類是當(dāng)前的熱點研究問題。如果能夠理解隱藏在用戶查詢背后的意圖,就能夠幫助搜索引擎自動將查詢提交到相對應(yīng)的垂直搜索引擎上,得到更加準(zhǔn)
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前6條
1 袁鼎榮;鐘寧;張師超;;文本信息處理研究述評[J];計算機科學(xué);2011年02期
2 伍大勇;趙世奇;劉挺;張宇;;融合多類特征的Web查詢意圖識別[J];模式識別與人工智能;2012年03期
3 修馳;宋柔;;基于無監(jiān)督學(xué)習(xí)的專業(yè)領(lǐng)域分詞歧義消解方法[J];計算機應(yīng)用;2013年03期
4 吳曉暉;宋萍萍;張榮欣;;有無查詢意圖的分類與實現(xiàn)架構(gòu)模型研究[J];情報科學(xué);2009年12期
5 王大玲;于戈;鮑玉斌;張沫;沈洲;;基于用戶搜索意圖的Web網(wǎng)頁動態(tài)泛化[J];軟件學(xué)報;2010年05期
6 張曉娟;陸偉;;利用查詢重構(gòu)識別查詢意圖[J];現(xiàn)代圖書情報技術(shù);2013年01期
【共引文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 任劍鋒;梁雪;李淑紅;;基于非線性流形學(xué)習(xí)和支持向量機的文本分類算法[J];計算機科學(xué);2012年01期
2 楊藝;周元;;基于用戶查詢意圖識別的Web搜索優(yōu)化模型[J];計算機科學(xué);2012年01期
3 肖婷;陳紅英;;基于可信度的Web信息搜索主動服務(wù)研究[J];計算機與現(xiàn)代化;2011年05期
4 賈長云;梁海軍;;基于B-ISVM算法的物聯(lián)網(wǎng)云存儲數(shù)據(jù)偽裝不良信息檢測[J];計算機科學(xué);2013年02期
5 戴璐;丁立新;薛兵;;一種摘要中隱含的知識片段的挖掘方案[J];計算機科學(xué);2013年02期
6 蔡宇;楊廣超;;基于語義核函數(shù)的問句檢索系統(tǒng)的實現(xiàn)[J];情報科學(xué);2011年11期
7 吳曉暉;廖家艷;陳延壽;;中外搜索引擎對比與研究熱點分析[J];情報雜志;2010年12期
8 任豪棟;賈年;;基于用戶相似度計算的導(dǎo)航類意圖分類研究[J];西華大學(xué)學(xué)報(自然科學(xué)版);2011年03期
9 張小琴;王曉輝;;主題信息搜索系統(tǒng)中的搜索策略研究[J];軟件導(dǎo)刊;2014年01期
10 陸偉;周紅霞;張曉娟;;查詢意圖研究綜述[J];中國圖書館學(xué)報;2013年01期
中國博士學(xué)位論文全文數(shù)據(jù)庫 前1條
1 伍大勇;搜索引擎中命名實體查詢處理相關(guān)技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2012年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前5條
1 孫凱;自動答疑系統(tǒng)中的問句理解與個性化推薦算法研究[D];南京信息工程大學(xué);2011年
2 韓國興;面向移動搜索的PUSH平臺的設(shè)計與實現(xiàn)[D];哈爾濱工程大學(xué);2011年
3 段煥中;事務(wù)類搜索意圖分類模型研究[D];北京郵電大學(xué);2012年
4 安沖;一種在搜索日志中挖掘用戶搜索意圖并推薦相關(guān)搜索詞的方法[D];北京郵電大學(xué);2013年
5 夏徵;安立通訊人事管理系統(tǒng)的設(shè)計與實現(xiàn)[D];大連理工大學(xué);2013年
【二級參考文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 羅智勇;宋柔;;基于多特征的自適應(yīng)新詞識別[J];北京工業(yè)大學(xué)學(xué)報;2007年07期
2 唐培麗,王樹明,胡明;基于語義的漢語文獻主題詞提取算法研究[J];吉林大學(xué)學(xué)報(信息科學(xué)版);2005年05期
3 傅賽香,袁鼎榮,黃柏雄,鐘智;基于統(tǒng)計的無詞典分詞方法[J];廣西科學(xué)院學(xué)報;2002年04期
4 周雅倩,郭以昆,黃萱菁,吳立德;基于最大熵方法的中英文基本名詞短語識別[J];計算機研究與發(fā)展;2003年03期
5 馬穎華,王永成,蘇貴洋,張宇萌;一種基于字同現(xiàn)頻率的漢語文本主題抽取方法[J];計算機研究與發(fā)展;2003年06期
6 劉群,張華平,俞鴻魁,程學(xué)旗;基于層疊隱馬模型的漢語詞法分析[J];計算機研究與發(fā)展;2004年08期
7 李榮陸,王建會,陳曉云,陶曉鵬,胡運發(fā);使用最大熵模型進行中文文本分類[J];計算機研究與發(fā)展;2005年01期
8 羅智勇;宋柔;;現(xiàn)代漢語通用分詞系統(tǒng)中歧義切分的實用技術(shù)[J];計算機研究與發(fā)展;2006年06期
9 李鑫;黃萱菁;吳立德;;基于錯誤驅(qū)動算法組合分類器及其在問題分類中的應(yīng)用[J];計算機研究與發(fā)展;2008年03期
10 郝秀蘭;陶曉鵬;徐和祥;胡運發(fā);;kNN文本分類器類偏斜問題的一種處理對策[J];計算機研究與發(fā)展;2009年01期
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 舒江波;胡金柱;肖升;;基于語法的信息檢索模型研究——信息檢索方法的一個新分支[J];情報理論與實踐;2011年04期
2 王誠,張t,
本文編號:1022951
本文鏈接:http://www.sikaile.net/kejilunwen/sousuoyinqinglunwen/1022951.html