一種面向在線查詢的拼寫(xiě)糾錯(cuò)算法
本文關(guān)鍵詞:一種面向在線查詢的拼寫(xiě)糾錯(cuò)算法
更多相關(guān)文章: 拼寫(xiě)糾錯(cuò) 查詢補(bǔ)全 期望最大化算法 N語(yǔ)法語(yǔ)言模型
【摘要】:搜索引擎中,在線拼寫(xiě)糾錯(cuò)根據(jù)用戶查詢輸入補(bǔ)全用戶查詢,并給出正確的拼寫(xiě)建議。提出了一種面向查詢補(bǔ)全的在線拼寫(xiě)糾錯(cuò)算法;谡鎸(shí)查詢的噪聲信道轉(zhuǎn)換方式,算法建立了用戶查詢輸入的生成模型;利用拼寫(xiě)糾錯(cuò)對(duì),算法采用期望最大化算法訓(xùn)練能捕獲用戶誤拼行為的馬爾科夫N語(yǔ)法轉(zhuǎn)換模型;算法采用不同剪枝策略的啟發(fā)式改進(jìn)A*搜索算法以實(shí)現(xiàn)實(shí)時(shí)給出糾錯(cuò)補(bǔ)全建議。實(shí)驗(yàn)結(jié)果表明,提出的算法相比其他同類算法更有效。
【作者單位】: 中國(guó)人民解放軍陸軍軍官學(xué)院十一系計(jì)算機(jī)教研室;
【分類號(hào)】:TP391.3
【正文快照】: 1引言拼寫(xiě)糾錯(cuò)問(wèn)題的研究由來(lái)已久[1-3]。Damerau[1]和Levenshtein[2]提出的編輯距離(Edit distance),是一種廣泛使用的通用拼寫(xiě)糾錯(cuò)模型。最近更多工作關(guān)注于面向搜索查詢的離線拼寫(xiě)糾錯(cuò)[2,4-8]。Cucerzan和Brill利用查詢?nèi)罩拘畔⑻岢鲆环N迭代拼寫(xiě)糾錯(cuò)方法[2]。Li等人則提出
【共引文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前5條
1 飛龍;高光來(lái);閆學(xué)亮;魏宏喜;;傳統(tǒng)蒙古文與西里爾蒙古文相互轉(zhuǎn)換方法的研究[J];計(jì)算機(jī)工程與應(yīng)用;2014年23期
2 袁樺;史永哲;趙軍紅;劉加;;基于JSM和MLP改進(jìn)發(fā)音錯(cuò)誤檢測(cè)的方法[J];自動(dòng)化學(xué)報(bào);2014年12期
3 鄭永軍;張連海;;融合查詢擴(kuò)展和動(dòng)態(tài)匹配的集外詞檢測(cè)[J];數(shù)據(jù)采集與處理;2014年02期
4 唐金玲;;國(guó)際三大檢索系統(tǒng)論文作者機(jī)構(gòu)名稱問(wèn)題研究——以高校機(jī)構(gòu)名稱為例[J];情報(bào)探索;2014年09期
5 楊震;王來(lái)濤;賴英旭;;基于改進(jìn)語(yǔ)義距離的網(wǎng)絡(luò)評(píng)論聚類研究[J];軟件學(xué)報(bào);2014年12期
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前1條
1 飛龍;蒙古語(yǔ)語(yǔ)音關(guān)鍵詞檢測(cè)技術(shù)的研究[D];內(nèi)蒙古大學(xué);2013年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前3條
1 李柏玲;基于統(tǒng)計(jì)的漢語(yǔ)意見(jiàn)文本校對(duì)系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D];黑龍江大學(xué);2014年
2 熊世富;集外詞的語(yǔ)音檢索方法研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2014年
3 游妍;基于本體融合的居民電子健康檔案構(gòu)建方法[D];上海交通大學(xué);2014年
,本文編號(hào):1190169
本文鏈接:http://www.sikaile.net/kejilunwen/sousuoyinqinglunwen/1190169.html