基于用戶評(píng)價(jià)的查詢串與搜索結(jié)果特征權(quán)重計(jì)算
[Abstract]:In this paper, a method of calculating feature weights using a large number of user evaluation results is proposed, which is used to solve the similarity analysis between query strings and search results in search engines. The method makes full use of the user's "potential evaluation" of search results. The user's click on the input query string reflects its internal relevance, which can be obtained by the proposed method. The mathematical model of the problem is established, and the calculation of feature weights is solved by using EM algorithm. Because the functions of the model are complex, it is difficult to calculate the convergence of the model. Therefore, the simulated annealing algorithm is used as a supplement to the EM algorithm to verify the convergence of the algorithm. The experiment uses Baidu search engine to carry out the bidding advertisement. The test data samples are 100 ads and 144,132 query, data. The results show that all the features converge to the global optimal solution. The retrieval accuracy of sampling data was 93.32 and the recall rate was 87.43.
【作者單位】: 北京科技大學(xué)信息工程學(xué)院 北京科技大學(xué)信息工程學(xué)院 北京科技大學(xué)信息工程學(xué)院
【分類號(hào)】:TP391.4
【參考文獻(xiàn)】
相關(guān)期刊論文 前3條
1 張士峰;混合正態(tài)分布參數(shù)極大似然估計(jì)的EM算法[J];飛行器測(cè)控學(xué)報(bào);2004年04期
2 王偉,鐘義信,孫建,楊力;一種基于EM非監(jiān)督訓(xùn)練的自組織分詞歧義解決方案[J];中文信息學(xué)報(bào);2001年02期
3 李家福,張亞非;基于EM算法的漢語(yǔ)自動(dòng)分詞方法[J];情報(bào)學(xué)報(bào);2002年03期
【共引文獻(xiàn)】
相關(guān)期刊論文 前10條
1 文庭孝;漢語(yǔ)自動(dòng)分詞研究進(jìn)展[J];圖書與情報(bào);2005年05期
2 王微;石志廣;趙宏鐘;付強(qiáng);;用期望最大化算法抑制角閃爍的預(yù)處理方法[J];電光與控制;2009年05期
3 魯強(qiáng);金偉祖;;基于FMM和CRFs雙層分詞模型的研究[J];電腦知識(shí)與技術(shù);2008年28期
4 李紅霞;易麗萍;;EM無(wú)監(jiān)督漢語(yǔ)分詞算法[J];電腦知識(shí)與技術(shù);2009年12期
5 劉向沖;侯翠霞;申維;張德會(huì);;MML-EM方法及其在化探數(shù)據(jù)混合分布中的應(yīng)用[J];地球科學(xué)(中國(guó)地質(zhì)大學(xué)學(xué)報(bào));2011年02期
6 劉曉英;漢語(yǔ)自動(dòng)分詞研究的發(fā)展趨勢(shì)[J];高校圖書館工作;2005年04期
7 楊哲海;張俊;李之歆;;低通濾波器在高光譜影像分類中的應(yīng)用[J];海洋測(cè)繪;2011年05期
8 解烈軍,侯曉榮,周彩蓮;基于規(guī)則的幾何語(yǔ)言自動(dòng)分詞算法[J];淮陰師范學(xué)院學(xué)報(bào)(自然科學(xué)版);2004年02期
9 曾華琳,李堂秋,史曉東;一種基于提取上下文信息的分詞算法[J];計(jì)算機(jī)應(yīng)用;2005年09期
10 吳春穎;王士同;;基于二元語(yǔ)法的N-最大概率中文粗分模型[J];計(jì)算機(jī)應(yīng)用;2007年12期
相關(guān)會(huì)議論文 前1條
1 曾華琳;史曉東;李堂秋;;基于上下文信息提取的概率分詞算法[A];第六屆漢語(yǔ)詞匯語(yǔ)義學(xué)研討會(huì)論文集[C];2005年
相關(guān)博士學(xué)位論文 前8條
1 彭強(qiáng);復(fù)雜系統(tǒng)遠(yuǎn)程智能故障診斷技術(shù)研究[D];南京理工大學(xué);2004年
2 錢俊;單幅雷達(dá)影像測(cè)圖原理研究[D];武漢大學(xué);2004年
3 喬林;基于多關(guān)鍵詞檢索的企業(yè)競(jìng)爭(zhēng)情報(bào)搜集方法研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2006年
4 劉濤;現(xiàn)代信息檢索中的文本分類及圖像恢復(fù)研究[D];北京郵電大學(xué);2006年
5 楊哲海;高光譜影像分類若干關(guān)鍵技術(shù)的研究[D];解放軍信息工程大學(xué);2006年
6 王闐;信息度優(yōu)先算法及在森林資源統(tǒng)計(jì)分析中的應(yīng)用[D];南京林業(yè)大學(xué);2007年
7 鄧巍;噴霧圖像處理及脈寬調(diào)制(PWM)變量噴霧的霧化特性研究[D];南京農(nóng)業(yè)大學(xué);2007年
8 生龍;二型模糊系統(tǒng)理論及應(yīng)用[D];電子科技大學(xué);2012年
相關(guān)碩士學(xué)位論文 前10條
1 胡志敏;互聯(lián)網(wǎng)文本自動(dòng)文摘技術(shù)的研究[D];湘潭大學(xué);2010年
2 蘭沖;基于統(tǒng)計(jì)規(guī)則的中文分詞研究[D];西安電子科技大學(xué);2011年
3 劉衛(wèi)秋;專利信息檢索系統(tǒng)的研究與實(shí)現(xiàn)[D];中南大學(xué);2010年
4 韓月陽(yáng);基于S-EK圖最短路徑中文分詞的研究[D];云南大學(xué);2011年
5 高勇;校園網(wǎng)數(shù)字資源搜索引擎的技術(shù)研究與實(shí)現(xiàn)[D];解放軍信息工程大學(xué);2008年
6 任麗蕓;搜索引擎中文分詞技術(shù)研究[D];重慶理工大學(xué);2011年
7 陳小蕾;主基因—多基因性狀與微效多基因性狀的綜合選擇指數(shù)研究[D];西北農(nóng)林科技大學(xué);2011年
8 宗胡亮;無(wú)線信道統(tǒng)計(jì)模型識(shí)別及其在MIMO系統(tǒng)下的應(yīng)用[D];南昌大學(xué);2011年
9 關(guān)宏超;基于統(tǒng)計(jì)的開放式漢語(yǔ)自動(dòng)分詞[D];大連理工大學(xué);2002年
10 劉軍;基于論點(diǎn)傾向的網(wǎng)絡(luò)信息內(nèi)容實(shí)時(shí)分析研究[D];四川大學(xué);2003年
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 費(fèi)曉燕,張海燕;一種用EM算法進(jìn)行數(shù)據(jù)清理的方法[J];空軍雷達(dá)學(xué)院學(xué)報(bào);2003年02期
2 張少中,楊南海,王秀坤;貝葉斯網(wǎng)絡(luò)參數(shù)的在線學(xué)習(xí)算法及應(yīng)用[J];小型微型計(jì)算機(jī)系統(tǒng);2004年10期
3 吳建國(guó);彭源;;一種基于EM算法的圖像分割改進(jìn)技術(shù)[J];電腦知識(shí)與技術(shù);2009年13期
4 彭培福;李樹有;姬永剛;李鵬;;改進(jìn)的EM算法在說(shuō)話人識(shí)別中的應(yīng)用[J];遼寧工業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版);2009年03期
5 柳貴東;山拜·達(dá)拉拜;;基于EM算法的非高斯噪聲參數(shù)估計(jì)[J];通信技術(shù);2011年01期
6 任雁;李艷萍;;基于EM算法的MIMO-OFDM系統(tǒng)半盲信道估計(jì)研究[J];長(zhǎng)治學(xué)院學(xué)報(bào);2011年02期
7 徐仁佐,吳新玲;NHPP模型參數(shù)調(diào)整與EM算法[J];計(jì)算機(jī)學(xué)報(bào);1992年05期
8 楊沛武;劉飛;;基于動(dòng)態(tài)概率主元分析的統(tǒng)計(jì)過(guò)程監(jiān)測(cè)[J];計(jì)算機(jī)與應(yīng)用化學(xué);2008年04期
9 許麗佳;王厚軍;龍兵;;基于貝葉斯網(wǎng)絡(luò)的復(fù)雜系統(tǒng)故障預(yù)測(cè)[J];系統(tǒng)工程與電子技術(shù);2008年04期
10 林鴻;;改進(jìn)的EM算法——A-ECM算法[J];福建電腦;2009年10期
相關(guān)會(huì)議論文 前10條
1 馬盡文;何學(xué)鋒;;高斯混合模型的數(shù)據(jù)尺度可壓縮參數(shù)學(xué)習(xí)算法[A];第十四屆全國(guó)信號(hào)處理學(xué)術(shù)年會(huì)(CCSP-2009)論文集[C];2009年
2 丁向東;張勤;;基于EM和規(guī)則算法的半同胞家系單倍型推斷方法[A];中國(guó)動(dòng)物遺傳育種研究進(jìn)展——第十五次全國(guó)動(dòng)物遺傳育種學(xué)術(shù)討論會(huì)論文集[C];2009年
3 趙揚(yáng);馬盡文;;退火EM算法在非監(jiān)督圖像分割中的應(yīng)用[A];第十二屆全國(guó)信號(hào)處理學(xué)術(shù)年會(huì)(CCSP-2005)論文集[C];2005年
4 駱俊;馬盡文;;高斯混合模型的遺傳分基融合算法[A];第十二屆全國(guó)信號(hào)處理學(xué)術(shù)年會(huì)(CCSP-2005)論文集[C];2005年
5 任函;何婷婷;;大規(guī)模在線文本的自動(dòng)分類研究[A];全國(guó)第八屆計(jì)算語(yǔ)言學(xué)聯(lián)合學(xué)術(shù)會(huì)議(JSCL-2005)論文集[C];2005年
6 王彪;王成儒;王芬芬;;一種改進(jìn)的運(yùn)動(dòng)目標(biāo)檢測(cè)算法[A];計(jì)算機(jī)技術(shù)與應(yīng)用進(jìn)展·2007——全國(guó)第18屆計(jì)算機(jī)技術(shù)與應(yīng)用(CACIS)學(xué)術(shù)會(huì)議論文集[C];2007年
7 路晶;馬少平;;基于多例學(xué)習(xí)的web圖像聚類[A];第四屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集(上)[C];2008年
8 韓玉兵;殷瑋瑋;吳樂(lè)南;;基于Wavelet-HMM的圖像超分辨率重建[A];第一屆建立和諧人機(jī)環(huán)境聯(lián)合學(xué)術(shù)會(huì)議(HHME2005)論文集[C];2005年
9 李旭超;朱善安;;WCS-HMT模型在圖像分割中的應(yīng)用[A];2006中國(guó)控制與決策學(xué)術(shù)年會(huì)論文集[C];2006年
10 丁X;許侃;;基于文本聚類方法的我國(guó)科技管理研究領(lǐng)域的計(jì)量研究[A];第三屆科技政策與管理學(xué)術(shù)研討會(huì)暨第二屆科教發(fā)展戰(zhàn)略論壇論文匯編[C];2007年
相關(guān)博士學(xué)位論文 前10條
1 鄭術(shù)蓉;線性不等式約束下的EM算法[D];吉林大學(xué);2004年
2 賈俊杰;空間數(shù)據(jù)挖掘中若干關(guān)鍵技術(shù)研究[D];長(zhǎng)安大學(xué);2009年
3 張文專;非線性再生散度隨機(jī)效應(yīng)模型的統(tǒng)計(jì)分析[D];云南大學(xué);2004年
4 王麗娟;基于特征評(píng)價(jià)的模式識(shí)別算法研究[D];哈爾濱工業(yè)大學(xué);2007年
5 賴欣;對(duì)隨機(jī)效應(yīng)混合治愈模型的一些推廣[D];中國(guó)科學(xué)技術(shù)大學(xué);2009年
6 陳佐;時(shí)間序列相空間重構(gòu)數(shù)據(jù)挖掘方法及其在證券市場(chǎng)的應(yīng)用[D];湖南大學(xué);2007年
7 羅季;有限混合分布模型與線性模型的估計(jì)和檢驗(yàn)問(wèn)題[D];華東師范大學(xué);2008年
8 孫紅杰;基于主動(dòng)測(cè)量的網(wǎng)絡(luò)性能分析[D];哈爾濱工業(yè)大學(xué);2007年
9 田勇;多分辨率隱馬爾可夫模型圖像去噪研究[D];蘭州大學(xué);2009年
10 邵虹;基于內(nèi)容的醫(yī)學(xué)圖像檢索關(guān)鍵技術(shù)研究[D];東北大學(xué);2005年
相關(guān)碩士學(xué)位論文 前10條
1 丁春忠;學(xué)生成績(jī)?cè)u(píng)價(jià)中的因子分析[D];蘇州大學(xué);2004年
2 韓雄振;基于統(tǒng)計(jì)學(xué)的預(yù)測(cè)結(jié)構(gòu)域間相互作用方法的研究[D];吉林大學(xué);2006年
3 趙紅;對(duì)含有缺失基因型數(shù)據(jù)的家系進(jìn)行單倍型推斷的EM方法[D];東北師范大學(xué);2006年
4 涂慶;中小樣本的擬合優(yōu)度檢驗(yàn)[D];華中師范大學(xué);2007年
5 劉妍;混合連接函數(shù)模型及其在風(fēng)險(xiǎn)度量中的應(yīng)用[D];中國(guó)人民大學(xué);2008年
6 韓琨;針對(duì)遠(yuǎn)交林木群體構(gòu)建連鎖不平衡圖譜[D];浙江林學(xué)院;2008年
7 林鴻;EM算法的改進(jìn)及其在基因序列分析中的應(yīng)用[D];福州大學(xué);2006年
8 孫蘭;有限混合模型及其應(yīng)用的研究進(jìn)展[D];東北師范大學(xué);2006年
9 茹正亮;基于狀態(tài)空間模型的金融時(shí)間序列預(yù)測(cè)方法[D];河海大學(xué);2007年
10 張智勇;基于GMDH的缺失數(shù)據(jù)插補(bǔ)方法研究[D];四川大學(xué);2007年
,本文編號(hào):2249981
本文鏈接:http://www.sikaile.net/kejilunwen/sousuoyinqinglunwen/2249981.html