一個新的個性化搜索引擎排序算法
本文關(guān)鍵詞:一個新的個性化搜索引擎排序算法
更多相關(guān)文章: 個性化排序 用戶興趣模型 奇異值分解 k-means聚類算法 樸素貝葉斯分類器
【摘要】:通過對現(xiàn)有個性化搜索引擎排序算法的研究,提出了一個新的排序算法。該算法首先在不同粒度上多次使用SVD技術(shù)和k-means聚類技術(shù),將用戶瀏覽歷史及其所包含的詞在不同層次上進(jìn)行文檔聚類和詞聚類,創(chuàng)建兩棵加權(quán)興趣樹:文檔類樹和詞類樹。其中,樹中每個節(jié)點(diǎn)的權(quán)值表示用戶對該類文檔或該類詞的感興趣程度。接著,利用樸素貝葉斯分類器對搜索引擎得到的網(wǎng)頁進(jìn)行文檔分類和詞分類,并根據(jù)分類結(jié)果進(jìn)行網(wǎng)頁評分。最后,將網(wǎng)頁根據(jù)文檔得分降序排列。實(shí)驗(yàn)表明該方法能為用戶提供更為精確的個性化排序。
【作者單位】: 太原科技大學(xué)計算機(jī)科學(xué)與技術(shù)學(xué)院;
【關(guān)鍵詞】: 個性化排序 用戶興趣模型 奇異值分解 k-means聚類算法 樸素貝葉斯分類器
【分類號】:TP391.3
【正文快照】: 在早期的搜索引擎中,搜索結(jié)果的排序只是以檢索器在數(shù)據(jù)庫中找到匹配網(wǎng)頁的先后順序排列。隨著互聯(lián)網(wǎng)的不斷發(fā)展,大量的垃圾信息和重復(fù)信息充斥著互聯(lián)網(wǎng),影響了用戶對感興趣信息的訪問。而傳統(tǒng)的搜索引擎排序只能依靠關(guān)鍵詞的相似度計算,當(dāng)數(shù)據(jù)達(dá)到千萬級別的時候,用戶的一次
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前5條
1 劉海峰;王元元;張學(xué)仁;;基于潛在語義空間的文本檢索問題研究[J];情報科學(xué);2007年05期
2 曾春,邢春曉,周立柱;個性化服務(wù)技術(shù)綜述[J];軟件學(xué)報;2002年10期
3 曾春,邢春曉,周立柱;基于內(nèi)容過濾的個性化搜索算法[J];軟件學(xué)報;2003年05期
4 常璐,夏祖奇;搜索引擎的幾種常用排序算法[J];圖書情報工作;2003年06期
5 楊思洛;搜索引擎的排序技術(shù)研究[J];現(xiàn)代圖書情報技術(shù);2005年01期
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前2條
1 馮超;K-means聚類算法的研究[D];大連理工大學(xué);2007年
2 張躍火;基于用戶興趣偏好模型的個性化搜索算法[D];重慶大學(xué);2010年
【共引文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 汪潔;朱軍;;基于Linux的中文垃圾郵件過濾系統(tǒng)設(shè)計與實(shí)現(xiàn)[J];安徽農(nóng)業(yè)大學(xué)學(xué)報;2011年02期
2 姚克娟,李晉宏;應(yīng)用Agent技術(shù)實(shí)現(xiàn)個性化信息服務(wù)[J];北方工業(yè)大學(xué)學(xué)報;2004年03期
3 王麗影;劉媛媛;李建英;;個性化服務(wù)在網(wǎng)絡(luò)課程中的應(yīng)用研究[J];辦公自動化;2009年20期
4 李偉;黃穎;;基于HtmlParser的網(wǎng)頁信息提取[J];兵工自動化;2007年07期
5 張俊芬;;搜索引擎之競價排名的法律問題研究[J];北京郵電大學(xué)學(xué)報(社會科學(xué)版);2009年06期
6 紀(jì)良浩;王國胤;楊勇;;基于協(xié)作過濾的Web日志數(shù)據(jù)預(yù)處理研究[J];重慶郵電學(xué)院學(xué)報(自然科學(xué)版);2006年05期
7 紀(jì)良浩;;協(xié)作過濾信息推薦技術(shù)研究[J];重慶郵電大學(xué)學(xué)報(自然科學(xué)版);2012年01期
8 陳大平;;搜索引擎技術(shù)方式之探析[J];長春理工大學(xué)學(xué)報(高教版);2009年10期
9 許建潮;王紅梅;;改進(jìn)的協(xié)同過濾算法[J];吉林大學(xué)學(xué)報(信息科學(xué)版);2008年01期
10 辛勤芳;;基于項(xiàng)目聚類的協(xié)同過濾算法研究[J];赤峰學(xué)院學(xué)報(自然科學(xué)版);2011年09期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 雷育生;甘仞初;楊軍;;一種基于用戶偏好的虛擬網(wǎng)站信息結(jié)構(gòu)自適應(yīng)調(diào)整算法[A];2007年全國第十一屆企業(yè)信息化與工業(yè)工程學(xué)術(shù)會議論文集[C];2007年
2 梁偉賢;;網(wǎng)絡(luò)搜索引擎發(fā)展現(xiàn)狀的探討[A];2007中國科協(xié)年會——通信與信息發(fā)展高層論壇論文集[C];2007年
3 徐羽瓊;李石堅(jiān);姚敏;;基于情境感知的個性化郵件服務(wù)[A];第四屆和諧人機(jī)環(huán)境聯(lián)合學(xué)術(shù)會議論文集[C];2008年
4 劉詠梅;盧鴻劍;杜美玲;;基于Multi-agent的個人電腦客戶定制服務(wù)推薦系統(tǒng)[A];2006中國控制與決策學(xué)術(shù)年會論文集[C];2006年
5 湯志偉;王菁;;面向公眾的電子政務(wù)個性化信息服務(wù)體系的構(gòu)建[A];中國信息經(jīng)濟(jì)學(xué)會2007年學(xué)術(shù)年會論文集[C];2007年
6 劉濤;王曉光;黃琨;;數(shù)字圖書館的發(fā)展及其技術(shù)概論[A];信息時代——科技情報研究學(xué)術(shù)論文集(第三輯)[C];2008年
7 趙立江;何欽銘;;聚類分析在個性化學(xué)習(xí)中的研究與應(yīng)用[A];NCIRCS2004第一屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集[C];2004年
8 柯慧燕;;基于粗糙集的遠(yuǎn)程教育個性化服務(wù)研究[A];第二屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議(NCIRCS-2005)論文集[C];2005年
9 宋巍;張宇;劉挺;李生;;基于檢索歷史上下文的個性化查詢重構(gòu)技術(shù)研究[A];第五屆全國信息檢索學(xué)術(shù)會議論文集[C];2009年
10 杜亞軍;裴崢;彭宏;徐揚(yáng);;基于不確定性推理的主題推薦方法[A];第二十屆全國數(shù)據(jù)庫學(xué)術(shù)會議論文集(研究報告篇)[C];2003年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 劉玉國;基于內(nèi)容的互聯(lián)網(wǎng)輿情信息挖掘關(guān)鍵技術(shù)研究[D];山東大學(xué);2011年
2 林甲灶;構(gòu)建個性化智能移動電子商務(wù)系統(tǒng)的關(guān)鍵技術(shù)與方法研究[D];蘭州大學(xué);2011年
3 張衛(wèi);基于XaaS的制造服務(wù)鏈形成與應(yīng)用研究[D];浙江大學(xué);2011年
4 朱振方;基于微粒群和遺傳優(yōu)化的文本過濾關(guān)鍵技術(shù)研究[D];山東師范大學(xué);2012年
5 朱征宇;Web資源組織與服務(wù)性能研究[D];重慶大學(xué);2003年
6 張曉剛;面向軟件過程改進(jìn)的知識管理技術(shù)研究[D];中國科學(xué)院研究生院(軟件研究所);2004年
7 陳福集;電子政務(wù)系統(tǒng)中面向公眾的信息集成化管理與個性化服務(wù)研究[D];合肥工業(yè)大學(xué);2004年
8 楊震;個性化信息獲取方法的研究[D];大連理工大學(xué);2004年
9 周娜;基于Web的制造業(yè)電子商務(wù)平臺關(guān)鍵技術(shù)的研究與應(yīng)用[D];南京航空航天大學(xué);2005年
10 趙野軍;橡膠擠出機(jī)智能CAD的技術(shù)和方法研究[D];北京化工大學(xué);2005年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 吳則則;支持動態(tài)演進(jìn)的用戶興趣模型挖掘方法研究[D];山東科技大學(xué);2010年
2 高兆梓;基于專利分析的競爭對手分類系統(tǒng)研究[D];山東科技大學(xué);2010年
3 蔡宏果;基于基因表達(dá)式編程的Web個性化推薦技術(shù)研究[D];廣西師范學(xué)院;2010年
4 劉建東;基于Web訪問信息挖掘的數(shù)字圖書館個性化服務(wù)研究[D];浙江理工大學(xué);2010年
5 許坤;基于本體的應(yīng)急信息管理系統(tǒng)的研究與設(shè)計[D];鄭州大學(xué);2010年
6 蔡宇虹;基于主題的元搜索引擎關(guān)鍵技術(shù)研究[D];哈爾濱工程大學(xué);2010年
7 劉文輝;基于鏈接結(jié)構(gòu)的網(wǎng)頁排序算法研究[D];哈爾濱工程大學(xué);2010年
8 何瑩杰;個性化圖書信息服務(wù)技術(shù)研究[D];哈爾濱工程大學(xué);2010年
9 汪永偉;搜索引擎中網(wǎng)頁排序算法的研究與實(shí)現(xiàn)[D];哈爾濱工程大學(xué);2010年
10 孟慶海;基于社會書簽的個性化查詢詞擴(kuò)展技術(shù)研究[D];哈爾濱工程大學(xué);2010年
【二級參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 盧效峰,鄭權(quán);基于用戶行為分析的搜索引擎模型[J];北方工業(yè)大學(xué)學(xué)報;2004年03期
2 李育嫦;搜索引擎中完善關(guān)鍵詞檢索功能的探索[J];圖書與情報;2003年05期
3 丁璇,侯漢清,章成志;中文網(wǎng)頁標(biāo)引源主題表達(dá)能力的調(diào)查統(tǒng)計[J];大學(xué)圖書館學(xué)報;2002年06期
4 羅敏,王麗娜,張煥國;基于無監(jiān)督聚類的入侵檢測方法[J];電子學(xué)報;2003年11期
5 應(yīng)曉敏,劉明,竇文華;一種面向個性化服務(wù)的無需反例集的用戶建模方法[J];國防科技大學(xué)學(xué)報;2002年03期
6 陶蕾;一種智能型的信息檢索方法:隱含語義索引法[J];情報理論與實(shí)踐;2004年03期
7 陶劍文;;一種自動獲取用戶興趣的個性化搜索算法[J];情報理論與實(shí)踐;2007年04期
8 陳海龍;搜索引擎的評價標(biāo)準(zhǔn)及方法研究[J];情報雜志;2001年09期
9 袁文莉;中文搜索引擎分類檢索工具發(fā)展的大趨勢[J];情報雜志;2004年05期
10 馮翱,劉斌,盧增祥,路海明,王普,李衍達(dá);Open Bookmark——基于Agent的信息過濾系統(tǒng)[J];清華大學(xué)學(xué)報(自然科學(xué)版);2001年03期
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前2條
1 曹渝昆;基于RDF的個性化服務(wù)模型[D];重慶大學(xué);2002年
2 劉俊暉;企業(yè)內(nèi)部個性化搜索系統(tǒng)的研究與實(shí)現(xiàn)[D];復(fù)旦大學(xué);2008年
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 李俊,張靈玲,周文輝,潘金貴;一個智能用戶接口Agent設(shè)計與實(shí)現(xiàn)[J];軟件學(xué)報;1999年08期
2 歐潔,林守勛,李錦濤;數(shù)字圖書館中的個性化信息檢索[J];微電子學(xué)與計算機(jī);2002年07期
3 王志軍,于超;基于隱式反饋的個人信息檢索技術(shù)及實(shí)現(xiàn)[J];計算機(jī)工程;2003年06期
4 龔婕,姜軍,張桂林;基于奇異值分解和支持向量機(jī)的人臉檢測[J];計算機(jī)與數(shù)字工程;2003年01期
5 徐科;崔志明;;基于搜索歷史的用戶興趣模型的研究[J];計算機(jī)技術(shù)與發(fā)展;2006年05期
6 許春漫;;數(shù)字圖書館個性化信息檢索模型研究[J];現(xiàn)代圖書情報技術(shù);2006年03期
7 喬曉明;劉有耀;;基于粗糙集理論和FCM的圖像聚類方法[J];微計算機(jī)信息;2007年12期
8 鄭運(yùn)剛;馬建國;;基于分類的用戶興趣漂移模型[J];情報雜志;2008年01期
9 許天亮;王義峰;曾平;;個性化元搜索引擎技術(shù)研究[J];電子科技;2008年01期
10 張東娜;劉博;;三種屬性約簡方法的比較研究[J];電腦知識與技術(shù);2008年04期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 曾建國;陳光夢;;基于張量分解的動態(tài)紋理合成技術(shù)研究[A];中國儀器儀表學(xué)會第九屆青年學(xué)術(shù)會議論文集[C];2007年
2 倪蓉蓉;阮秋琦;;一種新的數(shù)字水印算法的研究[A];第十屆全國信號處理學(xué)術(shù)年會(CCSP-2001)論文集[C];2001年
3 王修運(yùn);柏森;李秀;劉陽;粘永健;;基于圖像直方圖不變矩和奇異值分解的圖像認(rèn)證方法[A];第三屆全國數(shù)字成像技術(shù)及相關(guān)材料發(fā)展與應(yīng)用學(xué)術(shù)研討會論文摘要集[C];2004年
4 徐慧英;朱信忠;趙建民;殷建平;;基于分塊奇異值分解的數(shù)字水印算法及實(shí)現(xiàn)[A];2005年全國理論計算機(jī)科學(xué)學(xué)術(shù)年會論文集[C];2005年
5 李蓓;金聰;;基于奇異值分解的數(shù)字水印算法[A];第一屆建立和諧人機(jī)環(huán)境聯(lián)合學(xué)術(shù)會議(HHME2005)論文集[C];2005年
6 聶秀山;關(guān)華勇;關(guān)東東;;基于奇異值分解的三維網(wǎng)格數(shù)字水印算法[A];第十二屆全國圖象圖形學(xué)學(xué)術(shù)會議論文集[C];2005年
7 聶秀山;矯立峰;錢建磊;劉杰英;;一種基于SVD的三維模型數(shù)字水印算法[A];2008'中國信息技術(shù)與應(yīng)用學(xué)術(shù)論壇論文集(一)[C];2008年
8 杜先峰;張愛輝;任震林;丁文霞;;一種嵌入位置隨機(jī)變化的數(shù)字視頻可見水印算法[A];2008年中國高校通信類院系學(xué)術(shù)研討會論文集(下冊)[C];2009年
9 劉俊景;蔣華;;一種基于離散余弦變換與奇異值分解的數(shù)字圖像水印算法[A];2007年全國開放式分布與并行計算機(jī)學(xué)術(shù)會議論文集(下冊)[C];2007年
10 余香敏;焦占亞;;一種基于DWT與SVD的數(shù)字圖像水印算法[A];2008年全國開放式分布與并行計算機(jī)學(xué)術(shù)會議論文集(下冊)[C];2008年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 梁毅雄;基于子空間分析的人臉特征提取及識別研究[D];重慶大學(xué);2005年
2 胡蓉;增量機(jī)器學(xué)習(xí)算法研究[D];南京理工大學(xué);2013年
3 劉小軍;人臉識別技術(shù)研究[D];中國科學(xué)院電子學(xué)研究所;2001年
4 梁棟;基于多視圖的參數(shù)估計與形狀重構(gòu)[D];安徽大學(xué);2002年
5 呂英華;信息隱藏相關(guān)方法及應(yīng)用的研究[D];吉林大學(xué);2007年
6 劉艷艷;子空間特征提取方法及其在人臉識別中的應(yīng)用[D];大連理工大學(xué);2008年
7 荊永君;教育資源分布式配送與調(diào)度算法研究[D];東北師范大學(xué);2008年
8 王好賢;數(shù)字視頻水印嵌入和抽取算法研究[D];哈爾濱工業(yè)大學(xué);2008年
9 陸銘;WEB2.0網(wǎng)絡(luò)熱點(diǎn)發(fā)現(xiàn)與個性化檢索研究[D];中國科學(xué)技術(shù)大學(xué);2012年
10 顏端武;面向知識服務(wù)的智能推薦系統(tǒng)研究[D];南京理工大學(xué);2007年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 孫鑫;元搜索引擎結(jié)果個性化排序的研究與實(shí)現(xiàn)[D];中國石油大學(xué);2008年
2 崔頃頃;基于個性化搜索的系統(tǒng)研究與設(shè)計[D];北京交通大學(xué);2011年
3 魏雪娟;基于傅立葉變換技術(shù)的人臉識別系統(tǒng)[D];四川大學(xué);2005年
4 龍開文;基于模板匹配的人臉檢測[D];四川大學(xué);2005年
5 李婭;個性化智能元搜索引擎模型研究[D];西南大學(xué);2006年
6 廖文彬;基于矩陣奇異值分解的圖像壓縮方法研究[D];成都理工大學(xué);2007年
7 范河淋;分布式文檔管理系統(tǒng)的研究和實(shí)現(xiàn)[D];西北大學(xué);2008年
8 王炫盛;基于Lanczos雙對角化過程的非負(fù)矩陣快速分解的初始化方法[D];廈門大學(xué);2009年
9 蘇盛曲;圖像信息隱藏中的數(shù)字水印技術(shù)研究[D];南昌大學(xué);2010年
10 許國梁;應(yīng)用于數(shù)字視頻監(jiān)控系統(tǒng)的人臉識別技術(shù)[D];中國人民解放軍國防科學(xué)技術(shù)大學(xué);2002年
,本文編號:562366
本文鏈接:http://www.sikaile.net/kejilunwen/sousuoyinqinglunwen/562366.html