個性化推薦技術(shù)研究及其在數(shù)字圖書館中應(yīng)用
【學(xué)位授予單位】:浙江大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2007
【分類號】:TP393.09;G250.76
【圖文】:
CI斷slfi“脈助伙山翻圖3一 2Web使用挖掘的大致體系結(jié)構(gòu)圖33W七b日志挖掘的數(shù)據(jù)采集數(shù)據(jù)可靠性是影響網(wǎng)絡(luò)個性化服務(wù)質(zhì)量的重要因素,準(zhǔn)確的用戶數(shù)據(jù)對識別用戶、發(fā)現(xiàn)用戶的興趣有著重要的作用。數(shù)據(jù)采集階段就是根據(jù)系統(tǒng)要求,確定從何處采集用戶的使用數(shù)據(jù),識別出它們的內(nèi)容和結(jié)構(gòu)。Web服務(wù)器、客戶端以及代理服務(wù)器是目前三個主要數(shù)據(jù)來源。3.3.1服務(wù)器端的數(shù)據(jù)服務(wù)器端的數(shù)據(jù)主要包括:Web日志文件、Ccokies和用戶顯示數(shù)據(jù)輸入。 (1)Web日志文件:web日志文件是用戶瀏覽web服務(wù)器時記錄下來用戶訪lb]網(wǎng)站的情況,被記錄在Web服務(wù)器中。萬維網(wǎng)協(xié)會 (worldwidewebConsortium)組織規(guī)定了服務(wù)器日志的兩種格式 :cLF(common109format)和EcLF (extendedeommon109format)。(2)cookies:Cookies用來追蹤用戶瀏覽過的頁面,通過Cookies在客戶機(jī)器上儲存一個信息,當(dāng)用戶下次訪問該網(wǎng)站時,這個信息會送回到服務(wù)器,從而識
5.3數(shù)據(jù)預(yù)處理過程的實現(xiàn)數(shù)據(jù)預(yù)處理技術(shù)在整個web個性化系統(tǒng)中的作用至關(guān)重要。數(shù)據(jù)預(yù)處理主要包括數(shù)據(jù)清洗,數(shù)據(jù)過濾,用戶識別,用戶會話識別等過程。具體的流程如圖5一4所示:
例如,一個序列用戶會話為<a,b,c,d,c,b>,改為 PageOccurrence則變成<(a,1),(b,1),(e,1),(d,l),(e,2),(d,2)>·在CADAL的后臺處理程序中,創(chuàng)建用戶的會話文件的界面如圖5一5所示:地....價招陽娜用票熱日衡脫栩CF勝B【ion:腳Maximal分 ssionDur減云onOMax誣mal即ge切e.Time,『.5。。.d:}如嶺咖L::ie’,’.’..’.’.:.’’.’.’’’..’=.’’.’j匹亞口二竺一)圖5一5創(chuàng)建用戶會話文件的界面在此界面中,用戶可以選擇兩種不同產(chǎn)生用戶會話的方式:即最大會話時間間隔和用戶訪問的連續(xù)頁面之間的最大時間間隔。此外,用戶可以根據(jù)系統(tǒng)提供的格式設(shè)置最大時間間隔閥值。在程序中,產(chǎn)生用戶會話的是CreateVisitorssessions類,該類通過比較當(dāng)前的sessinn和分析的日志記錄的時間戳,來決定是否需要產(chǎn)生新的session。圖5一6給出了從web日志到用戶會話的產(chǎn)
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 華山;;世界數(shù)字圖書館探寶[J];黃金時代(學(xué)生族);2009年09期
2 ;新研究:圖書館迎來數(shù)字圖書館的同時面臨預(yù)算約束[J];現(xiàn)代圖書情報技術(shù);2011年05期
3 傅晨琦;葉輝;;杭州數(shù)字圖書館率先實現(xiàn)網(wǎng)站、手機(jī)、電視“三網(wǎng)融合”[J];公共圖書館;2011年01期
4 宗和;;全國圖書館藏書一“網(wǎng)”可查[J];公共圖書館;2011年01期
5 李連會;;淺論傳統(tǒng)圖書館的數(shù)字化發(fā)展趨勢[J];中國科教創(chuàng)新導(dǎo)刊;2011年17期
6 ;時事[J];黃金時代(學(xué)生族);2009年06期
7 員貴云;;中小學(xué)數(shù)字圖書館在教學(xué)中的應(yīng)用案例[J];中國現(xiàn)代教育裝備;2011年16期
8 張夥夥;;云計算系統(tǒng)在數(shù)字圖書館中的應(yīng)用[J];信息技術(shù);2011年08期
9 董文敏;;現(xiàn)代公共圖書館的數(shù)字資源建設(shè)探討[J];佳木斯大學(xué)社會科學(xué)學(xué)報;2011年04期
10 ;IEEE與Access Innovations合作對Xplore數(shù)字圖書館進(jìn)行重新索引[J];現(xiàn)代圖書情報技術(shù);2011年05期
相關(guān)會議論文 前10條
1 劉穎;;論數(shù)字圖書館的信息構(gòu)建[A];華北地區(qū)高校圖協(xié)第二十四屆學(xué)術(shù)年會論文(文章)匯編[C];2010年
2 郭啟智;;關(guān)于數(shù)字圖書館有關(guān)問題的探討[A];山西省科學(xué)技術(shù)情報學(xué)會學(xué)術(shù)年會論文集[C];2004年
3 符翠;;數(shù)字圖書館建設(shè)探討[A];新環(huán)境下圖書館建設(shè)與發(fā)展——第六屆中國社區(qū)和鄉(xiāng)鎮(zhèn)圖書館發(fā)展戰(zhàn)略研討會征文集(下冊)[C];2007年
4 王愛華;張銘;陳捷;楊冬青;唐世渭;;基于形式本體的數(shù)字圖書館內(nèi)容元數(shù)據(jù)的創(chuàng)建[A];第十八屆全國數(shù)據(jù)庫學(xué)術(shù)會議論文集(技術(shù)報告篇)[C];2001年
5 高翔;;淺談網(wǎng)站模式下的數(shù)字圖書館資源建設(shè)[A];華北地區(qū)高校圖協(xié)第二十四屆學(xué)術(shù)年會論文(文章)匯編[C];2010年
6 喻浩;潘薇;;數(shù)字圖書館支撐技術(shù)及其發(fā)展[A];數(shù)字圖書館資源建設(shè)與發(fā)展學(xué)術(shù)研討會暨中國農(nóng)學(xué)會農(nóng)業(yè)圖書館分會理事工作會議會議資料[C];2007年
7 潘淑春;喻浩;;數(shù)字圖書館建設(shè)及其運(yùn)行模式研究[A];數(shù)字圖書館資源建設(shè)與發(fā)展學(xué)術(shù)研討會暨中國農(nóng)學(xué)會農(nóng)業(yè)圖書館分會理事工作會議會議資料[C];2007年
8 林英;;談?wù)勚袊鴶?shù)字圖書館的研究、開發(fā)與建設(shè)[A];福建省圖書館學(xué)會2002年學(xué)術(shù)年會論文集[C];2002年
9 延宏;;數(shù)字圖書館:服務(wù)如何個性化[A];新觀點(diǎn)新學(xué)說學(xué)術(shù)沙龍文集24:數(shù)字時代圖書館的創(chuàng)新與共享[C];2008年
10 來雪玲;;數(shù)字圖書館的定位與對策[A];圖書館與西部大開發(fā)[C];2002年
相關(guān)重要報紙文章 前10條
1 吳小寧(作者單位:蚌埠市圖書館);數(shù)字圖書館淺談[N];安徽日報;2000年
2 ;什么是數(shù)字圖書館[N];中國婦女報;2001年
3 靳紅;世紀(jì)超星參與建設(shè)數(shù)字圖書館[N];人民公安報;2000年
4 楊健;全球最大中文數(shù)字圖書館開館[N];人民日報;2003年
5 劉立玲;掃描儀為數(shù)字圖書館奠基[N];人民郵電;2001年
6 靜文;這個數(shù)字圖書館好“聽”[N];中國新聞出版報;2004年
7 本報記者 延宏;數(shù)字圖書館:服務(wù)如何個性化[N];科技日報;2008年
8 本報記者 洪黎明;數(shù)字出版與數(shù)字圖書館的互動[N];人民郵電;2008年
9 記者 姚立;聯(lián)合國教科文組織正式推出“世界數(shù)字圖書館”[N];光明日報;2009年
10 關(guān)月;印度建傳統(tǒng)知識數(shù)字圖書館[N];健康報;2009年
相關(guān)博士學(xué)位論文 前10條
1 于曉燕;基于網(wǎng)格的數(shù)字圖書館模式構(gòu)建研究[D];南開大學(xué);2010年
2 周麗霞;數(shù)字圖書館版權(quán)獲取研究[D];吉林大學(xué);2011年
3 孫坦;數(shù)字圖書館理論與發(fā)展模式研究[D];中國科學(xué)院文獻(xiàn)情報中心;2000年
4 關(guān)欣;數(shù)字圖書館知識管理研究[D];吉林大學(xué);2010年
5 許增福;DL環(huán)境下的信息資源管理及知識發(fā)現(xiàn)研究[D];哈爾濱工程大學(xué);2005年
6 杜文華;本體的構(gòu)建及其在數(shù)字圖書館中的應(yīng)用研究[D];武漢大學(xué);2005年
7 孫建濤;Web挖掘中的降維和分類方法研究[D];清華大學(xué);2005年
8 卓文飛;中國農(nóng)業(yè)數(shù)字圖書館信息集成服務(wù)系統(tǒng)研究[D];中國農(nóng)業(yè)科學(xué)院;2008年
9 韓毅;語義網(wǎng)格環(huán)境下數(shù)字圖書館知識組織策略與應(yīng)用研究[D];吉林大學(xué);2008年
10 牟冬梅;數(shù)字圖書館知識組織語義互聯(lián)策略及其應(yīng)用研究[D];吉林大學(xué);2009年
相關(guān)碩士學(xué)位論文 前10條
1 秦鳳蕊;個性化推薦技術(shù)研究及在數(shù)字圖書館中的應(yīng)用[D];長春理工大學(xué);2010年
2 王春賀;個性化推薦技術(shù)研究及其在數(shù)字圖書館中應(yīng)用[D];浙江大學(xué);2007年
3 羅宏;數(shù)字圖書館著作權(quán)風(fēng)險規(guī)避研究[D];四川大學(xué);2004年
4 羅龍艷;數(shù)字圖書館資源主題信息門戶的設(shè)計與實現(xiàn)研究[D];四川大學(xué);2004年
5 董正偉;Google數(shù)字圖書館所引發(fā)的著作權(quán)問題思考[D];中國政法大學(xué);2011年
6 田艷芳;數(shù)字圖書館中數(shù)據(jù)預(yù)處理子系統(tǒng)的設(shè)計與實現(xiàn)[D];國防科學(xué)技術(shù)大學(xué);2001年
7 戴洪霞;數(shù)字圖書館信息資源建設(shè)研究[D];東北師范大學(xué);2002年
8 闞忠良;數(shù)字圖書館中基于結(jié)構(gòu)和內(nèi)容的文本信息檢索技術(shù)的研究[D];黑龍江大學(xué);2002年
9 賀玲玲;數(shù)字圖書館運(yùn)行機(jī)制與管理模式研究[D];國防科學(xué)技術(shù)大學(xué);2003年
10 曹樹新;圖書館自動化管理信息系統(tǒng)[D];大連理工大學(xué);2005年
本文編號:2762863
本文鏈接:http://www.sikaile.net/tushudanganlunwen/2762863.html