天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 社科論文 > 圖書檔案論文 >

個性化推薦技術(shù)研究及其在數(shù)字圖書館中應(yīng)用

發(fā)布時間:2020-07-19 19:29
【摘要】:近年來,數(shù)字存儲技術(shù)的飛速發(fā)展使得幾乎所有的事物都可數(shù)字化。特別地,以圖書館資源數(shù)字化為目的的數(shù)字圖書館(Digital Library)建設(shè)在各國迅猛發(fā)展,其相關(guān)研究工作也掀起了一股熱潮。 在數(shù)字圖書館的眾多研究方向中,數(shù)字圖書館中的個性化服務(wù)已經(jīng)成為一種趨勢,其最大優(yōu)點(diǎn)就是能為不同背景、不同目的的用戶提供滿足個性化需求的數(shù)字資源。通過對Web環(huán)境下的用戶數(shù)據(jù)和用戶日志進(jìn)行深入的統(tǒng)計與分析,可以發(fā)現(xiàn)用戶的興趣所在,挖掘隱藏在這些數(shù)據(jù)背后的更重要的用戶興趣模式信息以及關(guān)于這些數(shù)據(jù)整體特征的描述,并預(yù)測其發(fā)展趨勢,進(jìn)而在恰當(dāng)?shù)臅r間方便快捷地為不同的用戶提供恰當(dāng)?shù)摹耙粚σ弧钡膫性化信息服務(wù)。個性化服務(wù)不僅會改善數(shù)字圖書館的Web站點(diǎn)設(shè)計,而且對數(shù)字圖書館整體的服務(wù)決策過程具有重要的意義。 本文首先介紹了國內(nèi)外數(shù)字圖書館及其個性化技術(shù)的研究現(xiàn)狀以及高等學(xué)校中英文圖書數(shù)字化合作項目(CADAL)的背景和進(jìn)展;接著本文闡述了Web挖掘技術(shù)的基本原理,并在對Web挖掘過程深入分析的基礎(chǔ)上提出了一種新的數(shù)據(jù)結(jié)構(gòu)--序列模式樹,并給出其構(gòu)建算法。基于構(gòu)建好的序列模式樹數(shù)據(jù)結(jié)構(gòu),本文提出了一種頻繁序列模式挖掘的算法,并將其應(yīng)用在數(shù)字圖書館個性化服務(wù)中。最后,本文給出了基于序列模式樹和頻繁序列模式挖掘算法的CADAL個性化服務(wù)系統(tǒng)的具體實現(xiàn)。
【學(xué)位授予單位】:浙江大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2007
【分類號】:TP393.09;G250.76
【圖文】:

體系結(jié)構(gòu)圖,體系結(jié)構(gòu),日志文件,網(wǎng)站


CI斷slfi“脈助伙山翻圖3一 2Web使用挖掘的大致體系結(jié)構(gòu)圖33W七b日志挖掘的數(shù)據(jù)采集數(shù)據(jù)可靠性是影響網(wǎng)絡(luò)個性化服務(wù)質(zhì)量的重要因素,準(zhǔn)確的用戶數(shù)據(jù)對識別用戶、發(fā)現(xiàn)用戶的興趣有著重要的作用。數(shù)據(jù)采集階段就是根據(jù)系統(tǒng)要求,確定從何處采集用戶的使用數(shù)據(jù),識別出它們的內(nèi)容和結(jié)構(gòu)。Web服務(wù)器、客戶端以及代理服務(wù)器是目前三個主要數(shù)據(jù)來源。3.3.1服務(wù)器端的數(shù)據(jù)服務(wù)器端的數(shù)據(jù)主要包括:Web日志文件、Ccokies和用戶顯示數(shù)據(jù)輸入。 (1)Web日志文件:web日志文件是用戶瀏覽web服務(wù)器時記錄下來用戶訪lb]網(wǎng)站的情況,被記錄在Web服務(wù)器中。萬維網(wǎng)協(xié)會 (worldwidewebConsortium)組織規(guī)定了服務(wù)器日志的兩種格式 :cLF(common109format)和EcLF (extendedeommon109format)。(2)cookies:Cookies用來追蹤用戶瀏覽過的頁面,通過Cookies在客戶機(jī)器上儲存一個信息,當(dāng)用戶下次訪問該網(wǎng)站時,這個信息會送回到服務(wù)器,從而識

界面圖,日志文件,界面圖,數(shù)據(jù)預(yù)處理


5.3數(shù)據(jù)預(yù)處理過程的實現(xiàn)數(shù)據(jù)預(yù)處理技術(shù)在整個web個性化系統(tǒng)中的作用至關(guān)重要。數(shù)據(jù)預(yù)處理主要包括數(shù)據(jù)清洗,數(shù)據(jù)過濾,用戶識別,用戶會話識別等過程。具體的流程如圖5一4所示:

界面圖,界面,格式設(shè)置,后臺處理


例如,一個序列用戶會話為<a,b,c,d,c,b>,改為 PageOccurrence則變成<(a,1),(b,1),(e,1),(d,l),(e,2),(d,2)>·在CADAL的后臺處理程序中,創(chuàng)建用戶的會話文件的界面如圖5一5所示:地....價招陽娜用票熱日衡脫栩CF勝B【ion:腳Maximal分 ssionDur減云onOMax誣mal即ge切e.Time,『.5。。.d:}如嶺咖L::ie’,’.’..’.’.:.’’.’.’’’..’=.’’.’j匹亞口二竺一)圖5一5創(chuàng)建用戶會話文件的界面在此界面中,用戶可以選擇兩種不同產(chǎn)生用戶會話的方式:即最大會話時間間隔和用戶訪問的連續(xù)頁面之間的最大時間間隔。此外,用戶可以根據(jù)系統(tǒng)提供的格式設(shè)置最大時間間隔閥值。在程序中,產(chǎn)生用戶會話的是CreateVisitorssessions類,該類通過比較當(dāng)前的sessinn和分析的日志記錄的時間戳,來決定是否需要產(chǎn)生新的session。圖5一6給出了從web日志到用戶會話的產(chǎn)

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 華山;;世界數(shù)字圖書館探寶[J];黃金時代(學(xué)生族);2009年09期

2 ;新研究:圖書館迎來數(shù)字圖書館的同時面臨預(yù)算約束[J];現(xiàn)代圖書情報技術(shù);2011年05期

3 傅晨琦;葉輝;;杭州數(shù)字圖書館率先實現(xiàn)網(wǎng)站、手機(jī)、電視“三網(wǎng)融合”[J];公共圖書館;2011年01期

4 宗和;;全國圖書館藏書一“網(wǎng)”可查[J];公共圖書館;2011年01期

5 李連會;;淺論傳統(tǒng)圖書館的數(shù)字化發(fā)展趨勢[J];中國科教創(chuàng)新導(dǎo)刊;2011年17期

6 ;時事[J];黃金時代(學(xué)生族);2009年06期

7 員貴云;;中小學(xué)數(shù)字圖書館在教學(xué)中的應(yīng)用案例[J];中國現(xiàn)代教育裝備;2011年16期

8 張夥夥;;云計算系統(tǒng)在數(shù)字圖書館中的應(yīng)用[J];信息技術(shù);2011年08期

9 董文敏;;現(xiàn)代公共圖書館的數(shù)字資源建設(shè)探討[J];佳木斯大學(xué)社會科學(xué)學(xué)報;2011年04期

10 ;IEEE與Access Innovations合作對Xplore數(shù)字圖書館進(jìn)行重新索引[J];現(xiàn)代圖書情報技術(shù);2011年05期

相關(guān)會議論文 前10條

1 劉穎;;論數(shù)字圖書館的信息構(gòu)建[A];華北地區(qū)高校圖協(xié)第二十四屆學(xué)術(shù)年會論文(文章)匯編[C];2010年

2 郭啟智;;關(guān)于數(shù)字圖書館有關(guān)問題的探討[A];山西省科學(xué)技術(shù)情報學(xué)會學(xué)術(shù)年會論文集[C];2004年

3 符翠;;數(shù)字圖書館建設(shè)探討[A];新環(huán)境下圖書館建設(shè)與發(fā)展——第六屆中國社區(qū)和鄉(xiāng)鎮(zhèn)圖書館發(fā)展戰(zhàn)略研討會征文集(下冊)[C];2007年

4 王愛華;張銘;陳捷;楊冬青;唐世渭;;基于形式本體的數(shù)字圖書館內(nèi)容元數(shù)據(jù)的創(chuàng)建[A];第十八屆全國數(shù)據(jù)庫學(xué)術(shù)會議論文集(技術(shù)報告篇)[C];2001年

5 高翔;;淺談網(wǎng)站模式下的數(shù)字圖書館資源建設(shè)[A];華北地區(qū)高校圖協(xié)第二十四屆學(xué)術(shù)年會論文(文章)匯編[C];2010年

6 喻浩;潘薇;;數(shù)字圖書館支撐技術(shù)及其發(fā)展[A];數(shù)字圖書館資源建設(shè)與發(fā)展學(xué)術(shù)研討會暨中國農(nóng)學(xué)會農(nóng)業(yè)圖書館分會理事工作會議會議資料[C];2007年

7 潘淑春;喻浩;;數(shù)字圖書館建設(shè)及其運(yùn)行模式研究[A];數(shù)字圖書館資源建設(shè)與發(fā)展學(xué)術(shù)研討會暨中國農(nóng)學(xué)會農(nóng)業(yè)圖書館分會理事工作會議會議資料[C];2007年

8 林英;;談?wù)勚袊鴶?shù)字圖書館的研究、開發(fā)與建設(shè)[A];福建省圖書館學(xué)會2002年學(xué)術(shù)年會論文集[C];2002年

9 延宏;;數(shù)字圖書館:服務(wù)如何個性化[A];新觀點(diǎn)新學(xué)說學(xué)術(shù)沙龍文集24:數(shù)字時代圖書館的創(chuàng)新與共享[C];2008年

10 來雪玲;;數(shù)字圖書館的定位與對策[A];圖書館與西部大開發(fā)[C];2002年

相關(guān)重要報紙文章 前10條

1 吳小寧(作者單位:蚌埠市圖書館);數(shù)字圖書館淺談[N];安徽日報;2000年

2 ;什么是數(shù)字圖書館[N];中國婦女報;2001年

3 靳紅;世紀(jì)超星參與建設(shè)數(shù)字圖書館[N];人民公安報;2000年

4 楊健;全球最大中文數(shù)字圖書館開館[N];人民日報;2003年

5 劉立玲;掃描儀為數(shù)字圖書館奠基[N];人民郵電;2001年

6 靜文;這個數(shù)字圖書館好“聽”[N];中國新聞出版報;2004年

7 本報記者 延宏;數(shù)字圖書館:服務(wù)如何個性化[N];科技日報;2008年

8 本報記者 洪黎明;數(shù)字出版與數(shù)字圖書館的互動[N];人民郵電;2008年

9 記者 姚立;聯(lián)合國教科文組織正式推出“世界數(shù)字圖書館”[N];光明日報;2009年

10 關(guān)月;印度建傳統(tǒng)知識數(shù)字圖書館[N];健康報;2009年

相關(guān)博士學(xué)位論文 前10條

1 于曉燕;基于網(wǎng)格的數(shù)字圖書館模式構(gòu)建研究[D];南開大學(xué);2010年

2 周麗霞;數(shù)字圖書館版權(quán)獲取研究[D];吉林大學(xué);2011年

3 孫坦;數(shù)字圖書館理論與發(fā)展模式研究[D];中國科學(xué)院文獻(xiàn)情報中心;2000年

4 關(guān)欣;數(shù)字圖書館知識管理研究[D];吉林大學(xué);2010年

5 許增福;DL環(huán)境下的信息資源管理及知識發(fā)現(xiàn)研究[D];哈爾濱工程大學(xué);2005年

6 杜文華;本體的構(gòu)建及其在數(shù)字圖書館中的應(yīng)用研究[D];武漢大學(xué);2005年

7 孫建濤;Web挖掘中的降維和分類方法研究[D];清華大學(xué);2005年

8 卓文飛;中國農(nóng)業(yè)數(shù)字圖書館信息集成服務(wù)系統(tǒng)研究[D];中國農(nóng)業(yè)科學(xué)院;2008年

9 韓毅;語義網(wǎng)格環(huán)境下數(shù)字圖書館知識組織策略與應(yīng)用研究[D];吉林大學(xué);2008年

10 牟冬梅;數(shù)字圖書館知識組織語義互聯(lián)策略及其應(yīng)用研究[D];吉林大學(xué);2009年

相關(guān)碩士學(xué)位論文 前10條

1 秦鳳蕊;個性化推薦技術(shù)研究及在數(shù)字圖書館中的應(yīng)用[D];長春理工大學(xué);2010年

2 王春賀;個性化推薦技術(shù)研究及其在數(shù)字圖書館中應(yīng)用[D];浙江大學(xué);2007年

3 羅宏;數(shù)字圖書館著作權(quán)風(fēng)險規(guī)避研究[D];四川大學(xué);2004年

4 羅龍艷;數(shù)字圖書館資源主題信息門戶的設(shè)計與實現(xiàn)研究[D];四川大學(xué);2004年

5 董正偉;Google數(shù)字圖書館所引發(fā)的著作權(quán)問題思考[D];中國政法大學(xué);2011年

6 田艷芳;數(shù)字圖書館中數(shù)據(jù)預(yù)處理子系統(tǒng)的設(shè)計與實現(xiàn)[D];國防科學(xué)技術(shù)大學(xué);2001年

7 戴洪霞;數(shù)字圖書館信息資源建設(shè)研究[D];東北師范大學(xué);2002年

8 闞忠良;數(shù)字圖書館中基于結(jié)構(gòu)和內(nèi)容的文本信息檢索技術(shù)的研究[D];黑龍江大學(xué);2002年

9 賀玲玲;數(shù)字圖書館運(yùn)行機(jī)制與管理模式研究[D];國防科學(xué)技術(shù)大學(xué);2003年

10 曹樹新;圖書館自動化管理信息系統(tǒng)[D];大連理工大學(xué);2005年



本文編號:2762863

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/tushudanganlunwen/2762863.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶de87b***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com