圖書信息的改進艾普萊數(shù)據(jù)挖掘方法研究與實現(xiàn)
發(fā)布時間:2021-04-18 07:58
隨著電子圖書館在世界范圍內(nèi)大行其道,它已經(jīng)成為人們從圖書館獲取知識信息的一種主要手段。從其發(fā)展速度來看,電子圖書館在相當程度取代紙質(zhì)圖書館,已經(jīng)成為難以遏制的必然發(fā)展趨勢。但這并不是說電子圖書館就沒有任何問題,其中存儲的海量信息,就給用戶如何在短時間內(nèi)搜索到自己的適用資源增添了不少麻煩。為了有效解決這一問題,人們在電子圖書館信息管理系統(tǒng)的設計過程中,開始關注數(shù)據(jù)挖掘算法的設計。本文以數(shù)據(jù)挖掘算法為基礎,設計了圖書館信息系統(tǒng)。首先,針對電子圖書館中數(shù)據(jù)挖掘前的數(shù)據(jù)預處理工作進行了相關方法的設計,主要是依托于K-Means均值聚類方法的設計。之后,對電子圖書館中兩類最重要的數(shù)據(jù)信息,用戶信息和圖書信息進行了聚類分析,并進行了相關驗證性實驗。其次,對數(shù)據(jù)挖掘領域中的艾普萊算法進行了詳細的分析,包括方法的操作過程以及其中存在的問題。針對其主要問題進行改進,提出了改進艾普萊方法,在改進艾普萊方法中,通過配置計數(shù)和地址集合設定,大大降低了剪枝處理的難度,提升了算法在圖書館系統(tǒng)中信息挖掘的效率。最后,在前面的聚類分析和數(shù)據(jù)挖掘方法設計的基礎上,對圖書館信息系統(tǒng)進行詳細的設計并完成聚類分析和數(shù)據(jù)挖掘的...
【文章來源】:哈爾濱理工大學黑龍江省
【文章頁數(shù)】:54 頁
【學位級別】:碩士
【部分圖文】:
用戶信息的聚類分析流程設計
圖 2-2 用戶信息相關的三類卡片據(jù)之前選定的能夠表征用戶特點的下載頻次進行分類,可以的用戶分類三個類別,超頻率使用型、中頻率使用型、低頻過對 100 條用戶信息的梳理,使用電子圖書館的三個類別的用致如下:表 2-1 電子圖書館用戶三個類別的聚類分析結果類別 記錄 年均下載頻次 總平均下率使用型 256 15 4率使用型 542 31 13率使用型 202 62 26分用戶的聚類分析結果如表 2-2 所示。表 2-2 電子圖書館的部分用戶的聚類分析結果號 姓名 年均下載頻次 總均下載頻次 0309 韋紀州 9 41 低頻0155 宋洋 32 122 中頻
哈爾濱理工大學工程碩士學位論文0711 吳兵兵 59 258 超頻率0326 張雪林 32 108 中頻率0608 肖強 11 51 低頻率0326 沈鵬飛 59 277 超頻率0107 張亞為 42 125 中頻率0229 李翔 8 44 低頻率圖書信息的 K-Means 聚類子圖書館的信息管理系統(tǒng)中,除了用戶信息以外,圖書信息在千差萬別的海量電子圖書資源中,哪些電子圖書更受用戶的響到電子圖書館的后期運營和維護。所以,一類圖書的被下載反應該書是不是用戶喜愛的熱點圖書的關鍵。在本文電子圖書設計當中,與圖書信息相關的三類卡片的設計結果,如圖 2-3
【參考文獻】:
期刊論文
[1]對數(shù)據(jù)流頻繁項集挖掘算法WSW-Imp的改進[J]. 王曉霞,王治和. 計算機工程與應用. 2013(08)
[2]數(shù)據(jù)挖掘取樣方法研究[J]. 胡文瑜,孫志揮,吳英杰. 計算機研究與發(fā)展. 2011(01)
[3]我國公共圖書館服務體系建設:治理模式研究[J]. 梁欣. 中國圖書館學報. 2009(06)
[4]從知識運動的角度認識圖書館[J]. 周慧. 中國圖書館學報. 2009(06)
[5]解決數(shù)據(jù)樣本不平衡性的頻繁子圖挖掘算法[J]. 謝玓,尚學群,王淼,張延園. 計算機工程與應用. 2008(36)
[6]WEB使用挖掘研究[J]. 黃浩,王建軍. 計算機系統(tǒng)應用. 2008(01)
[7]數(shù)據(jù)挖掘在數(shù)字圖書館中的應用研究[J]. 潘旭武,陳玲洪. 浙江高校圖書情報工作. 2007(01)
[8]關聯(lián)規(guī)則挖掘的常用算法及其比較分析[J]. 涂承勝. 重慶三峽學院學報. 2006(03)
[9]基于數(shù)據(jù)挖掘的數(shù)字圖書館個性化服務[J]. 夏南強,張紅梅. 圖書館學研究. 2006(01)
[10]數(shù)據(jù)挖掘技術在圖書館工作中的應用[J]. 黃蘭. 圖書館學研究. 2005(07)
博士論文
[1]基于粗糙集的指標體系構建及綜合評價方法研究[D]. 李遠遠.武漢理工大學 2009
碩士論文
[1]基于數(shù)據(jù)倉庫的學生就業(yè)管理系統(tǒng)的研究[D]. 金雪嶠.電子科技大學 2010
[2]可視化數(shù)據(jù)挖掘技術的研究與實現(xiàn)[D]. 施惠娟.華東師范大學 2010
[3]數(shù)據(jù)挖掘技術在數(shù)字化校園中的應用[D]. 鄒晶晶.中南大學 2009
[4]基于粗糙集的屬性約簡與規(guī)則提取[D]. 黃麗萍.廈門大學 2007
本文編號:3145120
【文章來源】:哈爾濱理工大學黑龍江省
【文章頁數(shù)】:54 頁
【學位級別】:碩士
【部分圖文】:
用戶信息的聚類分析流程設計
圖 2-2 用戶信息相關的三類卡片據(jù)之前選定的能夠表征用戶特點的下載頻次進行分類,可以的用戶分類三個類別,超頻率使用型、中頻率使用型、低頻過對 100 條用戶信息的梳理,使用電子圖書館的三個類別的用致如下:表 2-1 電子圖書館用戶三個類別的聚類分析結果類別 記錄 年均下載頻次 總平均下率使用型 256 15 4率使用型 542 31 13率使用型 202 62 26分用戶的聚類分析結果如表 2-2 所示。表 2-2 電子圖書館的部分用戶的聚類分析結果號 姓名 年均下載頻次 總均下載頻次 0309 韋紀州 9 41 低頻0155 宋洋 32 122 中頻
哈爾濱理工大學工程碩士學位論文0711 吳兵兵 59 258 超頻率0326 張雪林 32 108 中頻率0608 肖強 11 51 低頻率0326 沈鵬飛 59 277 超頻率0107 張亞為 42 125 中頻率0229 李翔 8 44 低頻率圖書信息的 K-Means 聚類子圖書館的信息管理系統(tǒng)中,除了用戶信息以外,圖書信息在千差萬別的海量電子圖書資源中,哪些電子圖書更受用戶的響到電子圖書館的后期運營和維護。所以,一類圖書的被下載反應該書是不是用戶喜愛的熱點圖書的關鍵。在本文電子圖書設計當中,與圖書信息相關的三類卡片的設計結果,如圖 2-3
【參考文獻】:
期刊論文
[1]對數(shù)據(jù)流頻繁項集挖掘算法WSW-Imp的改進[J]. 王曉霞,王治和. 計算機工程與應用. 2013(08)
[2]數(shù)據(jù)挖掘取樣方法研究[J]. 胡文瑜,孫志揮,吳英杰. 計算機研究與發(fā)展. 2011(01)
[3]我國公共圖書館服務體系建設:治理模式研究[J]. 梁欣. 中國圖書館學報. 2009(06)
[4]從知識運動的角度認識圖書館[J]. 周慧. 中國圖書館學報. 2009(06)
[5]解決數(shù)據(jù)樣本不平衡性的頻繁子圖挖掘算法[J]. 謝玓,尚學群,王淼,張延園. 計算機工程與應用. 2008(36)
[6]WEB使用挖掘研究[J]. 黃浩,王建軍. 計算機系統(tǒng)應用. 2008(01)
[7]數(shù)據(jù)挖掘在數(shù)字圖書館中的應用研究[J]. 潘旭武,陳玲洪. 浙江高校圖書情報工作. 2007(01)
[8]關聯(lián)規(guī)則挖掘的常用算法及其比較分析[J]. 涂承勝. 重慶三峽學院學報. 2006(03)
[9]基于數(shù)據(jù)挖掘的數(shù)字圖書館個性化服務[J]. 夏南強,張紅梅. 圖書館學研究. 2006(01)
[10]數(shù)據(jù)挖掘技術在圖書館工作中的應用[J]. 黃蘭. 圖書館學研究. 2005(07)
博士論文
[1]基于粗糙集的指標體系構建及綜合評價方法研究[D]. 李遠遠.武漢理工大學 2009
碩士論文
[1]基于數(shù)據(jù)倉庫的學生就業(yè)管理系統(tǒng)的研究[D]. 金雪嶠.電子科技大學 2010
[2]可視化數(shù)據(jù)挖掘技術的研究與實現(xiàn)[D]. 施惠娟.華東師范大學 2010
[3]數(shù)據(jù)挖掘技術在數(shù)字化校園中的應用[D]. 鄒晶晶.中南大學 2009
[4]基于粗糙集的屬性約簡與規(guī)則提取[D]. 黃麗萍.廈門大學 2007
本文編號:3145120
本文鏈接:http://www.sikaile.net/tushudanganlunwen/3145120.html