數(shù)據(jù)挖掘在檔案管理中的應用研究
發(fā)布時間:2020-05-15 04:52
【摘要】:數(shù)據(jù)挖掘技術的快速發(fā)展使得檔案中的非結(jié)構化數(shù)據(jù)能夠進行處理,它能夠幫助實現(xiàn)檔案的多元分類、檔案信息的準確檢索、檔案內(nèi)容的整合呈現(xiàn)以及檔案鑒定的科學規(guī)范化。在此基礎上,本文結(jié)合檔案管理工作的相關流程,論述了在設計檔案數(shù)據(jù)挖掘模型時所應遵守的一些原則,并詳細介紹了檔案數(shù)據(jù)挖掘的基本框架,主要從數(shù)據(jù)庫建設、數(shù)據(jù)預處理、數(shù)據(jù)文檔的建立、訓練過程的設計、應用流程的架構等方面進行了闡述。同時,通過使用相關算法,利用機器學習中監(jiān)督學習和無監(jiān)督學習相結(jié)合的方式來舉例說明,之后還比較了各個階段所用各種算法的優(yōu)點、缺點、適用情況及注意事項等。最后,本文還結(jié)合江蘇省昆山市民生檔案智慧分析挖掘應用平臺實踐的案例,分析了建設檔案數(shù)據(jù)挖掘平臺時的相關工作以及所需注意的細節(jié)問題。
【圖文】:
國內(nèi)發(fā)文趨勢
圖 1-2 國內(nèi)相關研究的學科分布經(jīng)聚類分析,在 2012~2016 年間,國內(nèi)關于檔案數(shù)據(jù)挖掘的研究偏向于管理、利用和服務等方面,如圖 1-3 所示,,具體的應用研究主要集中在以下幾方面:
【學位授予單位】:蘇州大學
【學位級別】:碩士
【學位授予年份】:2018
【分類號】:TP311.13;G270.7
本文編號:2664504
【圖文】:
國內(nèi)發(fā)文趨勢
圖 1-2 國內(nèi)相關研究的學科分布經(jīng)聚類分析,在 2012~2016 年間,國內(nèi)關于檔案數(shù)據(jù)挖掘的研究偏向于管理、利用和服務等方面,如圖 1-3 所示,,具體的應用研究主要集中在以下幾方面:
【學位授予單位】:蘇州大學
【學位級別】:碩士
【學位授予年份】:2018
【分類號】:TP311.13;G270.7
【參考文獻】
相關期刊論文 前10條
1 王平;安亞翔;;大數(shù)據(jù)時代的檔案信息平臺建設[J];檔案與建設;2015年10期
2 張曉瑛;;基于數(shù)據(jù)挖掘的電子健康檔案信息可視化服務探析[J];蘭臺世界;2015年29期
3 王蘭成;劉曉亮;;網(wǎng)上數(shù)字檔案大數(shù)據(jù)分析中的知識挖掘技術研究[J];浙江檔案;2013年10期
4 王蘭成;;應對檔案數(shù)據(jù)庫中敏感數(shù)據(jù)挖掘威脅的實證研究[J];檔案學研究;2013年02期
5 段鳳;王小芳;;數(shù)據(jù)挖掘在科研檔案管理中的應用研究[J];蘭臺世界;2012年35期
6 王曉燕;;數(shù)據(jù)挖掘技術在檔案信息管理中的應用[J];蘭臺世界;2012年23期
7 竇梅;孫峋;陳艷;朱瑩;孫仁誠;;數(shù)據(jù)挖掘在科研檔案管理中的應用[J];蘭臺世界;2012年17期
8 奉國和;鄭偉;;國內(nèi)中文自動分詞技術研究綜述[J];圖書情報工作;2011年02期
9 菅志剛,金旭;數(shù)據(jù)挖掘中數(shù)據(jù)預處理的研究與實現(xiàn)[J];計算機應用研究;2004年07期
10 王蘭成,馮文杰,田梅;基于中國檔案主題詞表的自動標引控制研究[J];情報學報;2002年02期
本文編號:2664504
本文鏈接:http://www.sikaile.net/tushudanganlunwen/2664504.html
教材專著