數字文獻資源多元深度聚合研究
發(fā)布時間:2020-06-26 09:24
【摘要】:圖書館是社會文化公共基礎設施的重要組成部分之一,在社會文化事業(yè)發(fā)展中將起到十分重要的積極作用。無論是圖書情報學的理論研究還是現實的圖書館事業(yè),均越來越強調實現知識服務的重要性。深化圖書館知識服務能力,提升圖書館知識服務水平已經成為當前亟需解決的問題;此外,隨著科學發(fā)展所累積的數字文獻資源規(guī)模越來越龐大,如何高效利用這些數字文獻資源也逐漸成為提升知識服務能力的重要研究命題。本文的選題“數字文獻資源多元深度聚合研究”正是在這樣的大背景下提出來的。 本研究綜合運用語義挖掘、自然語言處理、信息計量、網絡結構分析等多學科交叉的方法,創(chuàng)新地提出數字文獻資源多元深度聚合理論是銜接信息計量與信息檢索的重要橋梁,并在此基礎上構建了數字文獻資源多元深度聚合理論體系,從多個方面論述了其多元性特征和深度特性;進一步明確了多元深度聚合的技術流程和方法,通過兩類典型的數字文獻資源特征項關聯網絡論證了該方法體系的實用性和可操作性。本研究力求從新的途徑來實現數字文獻資源語義揭示與深度聚合,改進圖書館服務方式,提升服務效率和水平,為數字圖書館的建設和多學科交叉的方法體系提供有益的探索成果。 本文堅持“理論結合實踐,用實踐驗證理論”的思想,從理論基礎研究,理論體系研究,核心技術流程,典型聚合方式實證等多角度系統(tǒng)化進行數字文獻資源多元深度聚合研究。論文第0章引言論述了選題背景、研究意義、國內外研究現狀、技術路線與目標,第六章為研究總結和展望;其余核心部分包括如下五章: 第一章是數字文獻資源多元深度聚合的理論基礎研究,目的在于明確問題來源和理論定位。首先對數字文獻資源的概念和構成要素進行分析;進一步闡述了作為聚合前階段的數字資源整合的主要內容以及與聚合的關聯;論述了當前研究中與數字資源聚合最相關的領域-信息檢索的基本思想及其與聚合的關聯;分析了信息計量學中的集中與離散分布現象,說明這是能夠實施聚合的基礎,在此基礎上將數字文獻資源多元深度聚合定位為銜接信息計量學和信息檢索的紐帶。 第二章是數字文獻資源多元深度聚合的內涵和理論框架研究。多元深度聚合是用戶和以資源集合為表現形式的知識世界的交互過程;數字文獻多元深度聚合的理論模型包括聚合的對象類型、關聯網絡、測度方法和聚合目的等四個要素,這些要素所具有的多元性特征反映了數字文獻資源聚合的多元性。從基于元數據的聚合、基于計量的聚合到基于語義的聚合是一個不斷深化的過程,其中包含了多粒度的層次,不同對象的聚合重點也是體現聚合深度特性的一個重要內容。理論框架的建立為進一步明確技術流程提供了基礎。 第三章是數字文獻資源多元深度聚合的技術體系研究。首先構建了多元深度聚合的通用流程框架,進一步將之歸納為三個核心技術問題,即聚合對象的重要性評價、資源聚合的獲取、資源聚合的語義揭示。對比了局部重要性和全局重要性指標,分析了全局重要性評價的優(yōu)點。針對基于節(jié)點和基于聚類的兩類現有方法,創(chuàng)新地提出了相對重要性聚合方法。歸納了從詞頻,共現再到主題模型的語義發(fā)現路徑,總結了主題語義挖掘的靈活性和可操作性。 第四章是引文網絡中核心資源多元深度聚合的實現。引文網絡是特征項關聯網絡中有向-二值網絡最典型的代表。本章系統(tǒng)分析了傳統(tǒng)引文網絡中的重要性評價單一、結構分析粒度過大的問題,并提出改進指標和方法,將多元深度聚合技術流程應用于XML研究論文的引文網絡中,發(fā)現相對值聚合方法能夠揭示網絡中最具層次豐富性的核心資源聚合。結合主題語義分析,能夠實現聚合中所包含語義內容的深度揭示;谝木W絡的資源深度聚合結果是本文所構建的理論和方法體系有效性的重要體現。 第五章是作者知識關聯網絡多元深度聚合實現。作者關聯網絡的類型最豐富,明確作者復合關聯網絡的聚合流程也就解決了其他多種特征項的聚合問題。本章詳細描述了作者數據的著錄問題和清洗策略,構建了作者合作、互引、共被引、基于文獻的耦合、基于關鍵詞的耦合和基于出版物的耦合等六種關聯網絡,對網絡間的關聯性進行分析,為各種共現網絡分析方法的結合使用提供更多的支持。利用加入作者的語義主題模型挖掘出作者的主題語義分布,發(fā)現作者合作網絡、共被引網絡、基于文獻的耦合網絡的聚合均有其獨特之處,而互引、基于關鍵詞的耦合、基于出版物的耦合則有許多使用上的限制條件;谧髡哧P聯網絡的資源深度聚合能夠為滿足用戶知識需求提供更多角度的支持。
【學位授予單位】:武漢大學
【學位級別】:博士
【學位授予年份】:2014
【分類號】:G250.73
【圖文】:
圖0.2出現頻次大于2的中文關鍵詞共詞分析
容和服務的鏈接,包括全文、文摘、主題網關等。目前許多圖書館在OPAC系統(tǒng)中已經嵌入了 SFX,圖1.2是武漢大學圖書館OPAC系統(tǒng)中SFX的實例。用戶在OPAC中檢索到資源后,點擊SFX鏈接就會顯示與該資源相關的服務項列表,例如館藏查詢、館際互借、查看網絡書評和網絡搜索引擎中與資源相關的信息等內容。?OCLC. WorIdcat[DB/OL]. [2014-1-7]. http:/Avww.oclc.oiig/about/purpose.en.htmI②Ex Libris. SFX[EB/OL]. [2013-12-11]. http://www.exlibrisgroup.com/cn/category/UsingSFX34
本文編號:2730129
【學位授予單位】:武漢大學
【學位級別】:博士
【學位授予年份】:2014
【分類號】:G250.73
【圖文】:
圖0.2出現頻次大于2的中文關鍵詞共詞分析
容和服務的鏈接,包括全文、文摘、主題網關等。目前許多圖書館在OPAC系統(tǒng)中已經嵌入了 SFX,圖1.2是武漢大學圖書館OPAC系統(tǒng)中SFX的實例。用戶在OPAC中檢索到資源后,點擊SFX鏈接就會顯示與該資源相關的服務項列表,例如館藏查詢、館際互借、查看網絡書評和網絡搜索引擎中與資源相關的信息等內容。?OCLC. WorIdcat[DB/OL]. [2014-1-7]. http:/Avww.oclc.oiig/about/purpose.en.htmI②Ex Libris. SFX[EB/OL]. [2013-12-11]. http://www.exlibrisgroup.com/cn/category/UsingSFX34
本文編號:2730129
本文鏈接:http://www.sikaile.net/tushudanganlunwen/2730129.html
教材專著