數(shù)字圖書館數(shù)字資源中事實知識元識別與標引
發(fā)布時間:2024-04-14 16:44
數(shù)字圖書館作為一種以網絡技術為環(huán)境基礎的知識網絡系統(tǒng),是重要的知識來源。為了滿足用戶精細化信息需求,數(shù)字圖書館數(shù)字資源的知識管理單位進一步細化到知識元。以事實知識元為研究對象,在對數(shù)字圖書館的數(shù)字資源管理現(xiàn)狀及知識元的研究現(xiàn)狀進行綜述后,提出事實知識元的定義,針對事實知識元的特點,建立起事實知識元描述模型及抽取規(guī)則,以該抽取規(guī)則為基礎,對事實知識元的抽取流程進行梳理,提出事實知識元描述框架。
【文章頁數(shù)】:5 頁
【部分圖文】:
本文編號:3954984
【文章頁數(shù)】:5 頁
【部分圖文】:
圖1事實知識元描述規(guī)則構建流程
依據(jù)CSSCI核心期刊排名情況,選取若干情報學核心期刊,并從萬方、維普、中國知網等數(shù)據(jù)庫下載題錄信息,對題錄信息進行整合去重等處理后,整理出一份關鍵詞表,然后從該表中獲取事實描述術語,構建其術語表。根據(jù)該描述術語表對情報學某核心雜志某年的全文進行識別,得出所有關于事實描述的句子,....
圖2知識元抽取流程
知識元提取第一步,對實體資源進行預處理,即刪減資源中與主題無關的信息,減少數(shù)據(jù)量,減輕后續(xù)數(shù)據(jù)組織處理的工作量,提高整體效率。在此過程中,應考慮實體資源存在形式,若為非文本形式,如圖像、音頻、視頻等,應轉化為文本形式再進行文本信息讀取及后續(xù)處理;若實體資源本身為文本形式,即可直接....
本文編號:3954984
本文鏈接:http://www.sikaile.net/tushudanganlunwen/3954984.html