文獻型數(shù)據(jù)庫數(shù)據(jù)挖掘與知識轉(zhuǎn)移
發(fā)布時間:2020-07-03 11:25
【摘要】: 隨著知識經(jīng)濟時代的來臨,知識轉(zhuǎn)移越來越受重視。圖書館作為知識的集散地,在知識轉(zhuǎn)移中起著重要作用。而數(shù)據(jù)挖掘這種新技術(shù)是為了解決當前“信息豐富而知識貧乏”的問題而出現(xiàn)的。文獻型數(shù)據(jù)庫是圖書館中使用頻率最高的知識資源之一。對文獻型數(shù)據(jù)庫進行數(shù)據(jù)挖掘有助于促進圖書館知識轉(zhuǎn)移。 本文共分三個部分。 第一部分,圖書館知識轉(zhuǎn)移與文獻型數(shù)據(jù)庫數(shù)據(jù)挖掘。論述了知識轉(zhuǎn)移、圖書館知識轉(zhuǎn)移和數(shù)據(jù)挖掘的相關(guān)概念和研究現(xiàn)狀,介紹了數(shù)據(jù)挖掘的常用技術(shù)及其在圖書館中的應用,討論了文獻型數(shù)據(jù)庫數(shù)據(jù)挖掘的意義;并結(jié)合信息計量學方法,研究了文獻型數(shù)據(jù)庫數(shù)據(jù)挖掘的主要分析指標和步驟。 第二部分,案例研究。先利用CBMdisc對我國內(nèi)分泌系統(tǒng)疾病研究文獻142,367篇進行了挖掘,發(fā)現(xiàn)糖尿病是目前內(nèi)分泌系統(tǒng)疾病的研究重點;再利用SCIE對目前的糖尿病研究文獻87,728篇進行了挖掘。挖掘過程中主要使用了常用工具軟件和信息計量學指標。 第三部分,總結(jié)與討論。結(jié)合案例研究,總結(jié)了文獻型數(shù)據(jù)庫數(shù)據(jù)挖掘的方式和挖掘過程中需注意的問題。
【學位授予單位】:重慶醫(yī)科大學
【學位級別】:碩士
【學位授予年份】:2007
【分類號】:G250.74
【圖文】:
因此首先選擇主題途徑,使用主題詞“內(nèi)分泌系統(tǒng)疾病”進索,見圖 1。按此進行檢索,可檢出標引為“內(nèi)分泌系統(tǒng)疾病”、“腎上腺疾尿病”、“侏儒癥”、“內(nèi)分泌腺腫瘤”、“性腺障礙”、“甲狀腺疾病”、“垂“多內(nèi)分泌腺疾病,自身免疫性”、“甲狀腺疾病”、“結(jié)核,內(nèi)分泌系統(tǒng)有下位詞(如腎上腺疾病的下位詞有 18 個)的文獻,檢全 CBMdisc 收錄系統(tǒng)疾病研究文獻;并分別對內(nèi)分泌系統(tǒng)疾病的這 10 個下位主題詞進行,檢出每一種疾病的文獻。由于副主題詞(Subheadings)對主題詞起限定作用,因此還選擇不同副行檢索,以確定文獻的具體研究領(lǐng)域。副主題詞標引為“診斷”、“治療”“病因?qū)W”、“流行病學”、“護理”、“康復”、“并發(fā)癥”及其下位副主題床應用研究文獻;副主題詞標引為“分類”、“先天性”、 “胚胎學”、““人種學”、 “歷史”、“遺傳學”、“免疫學”、“代謝”、“微生物學”、““病理生理學”及其下位副主題詞的文獻作為基礎研究文獻,分別進行
用 CBMdisc 提供的套錄功能保存所需的期刊來源、項目類別和主題詞關(guān)的文本文件。由于 CBMdisc 每次只能保存 500 條以下的記錄,最索結(jié)果在 2000 條以下。因此先按出版年進行限定。檢索結(jié)果記錄數(shù)低接套錄;高于 500 條且低于 2000 條的利用“套錄選項”中“套錄指定錄數(shù)并對套錄結(jié)果進行追加;高于 2000 條的利用檢索系統(tǒng)提供的各件(如出版物類型、核心期刊、帶文摘等)以及與新的檢索詞進行算,將檢索結(jié)果限定在 2000 條以內(nèi)之后再進行套錄,然后用“邏輯錄的記錄,得到新的結(jié)果,再加上新的限定條件,再將結(jié)果追加在據(jù)之后,重復操作,直至所有記錄均被套錄。數(shù)據(jù)清理和抽取便于分析和統(tǒng)計各個字段所含內(nèi)容,使用 TRS 文本抽取工具,抽取字段內(nèi)容,清除無效的記錄。
本文編號:2739597
【學位授予單位】:重慶醫(yī)科大學
【學位級別】:碩士
【學位授予年份】:2007
【分類號】:G250.74
【圖文】:
因此首先選擇主題途徑,使用主題詞“內(nèi)分泌系統(tǒng)疾病”進索,見圖 1。按此進行檢索,可檢出標引為“內(nèi)分泌系統(tǒng)疾病”、“腎上腺疾尿病”、“侏儒癥”、“內(nèi)分泌腺腫瘤”、“性腺障礙”、“甲狀腺疾病”、“垂“多內(nèi)分泌腺疾病,自身免疫性”、“甲狀腺疾病”、“結(jié)核,內(nèi)分泌系統(tǒng)有下位詞(如腎上腺疾病的下位詞有 18 個)的文獻,檢全 CBMdisc 收錄系統(tǒng)疾病研究文獻;并分別對內(nèi)分泌系統(tǒng)疾病的這 10 個下位主題詞進行,檢出每一種疾病的文獻。由于副主題詞(Subheadings)對主題詞起限定作用,因此還選擇不同副行檢索,以確定文獻的具體研究領(lǐng)域。副主題詞標引為“診斷”、“治療”“病因?qū)W”、“流行病學”、“護理”、“康復”、“并發(fā)癥”及其下位副主題床應用研究文獻;副主題詞標引為“分類”、“先天性”、 “胚胎學”、““人種學”、 “歷史”、“遺傳學”、“免疫學”、“代謝”、“微生物學”、““病理生理學”及其下位副主題詞的文獻作為基礎研究文獻,分別進行
用 CBMdisc 提供的套錄功能保存所需的期刊來源、項目類別和主題詞關(guān)的文本文件。由于 CBMdisc 每次只能保存 500 條以下的記錄,最索結(jié)果在 2000 條以下。因此先按出版年進行限定。檢索結(jié)果記錄數(shù)低接套錄;高于 500 條且低于 2000 條的利用“套錄選項”中“套錄指定錄數(shù)并對套錄結(jié)果進行追加;高于 2000 條的利用檢索系統(tǒng)提供的各件(如出版物類型、核心期刊、帶文摘等)以及與新的檢索詞進行算,將檢索結(jié)果限定在 2000 條以內(nèi)之后再進行套錄,然后用“邏輯錄的記錄,得到新的結(jié)果,再加上新的限定條件,再將結(jié)果追加在據(jù)之后,重復操作,直至所有記錄均被套錄。數(shù)據(jù)清理和抽取便于分析和統(tǒng)計各個字段所含內(nèi)容,使用 TRS 文本抽取工具,抽取字段內(nèi)容,清除無效的記錄。
【參考文獻】
相關(guān)期刊論文 前10條
1 陳立紅;;關(guān)于圖書館知識轉(zhuǎn)移的探析[J];河南圖書館學刊;2006年05期
2 原小玲;圖書館知識轉(zhuǎn)移探討[J];晉圖學刊;2005年05期
3 蔣曉靜,周定康;一種新的數(shù)據(jù)挖掘處理模型[J];計算機與現(xiàn)代化;2003年02期
4 姚美村,艾路,袁月梅,喬延江;消渴病復方配伍規(guī)律的關(guān)聯(lián)規(guī)則分析[J];北京中醫(yī)藥大學學報;2002年06期
5 金碧輝;孫海榮;張望;;俯瞰中國科學——2005年度SCI論文統(tǒng)計分析[J];科學觀察;2006年01期
6 鄒濤,王繼成,黃源,張福炎;中文文檔自動分類系統(tǒng)的設計與實現(xiàn)[J];中文信息學報;1999年03期
7 唐炎華;石金濤;;國外知識轉(zhuǎn)移研究綜述[J];情報科學;2006年01期
8 邱均平;信息計量學(二) 第二講 文獻信息增長規(guī)律與應用[J];情報理論與實踐;2000年02期
9 崔雷,胡海榮,李紀賓;文獻計量學共引分析系統(tǒng)設計與開發(fā)[J];情報學報;2000年04期
10 韓惠琴,劉柏嵩;數(shù)字圖書館中的知識發(fā)現(xiàn)[J];情報學報;2001年03期
相關(guān)碩士學位論文 前1條
1 林麗;數(shù)字圖書館數(shù)據(jù)挖掘研究[D];武漢大學;2004年
本文編號:2739597
本文鏈接:http://www.sikaile.net/tushudanganlunwen/2739597.html
教材專著