基于LDA的國內圖書情報學學科交叉及演化研究
發(fā)布時間:2023-12-24 17:07
當代科學技術日新月異,學科領域紛繁復雜,知識門類在高度分化的同時又不斷趨向綜合,只研究單一學科難以滿足當今社會的需求,因此面向多學科的研究逐步發(fā)展起來。本文利用LDA主題模型研究國內圖書情報學學科交叉現狀及演化態(tài)勢,主要分為以下5步:(1)下載CSSCI數據庫圖書情報學10種核心期刊近十五年共35472篇文獻的題錄信息,利用自編程序提取這些文獻的參考文獻對應的期刊名,并歸類到相應學科。(2)形成學科交叉三級指標,確定管理學、法學、醫(yī)學3個學科為圖書情報學的三個交叉學科,利用python程序爬取近十五年這3個學科論文的摘要86075篇。(3)使用jieba分詞軟件對獲取的摘要進行分詞,利用Notepad++進行數據清洗。(4)基于Eclipse集成開發(fā)環(huán)境,運用困惑度確定模型主題數目,通過LDA提取3個學科近十五年的研究主題,根據主題-詞項概率分布文件進行主題標識,根據文檔-主題概率分布文件計算各個主題的主題強度,對與國內圖書情報學交叉的學科主題進行具體分析。(5)引入時間因素,厘清圖書情報學與三個學科的交叉文獻隱含的知識信息,依據主題強度分布情況對主題演化態(tài)勢進行分析,為相關人員進行科...
【文章頁數】:82 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
第1章 引言
1.1 研究背景
1.2 研究意義
1.2.1 理論意義
1.2.2 實踐意義
1.3 國內外相關研究現狀
1.3.1 LDA主題模型國內外研究現狀
1.3.2 圖書情報學學科交叉國內外研究現狀
1.3.3 研究現狀述評
1.4 相關概念界定
1.4.1 學科交叉
1.4.2 學科交叉強度
1.5 研究內容和研究方法
1.5.1 研究內容
1.5.2 研究方法
1.6 本文的創(chuàng)新及結構
1.6.1 本文的創(chuàng)新
1.6.2 本文的結構
第2章 相關理論基礎
2.1 LDA主題模型
2.1.1 LDA主題模型的表示
2.1.2 參數估計
2.1.3 新樣本的推斷
2.1.4 基于LDA的主題抽取原理
2.1.5 主題強度度量
2.2 學科交叉
2.2.1 學科交叉的研究方法
2.2.2 學科交叉的研究對象
2.2.3 學科交叉的演化特征
2.3 引文分析法
第3章 圖書情報學與其他學科交叉強度分析
3.1 數據來源與處理
3.1.1 數據庫的選取
3.1.2 數據采集與處理
3.2 數據分析
3.2.1 2005-2009年學科交叉分析
3.2.2 2010-2014年學科交叉分析
3.2.3 2015-2019年學科交叉分析
3.2.4 2005-2019年總體學科交叉分析
第4章 基于LDA的圖書情報學學科交叉主題發(fā)現
4.1 研究對象的選取
4.2 圖書情報學與管理學學科知識交叉主題發(fā)現
4.2.1 數據預處理
4.2.2 模型訓練
4.2.3 實驗結果與分析
4.3 圖書情報學與法學學科知識交叉主題發(fā)現
4.3.1 數據預處理
4.3.2 模型訓練
4.3.3 實驗結果與分析
4.4 圖書情報學與醫(yī)學學科知識交叉主題發(fā)現
4.4.1 數據預處理
4.4.2 模型訓練
4.4.3 實驗結果與分析
第5章 基于LDA的圖書情報學學科交叉主題演化分析
5.1 主題強度分布
5.1.1 圖書情報學與管理學交叉主題強度分布
5.1.2 圖書情報學與法學交叉主題強度分布
5.1.3 圖書情報學與醫(yī)學交叉主題強度分布
5.2 主題演化
5.2.1 圖書情報學與管理學交叉主題演化
5.2.2 圖書情報學與法學交叉主題演化
5.2.3 圖書情報學與醫(yī)學交叉主題演化
第6章 結語
6.1 研究結論
6.2 研究不足與展望
6.2.1 研究不足
6.2.2 研究展望
附錄A 將參考文獻歸類到相應學科的程序
附錄B 爬取三個學科論文摘要的程序
參考文獻
在讀期間發(fā)表的學術論文及研究成果
致謝
本文編號:3874946
【文章頁數】:82 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
第1章 引言
1.1 研究背景
1.2 研究意義
1.2.1 理論意義
1.2.2 實踐意義
1.3 國內外相關研究現狀
1.3.1 LDA主題模型國內外研究現狀
1.3.2 圖書情報學學科交叉國內外研究現狀
1.3.3 研究現狀述評
1.4 相關概念界定
1.4.1 學科交叉
1.4.2 學科交叉強度
1.5 研究內容和研究方法
1.5.1 研究內容
1.5.2 研究方法
1.6 本文的創(chuàng)新及結構
1.6.1 本文的創(chuàng)新
1.6.2 本文的結構
第2章 相關理論基礎
2.1 LDA主題模型
2.1.1 LDA主題模型的表示
2.1.2 參數估計
2.1.3 新樣本的推斷
2.1.4 基于LDA的主題抽取原理
2.1.5 主題強度度量
2.2 學科交叉
2.2.1 學科交叉的研究方法
2.2.2 學科交叉的研究對象
2.2.3 學科交叉的演化特征
2.3 引文分析法
第3章 圖書情報學與其他學科交叉強度分析
3.1 數據來源與處理
3.1.1 數據庫的選取
3.1.2 數據采集與處理
3.2 數據分析
3.2.1 2005-2009年學科交叉分析
3.2.2 2010-2014年學科交叉分析
3.2.3 2015-2019年學科交叉分析
3.2.4 2005-2019年總體學科交叉分析
第4章 基于LDA的圖書情報學學科交叉主題發(fā)現
4.1 研究對象的選取
4.2 圖書情報學與管理學學科知識交叉主題發(fā)現
4.2.1 數據預處理
4.2.2 模型訓練
4.2.3 實驗結果與分析
4.3 圖書情報學與法學學科知識交叉主題發(fā)現
4.3.1 數據預處理
4.3.2 模型訓練
4.3.3 實驗結果與分析
4.4 圖書情報學與醫(yī)學學科知識交叉主題發(fā)現
4.4.1 數據預處理
4.4.2 模型訓練
4.4.3 實驗結果與分析
第5章 基于LDA的圖書情報學學科交叉主題演化分析
5.1 主題強度分布
5.1.1 圖書情報學與管理學交叉主題強度分布
5.1.2 圖書情報學與法學交叉主題強度分布
5.1.3 圖書情報學與醫(yī)學交叉主題強度分布
5.2 主題演化
5.2.1 圖書情報學與管理學交叉主題演化
5.2.2 圖書情報學與法學交叉主題演化
5.2.3 圖書情報學與醫(yī)學交叉主題演化
第6章 結語
6.1 研究結論
6.2 研究不足與展望
6.2.1 研究不足
6.2.2 研究展望
附錄A 將參考文獻歸類到相應學科的程序
附錄B 爬取三個學科論文摘要的程序
參考文獻
在讀期間發(fā)表的學術論文及研究成果
致謝
本文編號:3874946
本文鏈接:http://www.sikaile.net/falvlunwen/zhishichanquanfa/3874946.html