天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 社科論文 > 圖書檔案論文 >

基于LDA模型的圖書情報學向計算機科學知識流動分析

發(fā)布時間:2020-08-01 14:56
【摘要】:隨著學科融合的不斷深化以及技術手段的日新月異,科學研究在逐漸打破學科原有界限,朝著學科交叉融合的方向邁進,這為圖書情報學的發(fā)展提供了良好的外部環(huán)境。長期以來,圖書情報學與計算機科學間的學術交流極為密切,圖書情報學在吸收計算機科學的理論方法,服務于自身學科建設發(fā)展的同時,也在為計算機科學的發(fā)展貢獻出自己的一份力量。分析學科間知識流動已有研究,發(fā)現(xiàn)對于學科間知識流動研究缺乏在主題層次上的分析,以主題為切入視角對圖書情報學學科向計算機科學學科的知識流動狀況進行理論與實踐相結合的分析,有利于客觀準確地把握圖書情報學學科向計算機科學學科的知識流動脈絡,促進學科的學術創(chuàng)新、提高學術產出的質量。本文調查分析了國內外學科間知識流動的相關文獻以及圖書情報學與計算機科學的相關文獻,將引文內容分析法與全文本引文分析法相結合進行實踐研究,借助R、Endnote、Excel以及Notepad++軟件工具對文獻數據、困惑度、主題強度及主題分布、熱點主題進行了數據統(tǒng)計分析,通過LDA模型對學科文獻內容進行主題建模,挖掘被計算機科學引用的圖書情報學文獻主題以及計算機科學的施引文獻主題,有助于深入理解學科間的知識流動過程。本文首先在調研了國內外學科間知識流動研究現(xiàn)狀基礎之上,提出了以主題為切入視角探索學科間知識流動過程。其次,介紹了LDA模型以及知識流動的相關概念,從知識轉移和知識轉化的角度分析了知識流動的過程,將知識轉移與知識轉化過程視為知識流動的完成過程,類比學科間知識流動過程,分析并構建了基于主題的學科間知識流動模式。再次,以Web of Science為數據來源,檢索了近五年圖書情報學與計算機科學文獻,獲取圖書情報學與計算機科學文獻的相關數據,通過開源軟件R進行數據處理與主題困惑度分析,確定LDA模型的最優(yōu)主題數目,并對LDA模型提取的主題進行主題強度度量,分析了圖書情報學向計算機科學知識轉移與計算機科學知識轉化后相關文獻的研究主題分布以及熱點主題。最后,基于知識流動理論并結合圖書情報學與計算機科學的相關文獻研究分析,提出了促進圖書情報學向計算機科學知識流動的針對性策略。研究發(fā)現(xiàn),圖書情報學向計算機科學知識轉移主要集中在20個主題,分為五個研究方向:信息技術類研究、技術方法類研究、用戶類研究、社會熱點話題類研究、學術文獻類研究,熱點主題包括科學引文分析、信息檢索、用戶模型研究、企業(yè)組織管理研究、電子醫(yī)療研究。計算機科學知識轉化后主要集中在15個主題,分為四個研究方向:用戶類研究、社會熱點話題類研究、管理類研究、技術方法類研究,熱點主題包括用戶意愿感知研究、機器學習、電子醫(yī)療研究、大數據處理與分析以及自然語言處理。
【學位授予單位】:曲阜師范大學
【學位級別】:碩士
【學位授予年份】:2019
【分類號】:G353.1
【圖文】:

概率分布,模型概率,公式,詞語


圖 2-1 LD 模型概率公式圖 2-1 為 LDA 模型概率公式圖,“主題-詞語”矩陣代表每個主題中每個詞語出現(xiàn)“文檔-主題”矩陣代表每個文檔中的每個主題出現(xiàn)的概率!拔臋n-詞語”矩陣代表中每個詞語出現(xiàn)的概率。通過對大量文檔進行分詞工作,計算出每個詞語出現(xiàn)在中的概率,如圖中左側文檔-詞語矩陣。LDA 模型作為無監(jiān)督的學習模型,可以訓練,獲得例如圖中右側主題-詞語和文檔-主題矩陣;谏鲜鰞蓚矩陣,可以下一步研究。D.M.Blei 使用的是 Mean Field Variational 推理算法,將主題-文檔分布θ作為多維在隨機變量,引入超參數α來生成參數,但只對文檔-主題的混合參數加上了 Di,沒有對主題-詞語概率分布進行先驗假設。T.L.Giffiths 則在文獻中對主題-詞語上加上先驗,基于多項式分布和 Dirichlet 分布共軛特性,提出了 Gibbs 算法,并數 β 來生成參數,該模型原理見圖 2-2。

模型原理


圖 2-2 LD 模型原理2 中,箭頭代表依賴關系,矩形方框代表矩形方框內的內容進隱含參數和變量,實心節(jié)點表示可被觀測值,由θ表示文檔的主詞分布的參數集合,每行代表某個主題的詞項概率,α則表示檔個數,K 表示主題數量;W 是關鍵詞,W 的主題序號是 接計算出θ和φ,通常情況下需要借助最大似然估計來完成參數aritionalinference 算法、EM 算法、Gibbs 算法,Gibbs 因其較而得到廣泛的應用。型的文檔生成結果如表 2-1 所示。表 2-1 LDA 模型文檔生成結果X.others保存與 LDA 模型相關參數X.phi保存詞在主題下的概率分布矩陣

主題,數目,方法,困惑度


圖 2-3 確定最優(yōu)主題數目方法常用的 3 種方法來獲取最優(yōu)主題數目都存在一定的不足,本文選取開源軟件不同主題數目下困惑度 (Perplexity) 的變化,來確定主題數目。開源軟件 R軟件 R 誕生于 1980 年左右,其統(tǒng)計分析和繪圖功能都非常強大,具有很多值點:首先,它的開發(fā)周期較短,在 CRAN 庫里包含有大量的函數包;其次,它

【相似文獻】

相關期刊論文 前10條

1 錢思晨;肖龍翔;岑炅蓮;;我國圖書情報學數據素養(yǎng)教育內容及框架研究[J];圖書館研究;2019年03期

2 孟巍;;大數據驅動下的圖書情報學科熱點領域挖掘[J];農業(yè)圖書情報學刊;2018年07期

3 劉波;;知識管理與圖書情報學的變革[J];傳媒論壇;2018年09期

4 姚川軍;;大數據背景下圖書情報學科人才培養(yǎng)模式研究[J];山東工業(yè)技術;2017年02期

5 ;歡迎訂閱2018年度《農業(yè)圖書情報學刊》[J];農業(yè)展望;2017年06期

6 劉忠寶;趙文娟;賈君枝;;深度學習及其對圖書情報學的啟示[J];情報工程;2017年04期

7 ;陜西省圖書館學會第十次圖書情報學學術成果評獎結果揭曉[J];當代圖書館;2017年03期

8 湯敬謙;楊鶴林;;熱點、網絡與態(tài)勢:國外圖書情報學領域元數據研究的知識圖譜分析[J];圖書館學研究;2016年06期

9 王紅;白才進;雷菊霞;;智庫視角下圖書情報學學科發(fā)展范式和未來變革趨勢[J];圖書館學研究;2016年13期

10 楊穎;;大數據背景下圖書情報學科教學模式創(chuàng)新研究[J];魅力中國;2017年05期

相關會議論文 前7條

1 劉宇;張云中;魏瑞斌;謝歡;;2012-2013年上海圖書情報學研究進展述評[A];上海學術報告(2012-2013)[C];2015年

2 李敏;;淺議圖書情報學的可持續(xù)發(fā)展[A];山西省科技情報學會2004年學術年會論文集[C];2005年

3 陳福蓉;李建霞;;基于圖書情報學的國家社科基金古籍保護立項分析[A];廣西圖書館學會2012年年會暨第30次科學討論會論文集[C];2012年

4 歐陽劍;周添良;胡雅瓊;;“互聯(lián)網+”視域下的我國圖書情報學教育模式變革探析[A];中國圖書館學會年會論文集(2017年卷)[C];2018年

5 張爾君;;加強行業(yè)協(xié)會組織建設 助推圖書情報事業(yè)發(fā)展——市地級圖書情報學會發(fā)展思考[A];全國中小型公共圖書館聯(lián)合會2015年研討會會議論文集(一)[C];2015年

6 ;提升公眾素養(yǎng) 造就文化強市[A];黑龍江省社科工作經驗交流會材料匯編[C];2010年

7 杜娜;;淺議圖書館館員的終身教育[A];新世界中國教育發(fā)展論壇 第二卷[C];2007年

相關重要報紙文章 前5條

1 湘潭大學公共管理學院 關影;從知識圖譜視角看中外圖書情報學科進展[N];新華書目報;2016年

2 圖娃;圖書情報學需建資格認證體系[N];中國社會科學報;2010年

3 中國科技信息研究所研究員 武夷山;不可忽視信息在文化產業(yè)中的作用[N];光明日報;2007年

4 實習生 李洪威 記者 張偉國;省社科院延邊州分院成立[N];吉林日報;2009年

5 記者 李思輝 王才忠;學術繁榮有新篇[N];湖北日報;2013年

相關博士學位論文 前1條

1 程妮;基于引文的知識轉移研究[D];武漢大學;2009年

相關碩士學位論文 前10條

1 倪弘;美國圖書情報學研究生教育對中國的啟示[D];山西財經大學;2019年

2 杜含雙;期刊引證視角下圖書情報學知識交流結構分析[D];西南科技大學;2019年

3 于娜;基于LDA模型的圖書情報學向計算機科學知識流動分析[D];曲阜師范大學;2019年

4 于舒曼;基于共詞聚類的圖書情報學與新聞傳播學學科交叉研究[D];曲阜師范大學;2019年

5 王佳佳;海峽兩岸圖書情報學領域博碩士學位論文對比研究[D];東北師范大學;2018年

6 郭驊祥;我國圖書情報學學科交叉計量分析[D];鄭州大學;2018年

7 劉敏;我國圖書情報學學科交叉知識網絡的構建及演化研究[D];曲阜師范大學;2018年

8 朱彥君;近十年圖書情報學科學結構及演進研究[D];曲阜師范大學;2018年

9 李小北;圖書情報學領域研究方法的效度研究[D];河北大學;2018年

10 武正谷;基于CiteSpace分析的我國圖書情報學科發(fā)展研究[D];山西醫(yī)科大學;2018年



本文編號:2777614

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/tushudanganlunwen/2777614.html


Copyright(c)文論論文網All Rights Reserved | 網站地圖 |

版權申明:資料由用戶46a1d***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com