基于基金項(xiàng)目數(shù)據(jù)的研究前沿主題探測方法
發(fā)布時(shí)間:2020-02-13 03:02
【摘要】:[目的 /意義]根據(jù)基金項(xiàng)目數(shù)據(jù)的特點(diǎn),提出基于基金項(xiàng)目數(shù)據(jù)的研究前沿主題探測方法,以期識別出前瞻價(jià)值更高的研究前沿,為研究前沿識別相關(guān)研究提供借鑒思路。[方法/過程]首先,基于PLDA模型識別蘊(yùn)含在基金項(xiàng)目文本中的研究主題;然后基于主題-文檔矩陣建立主題和基金項(xiàng)目文檔的映射關(guān)系,在此基礎(chǔ)上,利用主題的資助時(shí)間、資助金額和中心性指標(biāo)進(jìn)行研究前沿主題探測,從而識別出值得關(guān)注的研究前沿主題;最后,利用主題演化可視化分析方法,對研究前沿主題進(jìn)行演化分析,以預(yù)測其發(fā)展趨勢。[結(jié)果 /結(jié)論]研究結(jié)果表明,該方法可以根據(jù)基金項(xiàng)目數(shù)據(jù)的特點(diǎn)識別出蘊(yùn)含在其中的研究前沿主題,并且能夠分析研究前沿主題的分裂、融合等演化過程。
【圖文】:
利用PLDA模型進(jìn)行主題識別,相較于詞頻、共詞等基于主題詞的主題識別方法在揭示詞間語義關(guān)系上具有一定優(yōu)勢,而且在準(zhǔn)確度上不會低于LDA模型,識別效率有所提高。2.2研究前沿識別目前情報(bào)學(xué)和信息科學(xué)領(lǐng)域存在眾多和研究前沿相似和相關(guān)的概念,比如:研究前沿、科學(xué)前沿、科技前沿、新興趨勢、突現(xiàn)領(lǐng)域等等。從圖書情報(bào)工作領(lǐng)域來講,研究前沿(ResearchFront)這一概念具體明顯的學(xué)科屬性,即通過圖書情報(bào)領(lǐng)域相關(guān)專業(yè)術(shù)語來定義研究前沿這一概念,其中,對國內(nèi)外圖情領(lǐng)域產(chǎn)生重大影響的研究前沿概念及其發(fā)展情況如圖1所示:圖1“研究前沿”相關(guān)概念的發(fā)展時(shí)間線半個(gè)多世紀(jì)以來,研究前沿識別獲得了巨大發(fā)展,其識別方法主要可以分為基于引文、主題詞的方法,具體可以為共被引聚類、引文耦合、詞頻、共詞、社區(qū)探測和主題模型(LDA)等方法。近年來,國內(nèi)外相關(guān)學(xué)者就研究前沿識別問題提出了眾多卓有成效的新方法。2014年,范云滿等提出一種融合新興主題探測指標(biāo)的主題模型識別方法,利用LDA模型識別論文數(shù)據(jù)中的主題,然后基于文中構(gòu)建的新興主題特征指標(biāo)對進(jìn)入成熟階段的各個(gè)時(shí)期的主題進(jìn)行了分析,形成了新興主題探測表格和探測曲線VDP,在此基礎(chǔ)上得到值得關(guān)注的新興主題[6]。2015年,祝娜等提出一種基于LDA的研究前沿識別方法,利用VSM模型進(jìn)行語義角色標(biāo)注,構(gòu)建語義分析指標(biāo),對論文數(shù)據(jù)中的研究問題、方法等內(nèi)容進(jìn)行語義標(biāo)引,根據(jù)標(biāo)引出的關(guān)鍵詞語義角色對應(yīng)的上位詞的概率識別出研究前沿主題[7]。2016年,鄭彥寧等提出識別研究前沿的兩個(gè)新指標(biāo):研究主題年齡和研究主題關(guān)注作者數(shù)量指標(biāo),具體方法為基于TF-IDF抽取關(guān)鍵詞構(gòu)建共詞網(wǎng)絡(luò),利用Newman社團(tuán)結(jié)構(gòu)探測算法進(jìn)行聚類主題識別,然后利用研究主題?
?項(xiàng)目的項(xiàng)目名稱為數(shù)據(jù)源,通過詞頻、共詞分析方法識別立項(xiàng)主題,,進(jìn)而揭示研究現(xiàn)狀與發(fā)展趨勢[9]。2013年,秦佳航對2011-2013年國家社會科學(xué)基金在圖書館、情報(bào)與文獻(xiàn)學(xué)類立項(xiàng)資助項(xiàng)目的關(guān)鍵詞進(jìn)行了歸類與分析,分析研究前沿與發(fā)展趨勢[10]。2014年,靜發(fā)沖等利用k-means方法對美國國家科學(xué)基金會(NSF)生物科學(xué)部的基金項(xiàng)目進(jìn)行聚類分析,展示了各類主題的項(xiàng)目研究內(nèi)容以及識別新興主題[11]。2016年,李廣建等以2011-2015年國家社會科學(xué)基金項(xiàng)目中的情報(bào)學(xué)項(xiàng)目作為數(shù)據(jù)來源,通過人工判讀,對圖2基于基金項(xiàng)目數(shù)據(jù)的研究前沿主題探測與演化分析方法流程情報(bào)學(xué)社會科學(xué)基金項(xiàng)目的主題分布、熱點(diǎn)分布、研究側(cè)面、研究背景等方面進(jìn)行分析[12]。2016年,梁偉波以美國國家科學(xué)基金會2006-2015年間資助的項(xiàng)目為研究對象,利用CiteSpaceⅢ繪制物流項(xiàng)目研究計(jì)劃的知識圖譜,使用VOSviewer繪制主題詞聚類圖譜,揭示國外物流研究前沿、熱點(diǎn)主題[13]。目前,基于基金項(xiàng)目數(shù)據(jù)的研究前沿分析,一方面以詞頻、共詞等計(jì)量分析和定性分析方法為主,未深入到基金項(xiàng)目文本中;另一方面,基于文本挖掘的方法雖然將基金項(xiàng)目中蘊(yùn)含的主題識別出來,但缺乏有效的研究前沿主題的判定指標(biāo)。相較于基于論文數(shù)據(jù)的研究前沿識別研究,可以發(fā)現(xiàn)基于基金項(xiàng)目數(shù)據(jù)的識別方法、工具較為簡單,缺乏科學(xué)、準(zhǔn)確的研究前沿判別指標(biāo),研究人員的主觀判斷影響較大,研究前沿識別結(jié)果不夠深入、準(zhǔn)確。綜上所述,本文以NSF資助的碳納米管研究領(lǐng)域基金項(xiàng)目數(shù)據(jù)為研究對象(后文簡稱NSF基金項(xiàng)目數(shù)據(jù)),利用PLDA模型識別基金項(xiàng)目文本中的主題,基于主題的資助時(shí)間、資助強(qiáng)度(金額)和中心性指標(biāo)的研究前沿主題探測指標(biāo)體系,判斷研
本文編號:2579003
【圖文】:
利用PLDA模型進(jìn)行主題識別,相較于詞頻、共詞等基于主題詞的主題識別方法在揭示詞間語義關(guān)系上具有一定優(yōu)勢,而且在準(zhǔn)確度上不會低于LDA模型,識別效率有所提高。2.2研究前沿識別目前情報(bào)學(xué)和信息科學(xué)領(lǐng)域存在眾多和研究前沿相似和相關(guān)的概念,比如:研究前沿、科學(xué)前沿、科技前沿、新興趨勢、突現(xiàn)領(lǐng)域等等。從圖書情報(bào)工作領(lǐng)域來講,研究前沿(ResearchFront)這一概念具體明顯的學(xué)科屬性,即通過圖書情報(bào)領(lǐng)域相關(guān)專業(yè)術(shù)語來定義研究前沿這一概念,其中,對國內(nèi)外圖情領(lǐng)域產(chǎn)生重大影響的研究前沿概念及其發(fā)展情況如圖1所示:圖1“研究前沿”相關(guān)概念的發(fā)展時(shí)間線半個(gè)多世紀(jì)以來,研究前沿識別獲得了巨大發(fā)展,其識別方法主要可以分為基于引文、主題詞的方法,具體可以為共被引聚類、引文耦合、詞頻、共詞、社區(qū)探測和主題模型(LDA)等方法。近年來,國內(nèi)外相關(guān)學(xué)者就研究前沿識別問題提出了眾多卓有成效的新方法。2014年,范云滿等提出一種融合新興主題探測指標(biāo)的主題模型識別方法,利用LDA模型識別論文數(shù)據(jù)中的主題,然后基于文中構(gòu)建的新興主題特征指標(biāo)對進(jìn)入成熟階段的各個(gè)時(shí)期的主題進(jìn)行了分析,形成了新興主題探測表格和探測曲線VDP,在此基礎(chǔ)上得到值得關(guān)注的新興主題[6]。2015年,祝娜等提出一種基于LDA的研究前沿識別方法,利用VSM模型進(jìn)行語義角色標(biāo)注,構(gòu)建語義分析指標(biāo),對論文數(shù)據(jù)中的研究問題、方法等內(nèi)容進(jìn)行語義標(biāo)引,根據(jù)標(biāo)引出的關(guān)鍵詞語義角色對應(yīng)的上位詞的概率識別出研究前沿主題[7]。2016年,鄭彥寧等提出識別研究前沿的兩個(gè)新指標(biāo):研究主題年齡和研究主題關(guān)注作者數(shù)量指標(biāo),具體方法為基于TF-IDF抽取關(guān)鍵詞構(gòu)建共詞網(wǎng)絡(luò),利用Newman社團(tuán)結(jié)構(gòu)探測算法進(jìn)行聚類主題識別,然后利用研究主題?
?項(xiàng)目的項(xiàng)目名稱為數(shù)據(jù)源,通過詞頻、共詞分析方法識別立項(xiàng)主題,,進(jìn)而揭示研究現(xiàn)狀與發(fā)展趨勢[9]。2013年,秦佳航對2011-2013年國家社會科學(xué)基金在圖書館、情報(bào)與文獻(xiàn)學(xué)類立項(xiàng)資助項(xiàng)目的關(guān)鍵詞進(jìn)行了歸類與分析,分析研究前沿與發(fā)展趨勢[10]。2014年,靜發(fā)沖等利用k-means方法對美國國家科學(xué)基金會(NSF)生物科學(xué)部的基金項(xiàng)目進(jìn)行聚類分析,展示了各類主題的項(xiàng)目研究內(nèi)容以及識別新興主題[11]。2016年,李廣建等以2011-2015年國家社會科學(xué)基金項(xiàng)目中的情報(bào)學(xué)項(xiàng)目作為數(shù)據(jù)來源,通過人工判讀,對圖2基于基金項(xiàng)目數(shù)據(jù)的研究前沿主題探測與演化分析方法流程情報(bào)學(xué)社會科學(xué)基金項(xiàng)目的主題分布、熱點(diǎn)分布、研究側(cè)面、研究背景等方面進(jìn)行分析[12]。2016年,梁偉波以美國國家科學(xué)基金會2006-2015年間資助的項(xiàng)目為研究對象,利用CiteSpaceⅢ繪制物流項(xiàng)目研究計(jì)劃的知識圖譜,使用VOSviewer繪制主題詞聚類圖譜,揭示國外物流研究前沿、熱點(diǎn)主題[13]。目前,基于基金項(xiàng)目數(shù)據(jù)的研究前沿分析,一方面以詞頻、共詞等計(jì)量分析和定性分析方法為主,未深入到基金項(xiàng)目文本中;另一方面,基于文本挖掘的方法雖然將基金項(xiàng)目中蘊(yùn)含的主題識別出來,但缺乏有效的研究前沿主題的判定指標(biāo)。相較于基于論文數(shù)據(jù)的研究前沿識別研究,可以發(fā)現(xiàn)基于基金項(xiàng)目數(shù)據(jù)的識別方法、工具較為簡單,缺乏科學(xué)、準(zhǔn)確的研究前沿判別指標(biāo),研究人員的主觀判斷影響較大,研究前沿識別結(jié)果不夠深入、準(zhǔn)確。綜上所述,本文以NSF資助的碳納米管研究領(lǐng)域基金項(xiàng)目數(shù)據(jù)為研究對象(后文簡稱NSF基金項(xiàng)目數(shù)據(jù)),利用PLDA模型識別基金項(xiàng)目文本中的主題,基于主題的資助時(shí)間、資助強(qiáng)度(金額)和中心性指標(biāo)的研究前沿主題探測指標(biāo)體系,判斷研
【相似文獻(xiàn)】
相關(guān)期刊論文 前1條
1 胡阿沛;張靜;張曉宇;;基于專利文獻(xiàn)的技術(shù)演化分析方法評述[J];現(xiàn)代情報(bào);2013年10期
相關(guān)碩士學(xué)位論文 前2條
1 楊春艷;基于語義和引用加權(quán)的文獻(xiàn)主題提取研究[D];浙江大學(xué);2015年
2 王甜甜;基于hLDA的圖書內(nèi)部主題層次組織研究[D];華中師范大學(xué);2016年
本文編號:2579003
本文鏈接:http://www.sikaile.net/tushudanganlunwen/2579003.html
最近更新
教材專著