天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 社科論文 > 圖書檔案論文 >

基于學(xué)術(shù)網(wǎng)絡(luò)的新論文影響力預(yù)測

發(fā)布時(shí)間:2020-07-17 19:54
【摘要】:近年來,論文發(fā)表數(shù)量呈現(xiàn)指數(shù)型增長趨勢。從海量論文集中,挖掘新論文的潛在影響力、發(fā)現(xiàn)高質(zhì)量的新論文不僅能夠有效幫助研究人員快速地挑選新論文,而且?guī)椭芯咳藛T了解領(lǐng)域技術(shù)的最新動態(tài)。然而高引論文所占比例較低,論文影響力存在差異,而且新論文在發(fā)表時(shí)期沒有任何引用記錄,基于論文引用數(shù)量的傳統(tǒng)方法不能衡量新論文影響力或者評價(jià)新論文質(zhì)量。因此挖掘新論文的潛在影響力、發(fā)現(xiàn)高質(zhì)量新論文是一個(gè)具有挑戰(zhàn)性的問題。為解決新論文影響力預(yù)測問題,本文將作者、論文作為節(jié)點(diǎn),以作者與作者的合作關(guān)系、論文與論文之間的引用關(guān)系以及作者與論文之間的從屬關(guān)系作為邊,構(gòu)建學(xué)術(shù)網(wǎng)絡(luò)。本文基于學(xué)術(shù)網(wǎng)絡(luò)預(yù)測新論文影響力,主要解決兩方面的挑戰(zhàn):論文庫的不斷更新導(dǎo)致主題的動態(tài)演變、時(shí)間敏感的主題關(guān)注度變動以及作者主題相關(guān)權(quán)威性的波動;多因素對論文影響力的聯(lián)合影響。針對主題的動態(tài)演變、時(shí)間敏感的主題關(guān)注度變動以及作者主題相關(guān)權(quán)威性的變動的挑戰(zhàn),本文首先引入了動態(tài)主題模型。該模型拓展了傳統(tǒng)的狀態(tài)空間模型,學(xué)習(xí)每個(gè)主題-詞的概率分布隨時(shí)間的演變過程;然后本文依據(jù)動態(tài)主題模型學(xué)習(xí)所得的主題概率分布衡量主題在不同時(shí)期的關(guān)注度;最后本文基于論文之間引用關(guān)系,使用PageRank算法計(jì)算論文潛在影響力,并結(jié)合論文動態(tài)主題的概率分布,獲得論文作者主題相關(guān)權(quán)威性的特征向量。本文結(jié)合作者在不同主題上的權(quán)威的特征向量以及新論文的主題概率分布,利用向量叉積原理,衡量作者主題相關(guān)的權(quán)威性如何作用于不同主題分布的新論文。針對多因素對論文影響力的聯(lián)合影響的挑戰(zhàn),本文從作者之間、研究團(tuán)體內(nèi)部以及研究團(tuán)體之間分析作者相關(guān)的社交因素。此外本文還分析了論文發(fā)表的會議或者期刊的權(quán)威性特征。本文利用因式分解機(jī)模型,聯(lián)合分析各類特征對新論文影響力預(yù)測的影響。因式分解機(jī)模型對新論文每一特征維度,使用潛在向量進(jìn)行表示,并利用隨機(jī)梯度下降算法,學(xué)習(xí)潛在向量。通過使用向量點(diǎn)積表示特征之間潛在關(guān)聯(lián)關(guān)系,并且利用學(xué)習(xí)所得的潛在向量,對新論文影響力進(jìn)行預(yù)測。本文使用從ACM電子圖書館爬取的數(shù)據(jù)集,首先對新論文影響力的預(yù)測結(jié)果以及論文影響力排名進(jìn)行驗(yàn)證,并且和其他論文影響力預(yù)測方法進(jìn)行對比。實(shí)驗(yàn)結(jié)果表明本文方法的有效性。其次對時(shí)間敏感的主題關(guān)注度、作者主題相關(guān)的權(quán)威性以及作者社交性對新論文在不同時(shí)間的影響進(jìn)行研究。此外本文設(shè)計(jì)實(shí)現(xiàn)基于移動設(shè)備的IPS(Influence Prediction System)系統(tǒng),實(shí)現(xiàn)論文主題概率分布以及影響力預(yù)測結(jié)果的展示以及作者主題相關(guān)的權(quán)威性排名等。此外本文對IPS系統(tǒng)進(jìn)行相關(guān)的功能測試和性能測試,測試結(jié)果表明系統(tǒng)能夠正常運(yùn)行。
【學(xué)位授予單位】:山東大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2018
【分類號】:TP391.1;G353.1
【圖文】:

數(shù)量分布,論文引用,傳統(tǒng)方法,論文


高引論文僅有20131篇。Garfield等人⑵發(fā)現(xiàn)通常20%的文章的引用數(shù)量占80%逡逑左右的總數(shù)量,而剩余的論文引用次數(shù)很少,甚至沒有被引用過。論文引用符逡逑合冪率分布,依據(jù)本文爬取的ACM電子圖書館數(shù)據(jù)集統(tǒng)計(jì)如圖1-1所示。所逡逑以在數(shù)量爆炸性增長的新論文中,并不是所有新論文都能對社會或者個(gè)人有著逡逑重要影響。傳統(tǒng)方法評價(jià)論文影響力主要通過論文的引用數(shù)量或者基于引用的逡逑變型方式,如PageRank值或者h-index值等。由于新論文在發(fā)表前期沒有任何逡逑引用記錄,因此傳統(tǒng)方法不能衡量新論文影響力或者評價(jià)新論文質(zhì)量。有效的逡逑論文影響力預(yù)測方法需要能夠很好適應(yīng)急速增長的論文數(shù)量,能夠在海量發(fā)表逡逑的論文集中對新論文的影響力進(jìn)行準(zhǔn)確地預(yù)測。因此挖掘新論文的潛在影響力、逡逑發(fā)現(xiàn)高質(zhì)量新論文是一個(gè)具有挑戰(zhàn)性的問題。逡逑I逡逑

主題,動態(tài)演變,框架圖,作者


圖1-2新論文影響力預(yù)測框架圖逡逑1.針對主題的動態(tài)演變、主題關(guān)注度的波動以及作者主題相關(guān)的權(quán)威性的逡逑變動的挑戰(zhàn),本文首先面向帶有時(shí)序性特征的語料庫,使用Dynamic邋Topic逡逑Model(DTM嚴(yán)模型,學(xué)習(xí)論文的文章-主題的概率分布以及主題-單詞的動態(tài)概逡逑率分布,以達(dá)到學(xué)習(xí)動態(tài)主題的目的。DTM模型認(rèn)為主題-詞概率分布會隨著逡逑時(shí)間變化,且滿足一階馬爾可夫假設(shè),主題概率分布的超參數(shù)以及主題中詞項(xiàng)逡逑的概率分布參數(shù)隨時(shí)間變化,且于前一時(shí)間的態(tài),

示意圖,關(guān)聯(lián)關(guān)系,論文,特征向量


到影響力預(yù)測目的,使得模型能夠解決新論文帶來的數(shù)據(jù)稀疏問題。逡逑基于前面章節(jié)的特征提取,對于數(shù)據(jù)集中所有論文特征提取形成特征矩陣逡逑P邋e邋R^,其中n為論文數(shù)量,k為每篇論文的特征維度,其中第i行疚B徭恚]3?示第i篇論文的特征向量,yi為論文的引用量,如圖3-6所示,對每一元組(濟(jì),yi)逡逑作為模型的輸入與訓(xùn)練。逡逑論文特征向量邐卩丨肖Q戝義希埃埃卞澹埃埃沖危埃卞危危埃埃沖危埃村危埃插危危埃靛危埃埃卞危埃卞危擔(dān)瑰危沖澹,辶x希瑁簦赍澹瑁簦插澹瑁簦沖危危桑粒赍危桑粒插澹桑粒沖危危蹋茫緬澹牛恚忮澹櫻儒澹齲擔(dān)椋睿洌澹義希沃魈餿榷儒沃魈庀喙厝ㄍ雜跋戾紊緗灰蛩劐宸⒈淼,辶x賢跡常堵畚奶卣饗蛄渴疽饌煎義細(xì)葜把八寐畚哪諶萏卣鰲⒆髡呦喙靨卣饕約奧畚姆⒈淼氐閭卣鰨義閑緯尚侶畚牡奶卣饗蛄,并且使觽儽灾O蛄懇櫻邋味蘊(yùn)卣饗蛄康牡冢槲冉繡義廈枋觶跡常罰痹諳蛄坎瘓哂惺導(dǎo)室庖,表其预测函数表示为:辶x希耍觶襄澹藉澹

本文編號:2759867

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/tushudanganlunwen/2759867.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶47362***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com