面向趨勢(shì)預(yù)測(cè)的熱點(diǎn)主題演化分析方法研究
【文章頁(yè)數(shù)】:13 頁(yè)
【部分圖文】:
圖1CBOW模型和Skip-Gram模型示意圖[29]
作為生成詞向量的經(jīng)典模型之一,Word2Vec模型[28-29]得到眾多學(xué)者的認(rèn)可,并且集成在Python的Gensim工具包中,使用方式簡(jiǎn)潔、高效。Word2Vec中訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型具體可以分為兩種:CBOW模型和Skip-Gram模型,基本原理如圖1所示。CBOW模型(Con....
圖2論文數(shù)量年度分布
在干細(xì)胞(StemCell)領(lǐng)域進(jìn)行實(shí)證研究,由于美國(guó)是干細(xì)胞研究的領(lǐng)先國(guó)家,主要以美國(guó)干細(xì)胞研究論文作為數(shù)據(jù)來(lái)源。具體選擇WebofScience數(shù)據(jù)庫(kù)收錄的干細(xì)胞領(lǐng)域相關(guān)文獻(xiàn),檢索策略為:以“stemcell*”作為檢索詞進(jìn)行題名檢索,時(shí)間跨度為2000年1月1日-2....
圖3最優(yōu)主題個(gè)數(shù)確定
由圖3可知,當(dāng)主題個(gè)數(shù)位于25和40時(shí)一致性分?jǐn)?shù)變化發(fā)生明顯轉(zhuǎn)折,并且在40之后趨于穩(wěn)定,即當(dāng)主題個(gè)數(shù)在25之后隨著主題個(gè)數(shù)的增多,一致性分?jǐn)?shù)只增加了0.05,因此選取25~40之間的主題個(gè)數(shù),結(jié)合人工判讀結(jié)果最終確定主題個(gè)數(shù)為32,根據(jù)選定的最優(yōu)主題個(gè)數(shù)進(jìn)行LDA主題識(shí)別。32....
圖4干細(xì)胞領(lǐng)域主題時(shí)間序列(2000年-2018年)
根據(jù)研究方法所述步驟對(duì)5個(gè)熱點(diǎn)主題進(jìn)行ARIMA模型構(gòu)建,其中ARIMA模型的構(gòu)建中參數(shù)確定和模型檢驗(yàn)是十分重要的步驟,具體實(shí)驗(yàn)過(guò)程中利用BIC指標(biāo)確定模型參數(shù),即遍歷所有可能參數(shù)計(jì)算模型BIC值,其中最小值為最優(yōu)參數(shù),從而可確定最后模型參數(shù),結(jié)果如表3所示。確定模型參數(shù)之后,對(duì)....
本文編號(hào):3958089
本文鏈接:http://www.sikaile.net/tushudanganlunwen/3958089.html