基于深度融合特征的政務(wù)微博轉(zhuǎn)發(fā)規(guī)模預(yù)測模型
發(fā)布時間:2022-01-09 02:03
【目的】預(yù)測政務(wù)微博的轉(zhuǎn)發(fā)規(guī)模,研究及評估影響政府微博傳播規(guī)模的重要特征,把握政務(wù)微博的信息輿論走向。【方法】針對政務(wù)微博的特點,提出一種深度融合特征的政務(wù)微博轉(zhuǎn)發(fā)預(yù)測方案,引入卷積神經(jīng)網(wǎng)絡(luò)(CNN)和梯度提升決策樹(GBDT)將發(fā)布者特征、時間特征及內(nèi)容特征深度融合,預(yù)測政務(wù)微博的轉(zhuǎn)發(fā)規(guī)模并對影響轉(zhuǎn)發(fā)規(guī)模的特征進(jìn)行重要性排序,找出影響政務(wù)微博轉(zhuǎn)發(fā)規(guī)模的最重要特征。【結(jié)果】引入文本語義特征顯著提升了轉(zhuǎn)發(fā)規(guī)模的預(yù)測準(zhǔn)確率,所提模型將政務(wù)微博轉(zhuǎn)發(fā)規(guī)模的預(yù)測準(zhǔn)確率提升至0.933。特征重要性實驗結(jié)果表明,文本語義特征在影響政務(wù)微博轉(zhuǎn)發(fā)規(guī)模的所有特征中最為重要。【局限】未考慮間接轉(zhuǎn)發(fā)對整體轉(zhuǎn)發(fā)規(guī)模的影響!窘Y(jié)論】深度融合發(fā)布者特征、時間特征及內(nèi)容特征的CNN+GBDT模型能夠顯著提高政務(wù)微博轉(zhuǎn)發(fā)規(guī)模預(yù)測的準(zhǔn)確率。
【文章來源】:數(shù)據(jù)分析與知識發(fā)現(xiàn). 2020,4(Z1)北大核心CSSCICSCD
【文章頁數(shù)】:11 頁
【部分圖文】:
4種算法的F1值對比
基于深度融合特征的政務(wù)微博轉(zhuǎn)發(fā)預(yù)測流程
現(xiàn)有的研究工作通常選擇微博的主題、題材、是否包含多媒體信息等作為微博的內(nèi)容特征。然而,這些信息不能體現(xiàn)微博文本的語義特征。相關(guān)研究表明,高轉(zhuǎn)發(fā)微博文本內(nèi)容之間具有一定的相似性,從而吸引用戶頻繁轉(zhuǎn)發(fā)。CNN在文本語義特征提取、處理短文本分類問題中表現(xiàn)優(yōu)異[7],可作為判別高轉(zhuǎn)發(fā)文本之間語義相似性的手段。CNN模型對微博文本預(yù)測其高轉(zhuǎn)發(fā)概率的過程如圖2所示,包括輸入層、卷積層、池化層和全連接層。每一層的輸出是下一層的輸入。卷積層作為特征提取層,通過濾波器提取局部特征,經(jīng)過卷積核函數(shù)運算產(chǎn)生特征圖,輸出到池化層。池化層屬于特征映射層,提取每張?zhí)卣鲌D中的典型特征,最后通過全連接層映射得到輸出分類向量。采用Word2Vec訓(xùn)練微博文本,將詞向量設(shè)定為m維,對于句子長度為n的微博文本,得到一個m×n的詞向量矩陣作為卷積層的輸入。利用h×k的濾波器對微博文本的詞向量矩陣E[1:n]進(jìn)行卷積操作,如公式(3)所示。
【參考文獻(xiàn)】:
期刊論文
[1]我國政務(wù)微博轉(zhuǎn)發(fā)規(guī)模分類預(yù)測[J]. 李倩倩,姜景,李瑛,劉怡君. 情報雜志. 2018(01)
[2]政務(wù)微博傳播效果影響因素研究——以“江寧公安在線”為例[J]. 張漫銳,劉文波. 今傳媒. 2017(10)
[3]基于轉(zhuǎn)發(fā)行為的政務(wù)微博信息傳播模式研究[J]. 陳然,劉洋. 電子政務(wù). 2017(07)
[4]微博信息轉(zhuǎn)發(fā)影響因素研究[J]. 李倩,張碧君,趙中英. 軟件導(dǎo)刊. 2017(01)
[5]我國地方政務(wù)微博“上情下達(dá)”傳播效能研究——基于31個省會城市政務(wù)微博傳播中央政府工作報告的實證分析[J]. 劉泱育. 新聞大學(xué). 2017(01)
[6]基于用戶特征的微博轉(zhuǎn)發(fā)預(yù)測研究[J]. 仇學(xué)明,肖基毅,陳磊. 南華大學(xué)學(xué)報(自然科學(xué)版). 2016(04)
[7]基于混合特征學(xué)習(xí)的微博轉(zhuǎn)發(fā)預(yù)測方法[J]. 馬曉峰,王磊,陳觀淡. 計算機應(yīng)用與軟件. 2016(11)
[8]基于用戶行為特征的微博轉(zhuǎn)發(fā)預(yù)測研究[J]. 劉瑋,賀敏,王麗宏,劉悅,沈華偉,程學(xué)旗. 計算機學(xué)報. 2016(10)
[9]融合熱點話題的微博轉(zhuǎn)發(fā)預(yù)測研究[J]. 陳江,劉瑋,巢文涵,王麗宏. 中文信息學(xué)報. 2015(06)
[10]基于LDA主題特征的微博轉(zhuǎn)發(fā)預(yù)測[J]. 李志清. 情報雜志. 2015(09)
本文編號:3577726
【文章來源】:數(shù)據(jù)分析與知識發(fā)現(xiàn). 2020,4(Z1)北大核心CSSCICSCD
【文章頁數(shù)】:11 頁
【部分圖文】:
4種算法的F1值對比
基于深度融合特征的政務(wù)微博轉(zhuǎn)發(fā)預(yù)測流程
現(xiàn)有的研究工作通常選擇微博的主題、題材、是否包含多媒體信息等作為微博的內(nèi)容特征。然而,這些信息不能體現(xiàn)微博文本的語義特征。相關(guān)研究表明,高轉(zhuǎn)發(fā)微博文本內(nèi)容之間具有一定的相似性,從而吸引用戶頻繁轉(zhuǎn)發(fā)。CNN在文本語義特征提取、處理短文本分類問題中表現(xiàn)優(yōu)異[7],可作為判別高轉(zhuǎn)發(fā)文本之間語義相似性的手段。CNN模型對微博文本預(yù)測其高轉(zhuǎn)發(fā)概率的過程如圖2所示,包括輸入層、卷積層、池化層和全連接層。每一層的輸出是下一層的輸入。卷積層作為特征提取層,通過濾波器提取局部特征,經(jīng)過卷積核函數(shù)運算產(chǎn)生特征圖,輸出到池化層。池化層屬于特征映射層,提取每張?zhí)卣鲌D中的典型特征,最后通過全連接層映射得到輸出分類向量。采用Word2Vec訓(xùn)練微博文本,將詞向量設(shè)定為m維,對于句子長度為n的微博文本,得到一個m×n的詞向量矩陣作為卷積層的輸入。利用h×k的濾波器對微博文本的詞向量矩陣E[1:n]進(jìn)行卷積操作,如公式(3)所示。
【參考文獻(xiàn)】:
期刊論文
[1]我國政務(wù)微博轉(zhuǎn)發(fā)規(guī)模分類預(yù)測[J]. 李倩倩,姜景,李瑛,劉怡君. 情報雜志. 2018(01)
[2]政務(wù)微博傳播效果影響因素研究——以“江寧公安在線”為例[J]. 張漫銳,劉文波. 今傳媒. 2017(10)
[3]基于轉(zhuǎn)發(fā)行為的政務(wù)微博信息傳播模式研究[J]. 陳然,劉洋. 電子政務(wù). 2017(07)
[4]微博信息轉(zhuǎn)發(fā)影響因素研究[J]. 李倩,張碧君,趙中英. 軟件導(dǎo)刊. 2017(01)
[5]我國地方政務(wù)微博“上情下達(dá)”傳播效能研究——基于31個省會城市政務(wù)微博傳播中央政府工作報告的實證分析[J]. 劉泱育. 新聞大學(xué). 2017(01)
[6]基于用戶特征的微博轉(zhuǎn)發(fā)預(yù)測研究[J]. 仇學(xué)明,肖基毅,陳磊. 南華大學(xué)學(xué)報(自然科學(xué)版). 2016(04)
[7]基于混合特征學(xué)習(xí)的微博轉(zhuǎn)發(fā)預(yù)測方法[J]. 馬曉峰,王磊,陳觀淡. 計算機應(yīng)用與軟件. 2016(11)
[8]基于用戶行為特征的微博轉(zhuǎn)發(fā)預(yù)測研究[J]. 劉瑋,賀敏,王麗宏,劉悅,沈華偉,程學(xué)旗. 計算機學(xué)報. 2016(10)
[9]融合熱點話題的微博轉(zhuǎn)發(fā)預(yù)測研究[J]. 陳江,劉瑋,巢文涵,王麗宏. 中文信息學(xué)報. 2015(06)
[10]基于LDA主題特征的微博轉(zhuǎn)發(fā)預(yù)測[J]. 李志清. 情報雜志. 2015(09)
本文編號:3577726
本文鏈接:http://www.sikaile.net/guanlilunwen/zhengwuguanli/3577726.html
最近更新
教材專著