天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

面向校園論壇的網(wǎng)絡(luò)書(shū)寫(xiě)紋識(shí)別研究

發(fā)布時(shí)間:2017-04-17 04:05

  本文關(guān)鍵詞:面向校園論壇的網(wǎng)絡(luò)書(shū)寫(xiě)紋識(shí)別研究,由筆耕文化傳播整理發(fā)布。


【摘要】:互聯(lián)網(wǎng)已成為廣大的高校大學(xué)生表達(dá)自我、宣泄情感最主要的平臺(tái)之一。想要了解大學(xué)生的內(nèi)心世界并更好的引導(dǎo)大學(xué)生發(fā)展,進(jìn)行大學(xué)生的網(wǎng)絡(luò)行為研究是非常有必要的。本文嘗試通過(guò)對(duì)大學(xué)生網(wǎng)絡(luò)書(shū)寫(xiě)紋的識(shí)別研究、基于個(gè)體作者網(wǎng)絡(luò)書(shū)寫(xiě)紋的話(huà)題挖掘研究和基于作者-書(shū)寫(xiě)紋-話(huà)題的可視化研究來(lái)展開(kāi)對(duì)大學(xué)生的網(wǎng)絡(luò)行為研究,并在華中師范大學(xué)BBS論壇——博雅論壇上收集了大量帖子作為實(shí)驗(yàn)數(shù)據(jù)進(jìn)行相關(guān)實(shí)驗(yàn)。 網(wǎng)絡(luò)書(shū)寫(xiě)紋是指用戶(hù)在網(wǎng)絡(luò)文字中留下的具有獨(dú)特寫(xiě)作風(fēng)格的特征集合,就像人的指紋一樣是可以標(biāo)記作者寫(xiě)作特征的獨(dú)一無(wú)二的標(biāo)識(shí)。因此,利用此技術(shù)可以有效的處理網(wǎng)絡(luò)的匿名性在進(jìn)行大學(xué)生網(wǎng)絡(luò)行為的研究過(guò)程中所造成的不便。本文設(shè)計(jì)了一種能在大量作者情況下對(duì)中文網(wǎng)絡(luò)書(shū)寫(xiě)紋進(jìn)行識(shí)別的集成學(xué)習(xí)算法模型——基于K折交叉驗(yàn)證的多項(xiàng)式樸素貝葉斯多分類(lèi)器模型。根據(jù)實(shí)驗(yàn)驗(yàn)證,在大量作者的同一數(shù)據(jù)集情況下,相對(duì)于已經(jīng)廣泛使用的其他分類(lèi)識(shí)別算法,基于K折交叉驗(yàn)證的多項(xiàng)式樸素貝葉斯多分類(lèi)器模型具有明顯的優(yōu)勢(shì)。 基于個(gè)體作者網(wǎng)絡(luò)書(shū)寫(xiě)紋的話(huà)題挖掘研究是對(duì)大學(xué)生網(wǎng)絡(luò)行為研究的重要技術(shù),它能挖掘出每個(gè)大學(xué)生所熱衷的話(huà)題并得到其所參與的話(huà)題概率分布,從而走進(jìn)他們內(nèi)心的世界。本文構(gòu)造了基于作者-書(shū)寫(xiě)紋-話(huà)題的中文文本話(huà)題挖掘模型。根據(jù)實(shí)驗(yàn)驗(yàn)證,該模型能較有效的挖掘出實(shí)驗(yàn)文本的相關(guān)話(huà)題及關(guān)鍵詞,并能進(jìn)一步挖掘出每個(gè)作者的話(huà)題概率分布。 基于文本的可視化技術(shù)是近年來(lái)的研究熱點(diǎn)。本文設(shè)計(jì)并構(gòu)造了基于作者-書(shū)寫(xiě)紋-話(huà)題的可視化模型,清楚的展示了基于作者-書(shū)寫(xiě)紋-話(huà)題的中文文本話(huà)題挖掘模型中所得到的關(guān)于大學(xué)生作者、話(huà)題與話(huà)題關(guān)鍵詞的相關(guān)結(jié)論。極大的提高了作者-話(huà)題中文網(wǎng)絡(luò)文本挖掘模型的可理解性。
【關(guān)鍵詞】:網(wǎng)絡(luò)行為研究 校園論壇 網(wǎng)絡(luò)書(shū)寫(xiě)紋 話(huà)題挖掘 文本可視化
【學(xué)位授予單位】:華中師范大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2014
【分類(lèi)號(hào)】:G434
【目錄】:
  • 摘要5-6
  • Abstract6-10
  • 第1章 緒論10-17
  • 1.1 研究背景10-11
  • 1.2 國(guó)內(nèi)外研究現(xiàn)狀11-14
  • 1.2.1 網(wǎng)絡(luò)書(shū)寫(xiě)紋識(shí)別研究現(xiàn)狀11-13
  • 1.2.2 話(huà)題挖掘研究現(xiàn)狀13-14
  • 1.2.3 文本可視化研究現(xiàn)狀14
  • 1.3 研究意義14-15
  • 1.4 研究?jī)?nèi)容與組織結(jié)構(gòu)15-17
  • 1.4.1 研究?jī)?nèi)容15
  • 1.4.2 組織結(jié)構(gòu)15-17
  • 第2章 網(wǎng)絡(luò)書(shū)寫(xiě)紋識(shí)別與話(huà)題提取相關(guān)技術(shù)17-28
  • 2.1 引言17
  • 2.2 文本預(yù)處理相關(guān)技術(shù)研究17-20
  • 2.2.1 文本的特征表示17-18
  • 2.2.2 特征項(xiàng)的選擇及降維18-20
  • 2.3 網(wǎng)絡(luò)書(shū)寫(xiě)紋識(shí)別算法技術(shù)研究20-25
  • 2.3.1 主流單分類(lèi)器算法研究20-22
  • 2.3.2 主流集成識(shí)別算法研究22-25
  • 2.4 話(huà)題抽取相關(guān)技術(shù)研究25-26
  • 2.4.1 話(huà)題模型簡(jiǎn)介25
  • 2.4.2 幾種話(huà)題模型研究及比較25-26
  • 2.5 文本可視化技術(shù)簡(jiǎn)介26-27
  • 2.6 本章小結(jié)27-28
  • 第3章 基于K折交叉驗(yàn)證的多項(xiàng)樸素貝葉斯多分類(lèi)器模型28-41
  • 3.1 引言28
  • 3.2 問(wèn)題描述28-29
  • 3.3 基于N-gram特征項(xiàng)的提取29-30
  • 3.4 基于K折交叉驗(yàn)證的集成學(xué)習(xí)算法30-33
  • 3.4.1 K折交叉驗(yàn)證原理30-31
  • 3.4.2 基于K折交叉驗(yàn)證原理改進(jìn)的集成學(xué)習(xí)算法及流程31-32
  • 3.4.3 隨機(jī)采樣方法32
  • 3.4.4 集成算法融合策略32-33
  • 3.5 基于樸素貝葉斯的基分類(lèi)器算法33-37
  • 3.5.1 貝葉斯理論33-35
  • 3.5.2 樸素貝葉斯分類(lèi)器35-36
  • 3.5.3 多項(xiàng)式樸素貝葉斯分類(lèi)器模型36-37
  • 3.6 實(shí)驗(yàn)設(shè)計(jì)與結(jié)果分析37-40
  • 3.6.1 數(shù)據(jù)集及文本預(yù)處理37
  • 3.6.2 性能評(píng)估方法37-38
  • 3.6.3 實(shí)驗(yàn)設(shè)計(jì)38
  • 3.6.4 結(jié)果分析38-40
  • 3.7 本章小結(jié)40-41
  • 第4章 基于個(gè)體作者書(shū)寫(xiě)紋的話(huà)題抽取模型41-51
  • 4.1 引言41
  • 4.2 特征項(xiàng)的提取41-42
  • 4.3 基于LDA模型擴(kuò)展的AMT模型42-45
  • 4.4 AMT模型實(shí)現(xiàn)45-46
  • 4.5 實(shí)驗(yàn)設(shè)計(jì)與結(jié)果分析46-50
  • 4.6 本章小結(jié)50-51
  • 第5章 基于文本分類(lèi)的個(gè)體作者話(huà)題模型可視化展示51-56
  • 5.1 可視化模型框架設(shè)計(jì)思想及UML類(lèi)圖展示51-53
  • 5.1.1 可視化模型設(shè)計(jì)思想51-52
  • 5.1.2 可視化模型UML圖展示52-53
  • 5.2 可視化展示53-55
  • 5.3 本章小結(jié)55-56
  • 第6章 總結(jié)和展望56-58
  • 6.1 總結(jié)56-57
  • 6.2 展望57-58
  • 參考文獻(xiàn)58-63
  • 在校期問(wèn)所發(fā)表的論文63-64
  • 致謝64

【參考文獻(xiàn)】

中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條

1 張運(yùn)良;朱禮軍;喬曉東;張全;;基于句類(lèi)特征的作者寫(xiě)作風(fēng)格分類(lèi)研究[J];計(jì)算機(jī)工程與應(yīng)用;2009年22期

2 崔凱;周斌;賈焰;梁政;;一種基于LDA的在線(xiàn)主題演化挖掘模型[J];計(jì)算機(jī)科學(xué);2010年11期

3 孫建文;楊宗凱;劉三(女牙);王佩;;基于集成學(xué)習(xí)與遺傳算法的網(wǎng)絡(luò)書(shū)寫(xiě)紋識(shí)別研究[J];計(jì)算機(jī)科學(xué);2011年06期

4 曹娟;張勇東;李錦濤;唐勝;;一種基于密度的自適應(yīng)最優(yōu)LDA模型選擇方法[J];計(jì)算機(jī)學(xué)報(bào);2008年10期

5 武曉春;黃萱菁;吳立德;;基于語(yǔ)義分析的作者身份識(shí)別方法研究[J];中文信息學(xué)報(bào);2006年06期

6 黎冬媛;劉智;劉三(女牙);孟文婷;;采用半隨機(jī)特征采樣算法的中文書(shū)寫(xiě)紋識(shí)別研究[J];計(jì)算機(jī)科學(xué);2013年02期

7 唐家渝;劉知遠(yuǎn);孫茂松;;文本可視化研究綜述[J];計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào);2013年03期

8 閻輝,張學(xué)工,李衍達(dá);應(yīng)用SVM方法進(jìn)行沉積微相識(shí)別[J];物探化探計(jì)算技術(shù);2000年02期

9 唐杰;宮繼兵;劉柳;楊文軍;;基于話(huà)題模型的學(xué)術(shù)社會(huì)網(wǎng)絡(luò)建模及應(yīng)用[J];中國(guó)科技論文在線(xiàn);2011年01期

10 楊瀟;馬軍;楊同峰;杜言琦;邵海敏;;主題模型LDA的多文檔自動(dòng)文摘[J];智能系統(tǒng)學(xué)報(bào);2010年02期

中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前1條

1 馬建斌;中文Web信息作者同一認(rèn)定技術(shù)研究[D];河北農(nóng)業(yè)大學(xué);2010年


  本文關(guān)鍵詞:面向校園論壇的網(wǎng)絡(luò)書(shū)寫(xiě)紋識(shí)別研究,由筆耕文化傳播整理發(fā)布。



本文編號(hào):312352

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/jiaoyulunwen/jiaoyujiaoxuefangfalunwen/312352.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶(hù)bd9a5***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com