天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 自動(dòng)化論文 >

基于監(jiān)督學(xué)習(xí)的寫作風(fēng)格建模方法研究

發(fā)布時(shí)間:2017-05-13 09:17

  本文關(guān)鍵詞:基于監(jiān)督學(xué)習(xí)的寫作風(fēng)格建模方法研究,由筆耕文化傳播整理發(fā)布。


【摘要】:隨著移動(dòng)互聯(lián)網(wǎng)技術(shù)快速發(fā)展,人類依賴計(jì)算機(jī)從事的工作越來(lái)越多,也越需要計(jì)算機(jī)能夠智能地理解和處理海量的自然語(yǔ)言信息。在自然語(yǔ)言處理中,個(gè)人言語(yǔ)、作品風(fēng)格分析是計(jì)算語(yǔ)言學(xué)的經(jīng)典的研究工作,也是難以得到突破的研究。寫作風(fēng)格是一個(gè)主觀性的描述,目前還沒(méi)有一個(gè)嚴(yán)謹(jǐn)?shù)臄?shù)學(xué)模型能夠表達(dá)寫作風(fēng)格。本課題的研究思路是結(jié)合語(yǔ)言學(xué)對(duì)寫作風(fēng)格定義和可計(jì)算方式,用形式化的數(shù)學(xué)模型表達(dá),然后機(jī)器學(xué)習(xí)的方法進(jìn)行實(shí)驗(yàn)佐證,通過(guò)實(shí)驗(yàn)反過(guò)來(lái)修改理論,最終得到一個(gè)比較嚴(yán)謹(jǐn)?shù)臄?shù)學(xué)表達(dá)。從這個(gè)研究思路出發(fā),本課題首先查閱國(guó)內(nèi)外文獻(xiàn),結(jié)合前人工作與風(fēng)格理論,用數(shù)學(xué)符號(hào)形式定義了文章的寫作風(fēng)格,并擴(kuò)展如何用機(jī)器學(xué)習(xí)算法學(xué)習(xí)寫作風(fēng)格的定義。定義寫作風(fēng)格模型后,提出了整體總體的建模方案,而且針對(duì)建模過(guò)程中的關(guān)鍵問(wèn)題,本課題進(jìn)行展開(kāi)詳細(xì)說(shuō)明。為了驗(yàn)證模型和建模的有效性,本課題展開(kāi)了寫作風(fēng)格特征提取分析、刻畫以及識(shí)別研究。在寫作風(fēng)格特征提取刻畫研究中,提出了聚類分析來(lái)自動(dòng)提取風(fēng)格特征,然后使用四分位差統(tǒng)計(jì)法來(lái)刻畫寫作風(fēng)格,最后的實(shí)驗(yàn)結(jié)果驗(yàn)證了寫作風(fēng)格的定義。在寫作風(fēng)格識(shí)別中,使用了支持向量機(jī)算法來(lái)建立寫作風(fēng)格分類器,實(shí)驗(yàn)結(jié)果證明特征并不是越多越好,經(jīng)過(guò)自動(dòng)提取優(yōu)化的特征集會(huì)提升識(shí)別準(zhǔn)確。為了對(duì)比及改善支持向量機(jī)算法,提出了兩種基于集成學(xué)習(xí)算法的寫作風(fēng)格識(shí)別方法,實(shí)驗(yàn)結(jié)果證明提出的兩種方法可以提高識(shí)別的準(zhǔn)確率。
【關(guān)鍵詞】:計(jì)算機(jī)語(yǔ)言 機(jī)器學(xué)習(xí) 寫作風(fēng)格 模型 監(jiān)督學(xué)習(xí)
【學(xué)位授予單位】:浙江大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TP18
【目錄】:
  • 摘要4-5
  • Abstract5-12
  • 第1章 緒論12-19
  • 1.1 引言12
  • 1.2 研究背景和意義12-13
  • 1.2.1 研究背景12-13
  • 1.2.2 研究意義13
  • 1.3 “寫作風(fēng)格”描述定義13-14
  • 1.4 國(guó)內(nèi)外研究現(xiàn)狀14-16
  • 1.5 研究工作16-17
  • 1.5.1 問(wèn)題綜述16-17
  • 1.5.2 主要工作17
  • 1.6 本文內(nèi)容與結(jié)構(gòu)17-19
  • 第2章 寫作風(fēng)格建模19-38
  • 2.1 引言19
  • 2.2 寫作風(fēng)格模型定義19-24
  • 2.2.1 寫作風(fēng)格模型定義19-21
  • 2.2.2 寫作風(fēng)格建?傮w方案21-24
  • 2.3 特征提取選擇24-34
  • 2.3.1 特征提取25-32
  • 2.3.2 特征選擇32-34
  • 2.4 模型訓(xùn)練和評(píng)估34-37
  • 2.4.1 學(xué)習(xí)訓(xùn)練34-36
  • 2.4.2 測(cè)試和評(píng)價(jià)36-37
  • 2.5 本章小結(jié)37-38
  • 第3章 寫作風(fēng)格刻畫與識(shí)別38-60
  • 3.1 引言38
  • 3.2 基于聚類分析的寫作風(fēng)格刻畫38-42
  • 3.2.1 聚類分析38-39
  • 3.2.2 寫作風(fēng)格刻畫39-42
  • 3.3 基于支持向量機(jī)的寫作風(fēng)格識(shí)別42-49
  • 3.3.1 線性支持向量機(jī)42-43
  • 3.3.2 多類支持向量機(jī)分類43-44
  • 3.3.3 支持向量機(jī)的寫作分類器訓(xùn)練44-48
  • 3.3.4 性能評(píng)估48-49
  • 3.4 實(shí)驗(yàn)設(shè)計(jì)及分析49-59
  • 3.4.1 實(shí)驗(yàn)環(huán)境49-50
  • 3.4.2 寫作風(fēng)格特征提取和刻畫50-56
  • 3.4.3 SVM算法的寫作風(fēng)格識(shí)別56-59
  • 3.5 本章小結(jié)59-60
  • 第4章 基于集成學(xué)習(xí)的寫作風(fēng)格識(shí)別60-75
  • 4.1 引言60-61
  • 4.2 基于SVM-KNN組合算法的寫作風(fēng)格識(shí)別61-65
  • 4.2.1 鄰近算法61-62
  • 4.2.2 SVM-KNN組合算法62-63
  • 4.2.3 基于SVM-KNN算法的分類器訓(xùn)練63-65
  • 4.3 基于元學(xué)習(xí)策略的層疊泛化方法的寫作風(fēng)格識(shí)別65-70
  • 4.3.1 相關(guān)的監(jiān)督學(xué)習(xí)算法理論65-67
  • 4.3.2 元學(xué)習(xí)策略的疊層泛化模型67-69
  • 4.3.3 基于多元線性回歸的的元分類器訓(xùn)練69-70
  • 4.4 實(shí)驗(yàn)設(shè)計(jì)及分析70-73
  • 4.4.1 實(shí)驗(yàn)環(huán)境70-71
  • 4.4.2 實(shí)驗(yàn)設(shè)計(jì)71-72
  • 4.4.3 不同學(xué)習(xí)算法訓(xùn)練的分類器性能對(duì)比72-73
  • 4.5 本章小結(jié)73-75
  • 第5章 總結(jié)與展望75-77
  • 5.1 課題總結(jié)75-76
  • 5.1.1 研究結(jié)論75-76
  • 5.1.2 研究不足點(diǎn)76
  • 5.2 研究展望76-77
  • 參考文獻(xiàn)77-80
  • 致謝80-81
  • 附錄Ⅰ 詞性標(biāo)注表81-83
  • 附錄Ⅱ 實(shí)驗(yàn)數(shù)據(jù)輸入的數(shù)據(jù)格式83

【相似文獻(xiàn)】

中國(guó)期刊全文數(shù)據(jù)庫(kù) 前7條

1 鄭保衛(wèi);風(fēng)格即其人——試論馬克思和恩格斯的寫作風(fēng)格與人格特征[J];新聞與寫作;1995年12期

2 張景勇;怎樣寫活經(jīng)濟(jì)報(bào)道──淺談?wù)矅?guó)樞經(jīng)濟(jì)報(bào)道的寫作風(fēng)格[J];新聞與寫作;1999年01期

3 ;參賽要求[J];電腦愛(ài)好者;1998年20期

4 李翩影;;都市報(bào)深度報(bào)道現(xiàn)狀研究——以《南方都市報(bào)》為例[J];新聞世界;2014年07期

5 蔡華東;再談新聞寫作風(fēng)格[J];新聞前哨;2002年11期

6 張凱;張明允;;基于SVM的《紅樓夢(mèng)》寫作風(fēng)格研究[J];貴陽(yáng)學(xué)院學(xué)報(bào)(自然科學(xué)版);2011年01期

7 ;[J];;年期

中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前1條

1 孫曉明;馬少平;;基于寫作風(fēng)格的作者識(shí)別[A];輝煌二十年——中國(guó)中文信息學(xué)會(huì)二十周年學(xué)術(shù)會(huì)議論文集[C];2001年

中國(guó)重要報(bào)紙全文數(shù)據(jù)庫(kù) 前3條

1 豐縣李寨初級(jí)中學(xué) 張業(yè)永;閱讀興趣對(duì)寫作風(fēng)格的影響[N];江蘇教育報(bào);2010年

2 郭增彬;編輯應(yīng)尊重作者的寫作風(fēng)格[N];中華新聞報(bào);2004年

3 賀安敬;做一個(gè)聰明的失敗者[N];中國(guó)石油報(bào);2002年

中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前2條

1 陳得福;基于監(jiān)督學(xué)習(xí)的寫作風(fēng)格建模方法研究[D];浙江大學(xué);2016年

2 朱牧;基于寫作風(fēng)格特征的論文剽竊檢查優(yōu)化方法研究[D];復(fù)旦大學(xué);2011年


  本文關(guān)鍵詞:基于監(jiān)督學(xué)習(xí)的寫作風(fēng)格建模方法研究,由筆耕文化傳播整理發(fā)布。

,

本文編號(hào):362141

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/362141.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶3e304***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com