天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 軟件論文 >

雙向循環(huán)網(wǎng)絡(luò)中文分詞模型

發(fā)布時間:2018-04-16 07:46

  本文選題:分詞 + 序列標(biāo)注。 參考:《小型微型計算機(jī)系統(tǒng)》2017年03期


【摘要】:針對統(tǒng)計方法的中文分詞模型主要依賴于特征工程,難以捕捉句子中長距離依賴關(guān)系等問題,提出一種雙向循環(huán)網(wǎng)絡(luò)中文分詞模型.為能有效獲取待分類字符的上下文特征,避免局部窗口大小的限制,使用長短時記憶網(wǎng)絡(luò)(Long Short-Term M emory Neural Netw ork,LSTM)作為神經(jīng)網(wǎng)絡(luò)隱藏層,同時增加一層反向LSTM抽取字符的將來信息特征.提出一種語言模型預(yù)訓(xùn)練的網(wǎng)絡(luò)權(quán)值初始化方法,該模型同時得到中文字符embeddings分布式向量特征.在標(biāo)準(zhǔn)分詞數(shù)據(jù)集上測試表明該模型取得比以往統(tǒng)計標(biāo)注方法更好的效果.通過對比實驗結(jié)果發(fā)現(xiàn)深層神經(jīng)網(wǎng)絡(luò)能提取出不遜于人工總結(jié)的分詞特征.
[Abstract]:Aiming at the problem that the Chinese word segmentation model of statistical method mainly depends on feature engineering and it is difficult to capture the middle and long distance dependency of sentences, a bidirectional cyclic network Chinese word segmentation model is proposed.In order to obtain the context features of the characters to be classified effectively and avoid the limitation of the local window size, the long and short time memory network long Short-Term M emory Neural Netw or LSTM) is used as the hidden layer of the neural network, and a layer of reverse LSTM is added to extract the future information features of the characters.A network weight initialization method for pre-training of language model is proposed. The model also obtains the embeddings distributed vector features of Chinese characters.The test on the standard word segmentation data set shows that the model is more effective than the previous statistical annotation methods.By comparing the experimental results, it is found that the deep neural network can extract the word segmentation features which are not inferior to the artificial summary.
【作者單位】: 湖北大學(xué)計算機(jī)與信息工程學(xué)院;
【基金】:國家自然科學(xué)基金項目(61202100)資助
【分類號】:TP391.1

【參考文獻(xiàn)】

相關(guān)期刊論文 前2條

1 劉建偉;劉媛;羅雄麟;;玻爾茲曼機(jī)研究進(jìn)展[J];計算機(jī)研究與發(fā)展;2014年01期

2 黃昌寧;趙海;;中文分詞十年回顧[J];中文信息學(xué)報;2007年03期

【共引文獻(xiàn)】

相關(guān)期刊論文 前10條

1 胡婕;張俊馳;;雙向循環(huán)網(wǎng)絡(luò)中文分詞模型[J];小型微型計算機(jī)系統(tǒng);2017年03期

2 馬世龍;烏尼日其其格;李小平;;大數(shù)據(jù)與深度學(xué)習(xí)綜述[J];智能系統(tǒng)學(xué)報;2016年06期

3 袁成;張榆平;梁洲;張陳方;;受限玻爾茲曼機(jī)在裝備保障方案評價中的應(yīng)用[J];太赫茲科學(xué)與電子信息學(xué)報;2016年06期

4 徐浩煜;任智慧;施俊;周晗;;基于鏈?zhǔn)綏l件隨機(jī)場的中文分詞改進(jìn)方法[J];計算機(jī)應(yīng)用與軟件;2016年12期

5 徐建忠;朱俊;趙瑞;張亮;李嬌嬌;;基于Web技術(shù)的航天文本分類系統(tǒng)研究與應(yīng)用[J];軍民兩用技術(shù)與產(chǎn)品;2016年23期

6 韓俊波;;深度學(xué)習(xí)算法與應(yīng)用探究[J];湖州師范學(xué)院學(xué)報;2016年10期

7 錢建生;邱春榮;李紫陽;吳響;;深度學(xué)習(xí)耦合粒子群優(yōu)化SVM的瓦斯?jié)舛阮A(yù)測[J];煤礦安全;2016年11期

8 昝紅英;許鴻飛;張坤麗;穗志方;;網(wǎng)絡(luò)用語詞典的構(gòu)建及問題分析[J];中文信息學(xué)報;2016年06期

9 樓小帆;吳軍;馬嚴(yán);林昭文;;基于LDA模型的高校論壇熱點提取系統(tǒng)[J];華中科技大學(xué)學(xué)報(自然科學(xué)版);2016年S1期

10 柴瑞敏;O@稱稱;;一種改進(jìn)的深度置信網(wǎng)絡(luò)及其在自然圖像分類中的應(yīng)用[J];計算機(jī)應(yīng)用與軟件;2016年09期

【二級參考文獻(xiàn)】

相關(guān)期刊論文 前6條

1 楊瑩;吳誠煒;胡蘇;;基于受限玻爾茲曼機(jī)的中文文檔分類[J];科技創(chuàng)新導(dǎo)報;2012年16期

2 楊爾弘;方瑩;劉冬明;喬羽;;漢語自動分詞和詞性標(biāo)注評測[J];中文信息學(xué)報;2006年01期

3 孫茂松,鄒嘉彥;漢語自動分詞研究評述[J];當(dāng)代語言學(xué);2001年01期

4 孫茂松;談?wù)劃h語分詞語料庫的一致性問題[J];語言文字應(yīng)用;1999年02期

5 黃昌寧;中文信息處理中的分詞問題[J];語言文字應(yīng)用;1997年01期

6 劉開瑛;現(xiàn)代漢語自動分詞評測技術(shù)研究[J];語言文字應(yīng)用;1997年01期

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 張茂元,盧正鼎,鄒春燕;一種基于語境的中文分詞方法研究[J];小型微型計算機(jī)系統(tǒng);2005年01期

2 程傳鵬;;一種簡單高效的中文分詞方法[J];鄭州輕工業(yè)學(xué)院學(xué)報;2006年03期

3 張博;姜建國;萬平國;;對互聯(lián)網(wǎng)環(huán)境下中文分詞系統(tǒng)的一種架構(gòu)改進(jìn)[J];計算機(jī)應(yīng)用研究;2006年11期

4 夏新松;肖建國;;一種新的錯誤驅(qū)動學(xué)習(xí)方法在中文分詞中的應(yīng)用[J];計算機(jī)科學(xué);2006年03期

5 周軍;王艷紅;;一種基于詞典的中文分詞法的設(shè)計與實現(xiàn)[J];黑龍江科技信息;2008年25期

6 許高建;胡學(xué)鋼;路遙;王慶人;;一種改進(jìn)的中文分詞歧義消除算法研究[J];合肥工業(yè)大學(xué)學(xué)報(自然科學(xué)版);2008年10期

7 張培穎;;運用有向圖進(jìn)行中文分詞研究[J];計算機(jī)工程與應(yīng)用;2009年22期

8 吳晶晶;荊繼武;聶曉峰;王平建;;一種快速中文分詞詞典機(jī)制[J];中國科學(xué)院研究生院學(xué)報;2009年05期

9 袁健;張勁松;馬良;;二次回溯中文分詞方法[J];計算機(jī)應(yīng)用研究;2009年09期

10 劉智文;;利用系統(tǒng)整合提高中文分詞精度的方法研究[J];現(xiàn)代計算機(jī)(專業(yè)版);2009年10期

相關(guān)會議論文 前10條

1 王敏;葉寬余;薛峰;;一種面向網(wǎng)店商品搜索的中文分詞系統(tǒng)設(shè)計[A];全國第22屆計算機(jī)技術(shù)與應(yīng)用學(xué)術(shù)會議(CACIS·2011)暨全國第3屆安全關(guān)鍵技術(shù)與應(yīng)用(SCA·2011)學(xué)術(shù)會議論文摘要集[C];2011年

2 黃昌寧;趙海;;由字構(gòu)詞——中文分詞新方法[A];中文信息處理前沿進(jìn)展——中國中文信息學(xué)會二十五周年學(xué)術(shù)會議論文集[C];2006年

3 任飛亮;石磊;姚天順;;應(yīng)用支持向量機(jī)進(jìn)行中文分詞[A];全國第八屆計算語言學(xué)聯(lián)合學(xué)術(shù)會議(JSCL-2005)論文集[C];2005年

4 吳晶晶;荊繼武;王平建;;一種基于詞典的新型中文分詞機(jī)制[A];全國網(wǎng)絡(luò)與信息安全技術(shù)研討會論文集(上冊)[C];2007年

5 李玉梅;靳光瑾;黃昌寧;;中文分詞規(guī)范中的歧義字段消解細(xì)則[A];第五屆全國語言文字應(yīng)用學(xué)術(shù)研討會論文集[C];2007年

6 修馳;宋柔;;基于“大詞”實例的中文分詞研究[A];中國計算語言學(xué)研究前沿進(jìn)展(2009-2011)[C];2011年

7 黃居仁;;瓶頸,挑戰(zhàn),與轉(zhuǎn)機(jī):中文分詞研究的新思維[A];中國計算機(jī)語言學(xué)研究前沿進(jìn)展(2007-2009)[C];2009年

8 趙海;揭春雨;;基于子串標(biāo)注的中文分詞:尋找更佳的標(biāo)注單元[A];內(nèi)容計算的研究與應(yīng)用前沿——第九屆全國計算語言學(xué)學(xué)術(shù)會議論文集[C];2007年

9 李壽山;黃居仁;;基于詞邊界分類的中文分詞方法[A];中國計算機(jī)語言學(xué)研究前沿進(jìn)展(2007-2009)[C];2009年

10 張梅山;鄧知龍;車萬翔;劉挺;;統(tǒng)計與詞典相結(jié)合的領(lǐng)域自適應(yīng)中文分詞[A];中國計算語言學(xué)研究前沿進(jìn)展(2009-2011)[C];2011年

相關(guān)重要報紙文章 前2條

1 本報記者 張彤;讓計算機(jī)說中國話[N];網(wǎng)絡(luò)世界;2004年

2 清華大學(xué)IT可用性實驗室;2005中文搜索引擎質(zhì)量對比[N];計算機(jī)世界;2005年

相關(guān)博士學(xué)位論文 前4條

1 奚寧;統(tǒng)計機(jī)器翻譯中的中文分詞策略研究[D];南京大學(xué);2013年

2 修馳;適應(yīng)于不同領(lǐng)域的中文分詞方法研究與實現(xiàn)[D];北京工業(yè)大學(xué);2013年

3 何嘉;基于遺傳算法優(yōu)化的中文分詞研究[D];電子科技大學(xué);2012年

4 李志國;面向分布式文本知識管理的中文分詞與文本分類研究[D];重慶大學(xué);2008年

相關(guān)碩士學(xué)位論文 前10條

1 顧輝;基于中文分詞的購物中心微信平臺購物導(dǎo)航的設(shè)計與實現(xiàn)[D];華中師范大學(xué);2015年

2 韓冰;基于感知器算法的中文分詞增量系統(tǒng)設(shè)計與實現(xiàn)[D];哈爾濱工業(yè)大學(xué);2015年

3 杜麗萍;基于互聯(lián)網(wǎng)海量語料的新詞發(fā)現(xiàn)研究及中文分詞系統(tǒng)改進(jìn)[D];西安郵電大學(xué);2015年

4 周祺;基于統(tǒng)計與詞典相結(jié)合的中文分詞的研究與實現(xiàn)[D];哈爾濱工業(yè)大學(xué);2015年

5 梁喜濤;基于主動學(xué)習(xí)的中文分詞方法研究[D];南京郵電大學(xué);2015年

6 楊淦;基于條件隨機(jī)場模型的中文分詞系統(tǒng)研究與實現(xiàn)[D];重慶大學(xué);2015年

7 朱云杰;大數(shù)據(jù)環(huán)境下垃圾評論過濾系統(tǒng)的研究與實現(xiàn)[D];東南大學(xué);2015年

8 呂先超;視障漢語轉(zhuǎn)換軟件SunBraille的設(shè)計實現(xiàn)[D];蘭州大學(xué);2016年

9 黃積楊;基于雙向LSTMN神經(jīng)網(wǎng)絡(luò)的中文分詞研究分析[D];南京大學(xué);2016年

10 梁科;面向中醫(yī)醫(yī)案的數(shù)據(jù)挖掘技術(shù)研究及應(yīng)用[D];山東大學(xué);2016年

,

本文編號:1757913

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/1757913.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶c0a1a***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com