天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 軟件論文 >

基于鏈?zhǔn)綏l件隨機(jī)場的中文分詞改進(jìn)方法

發(fā)布時(shí)間:2017-10-25 23:33

  本文關(guān)鍵詞:基于鏈?zhǔn)綏l件隨機(jī)場的中文分詞改進(jìn)方法


  更多相關(guān)文章: 中文分詞 詞位標(biāo)注 條件隨機(jī)場 特征模板


【摘要】:基于鏈?zhǔn)綏l件隨機(jī)場模型的序列標(biāo)注中文分詞方法隨著中文分詞評(píng)測Bakeoff的展開得到廣泛應(yīng)用。詞位標(biāo)注集和特征模板集對(duì)該模型的學(xué)習(xí)至關(guān)重要,但當(dāng)前的研究大多采用單一的標(biāo)注集和特征模板集進(jìn)行實(shí)驗(yàn),缺乏標(biāo)注集和特征模板集結(jié)合的嘗試,使得中文分詞中未登錄詞識(shí)別率不高,從而影響互聯(lián)網(wǎng)領(lǐng)域語料的分詞效果。首次采用六詞位標(biāo)注集結(jié)合TMPT-10和TMPT-10`特征模板,并與常見標(biāo)注集和特征模板集的組合在Bakeoff語料上進(jìn)行實(shí)驗(yàn)對(duì)比,結(jié)果表明,改進(jìn)的方法 6tag-tmpt10取得更好的未登錄詞召回率,在互聯(lián)網(wǎng)領(lǐng)域中文分詞能取得很好的效果;同時(shí)在F值上也與其他最好結(jié)果相當(dāng)。
【作者單位】: 中國科學(xué)院上海高等研究院航空通訊技術(shù)聯(lián)合實(shí)驗(yàn)室;中國科學(xué)院大學(xué);上海大學(xué)通信與信息工程學(xué)院;
【關(guān)鍵詞】中文分詞 詞位標(biāo)注 條件隨機(jī)場 特征模板
【基金】:國家自然科學(xué)基金項(xiàng)目(61471231)
【分類號(hào)】:TP391.1
【正文快照】: 0引言 在基于中文的自然語言處理中,由于不像英文中詞與詞之間有固定的自然分界符,因此對(duì)中文進(jìn)行分詞通常是中文信息處理任務(wù)中最基礎(chǔ)的任務(wù);同時(shí)由于中文自身的復(fù)雜性,中文分詞也一直是中文信息處理任務(wù)的難題。中文分詞是進(jìn)行詞性標(biāo)注、命名實(shí)體識(shí)別、關(guān)鍵詞提取和文本聚

【相似文獻(xiàn)】

中國期刊全文數(shù)據(jù)庫 前10條

1 張茂元,盧正鼎,鄒春燕;一種基于語境的中文分詞方法研究[J];小型微型計(jì)算機(jī)系統(tǒng);2005年01期

2 程傳鵬;;一種簡單高效的中文分詞方法[J];鄭州輕工業(yè)學(xué)院學(xué)報(bào);2006年03期

3 張博;姜建國;萬平國;;對(duì)互聯(lián)網(wǎng)環(huán)境下中文分詞系統(tǒng)的一種架構(gòu)改進(jìn)[J];計(jì)算機(jī)應(yīng)用研究;2006年11期

4 夏新松;肖建國;;一種新的錯(cuò)誤驅(qū)動(dòng)學(xué)習(xí)方法在中文分詞中的應(yīng)用[J];計(jì)算機(jī)科學(xué);2006年03期

5 周軍;王艷紅;;一種基于詞典的中文分詞法的設(shè)計(jì)與實(shí)現(xiàn)[J];黑龍江科技信息;2008年25期

6 許高建;胡學(xué)鋼;路遙;王慶人;;一種改進(jìn)的中文分詞歧義消除算法研究[J];合肥工業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版);2008年10期

7 張培穎;;運(yùn)用有向圖進(jìn)行中文分詞研究[J];計(jì)算機(jī)工程與應(yīng)用;2009年22期

8 吳晶晶;荊繼武;聶曉峰;王平建;;一種快速中文分詞詞典機(jī)制[J];中國科學(xué)院研究生院學(xué)報(bào);2009年05期

9 袁健;張勁松;馬良;;二次回溯中文分詞方法[J];計(jì)算機(jī)應(yīng)用研究;2009年09期

10 劉智文;;利用系統(tǒng)整合提高中文分詞精度的方法研究[J];現(xiàn)代計(jì)算機(jī)(專業(yè)版);2009年10期

中國重要會(huì)議論文全文數(shù)據(jù)庫 前10條

1 王敏;葉寬余;薛峰;;一種面向網(wǎng)店商品搜索的中文分詞系統(tǒng)設(shè)計(jì)[A];全國第22屆計(jì)算機(jī)技術(shù)與應(yīng)用學(xué)術(shù)會(huì)議(CACIS·2011)暨全國第3屆安全關(guān)鍵技術(shù)與應(yīng)用(SCA·2011)學(xué)術(shù)會(huì)議論文摘要集[C];2011年

2 黃昌寧;趙海;;由字構(gòu)詞——中文分詞新方法[A];中文信息處理前沿進(jìn)展——中國中文信息學(xué)會(huì)二十五周年學(xué)術(shù)會(huì)議論文集[C];2006年

3 任飛亮;石磊;姚天順;;應(yīng)用支持向量機(jī)進(jìn)行中文分詞[A];全國第八屆計(jì)算語言學(xué)聯(lián)合學(xué)術(shù)會(huì)議(JSCL-2005)論文集[C];2005年

4 吳晶晶;荊繼武;王平建;;一種基于詞典的新型中文分詞機(jī)制[A];全國網(wǎng)絡(luò)與信息安全技術(shù)研討會(huì)論文集(上冊)[C];2007年

5 李玉梅;靳光瑾;黃昌寧;;中文分詞規(guī)范中的歧義字段消解細(xì)則[A];第五屆全國語言文字應(yīng)用學(xué)術(shù)研討會(huì)論文集[C];2007年

6 修馳;宋柔;;基于“大詞”實(shí)例的中文分詞研究[A];中國計(jì)算語言學(xué)研究前沿進(jìn)展(2009-2011)[C];2011年

7 黃居仁;;瓶頸,挑戰(zhàn),與轉(zhuǎn)機(jī):中文分詞研究的新思維[A];中國計(jì)算機(jī)語言學(xué)研究前沿進(jìn)展(2007-2009)[C];2009年

8 趙海;揭春雨;;基于子串標(biāo)注的中文分詞:尋找更佳的標(biāo)注單元[A];內(nèi)容計(jì)算的研究與應(yīng)用前沿——第九屆全國計(jì)算語言學(xué)學(xué)術(shù)會(huì)議論文集[C];2007年

9 李壽山;黃居仁;;基于詞邊界分類的中文分詞方法[A];中國計(jì)算機(jī)語言學(xué)研究前沿進(jìn)展(2007-2009)[C];2009年

10 張梅山;鄧知龍;車萬翔;劉挺;;統(tǒng)計(jì)與詞典相結(jié)合的領(lǐng)域自適應(yīng)中文分詞[A];中國計(jì)算語言學(xué)研究前沿進(jìn)展(2009-2011)[C];2011年

中國重要報(bào)紙全文數(shù)據(jù)庫 前2條

1 本報(bào)記者 張彤;讓計(jì)算機(jī)說中國話[N];網(wǎng)絡(luò)世界;2004年

2 清華大學(xué)IT可用性實(shí)驗(yàn)室;2005中文搜索引擎質(zhì)量對(duì)比[N];計(jì)算機(jī)世界;2005年

中國博士學(xué)位論文全文數(shù)據(jù)庫 前4條

1 奚寧;統(tǒng)計(jì)機(jī)器翻譯中的中文分詞策略研究[D];南京大學(xué);2013年

2 修馳;適應(yīng)于不同領(lǐng)域的中文分詞方法研究與實(shí)現(xiàn)[D];北京工業(yè)大學(xué);2013年

3 何嘉;基于遺傳算法優(yōu)化的中文分詞研究[D];電子科技大學(xué);2012年

4 李志國;面向分布式文本知識(shí)管理的中文分詞與文本分類研究[D];重慶大學(xué);2008年

中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條

1 顧輝;基于中文分詞的購物中心微信平臺(tái)購物導(dǎo)航的設(shè)計(jì)與實(shí)現(xiàn)[D];華中師范大學(xué);2015年

2 韓冰;基于感知器算法的中文分詞增量系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D];哈爾濱工業(yè)大學(xué);2015年

3 杜麗萍;基于互聯(lián)網(wǎng)海量語料的新詞發(fā)現(xiàn)研究及中文分詞系統(tǒng)改進(jìn)[D];西安郵電大學(xué);2015年

4 周祺;基于統(tǒng)計(jì)與詞典相結(jié)合的中文分詞的研究與實(shí)現(xiàn)[D];哈爾濱工業(yè)大學(xué);2015年

5 梁喜濤;基于主動(dòng)學(xué)習(xí)的中文分詞方法研究[D];南京郵電大學(xué);2015年

6 楊淦;基于條件隨機(jī)場模型的中文分詞系統(tǒng)研究與實(shí)現(xiàn)[D];重慶大學(xué);2015年

7 朱云杰;大數(shù)據(jù)環(huán)境下垃圾評(píng)論過濾系統(tǒng)的研究與實(shí)現(xiàn)[D];東南大學(xué);2015年

8 呂先超;視障漢語轉(zhuǎn)換軟件SunBraille的設(shè)計(jì)實(shí)現(xiàn)[D];蘭州大學(xué);2016年

9 黃積楊;基于雙向LSTMN神經(jīng)網(wǎng)絡(luò)的中文分詞研究分析[D];南京大學(xué);2016年

10 梁科;面向中醫(yī)醫(yī)案的數(shù)據(jù)挖掘技術(shù)研究及應(yīng)用[D];山東大學(xué);2016年



本文編號(hào):1096034

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/1096034.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶192b3***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com