統(tǒng)計(jì)與規(guī)則相結(jié)合的維吾爾語(yǔ)人名識(shí)別方法
[Abstract]:Named entity recognition (Named entity recognition,NER) is an important task in natural language processing (Natural language processing,NLP). In this paper, the Uygur words are split from stem, syllable and string according to the adhesive characteristics of Uygur language, and a smaller language unit is obtained. The new unit of segmentation is added to the conditional random field (Conditional random field, as a feature. In CRF, the effect of data sparsity is alleviated obviously, and the performance of the method is better than that of the human name recognition method based on words. At the same time, based on the characteristics of Han nationality names in Uygur language, a rule-based recognition method of Han nationality names in Uygur language is proposed. Finally, the accuracy of recognition is further improved by combining statistics with rules. The experimental results show that the accuracy, recall rate and F1 value of this method are 87.47% and 88.29% respectively.
【作者單位】: 新疆大學(xué)信息科學(xué)與工程學(xué)院;中國(guó)科學(xué)院自動(dòng)化研究所模式識(shí)別國(guó)家重點(diǎn)實(shí)驗(yàn)室;新疆大學(xué)軟件學(xué)院;
【基金】:國(guó)家自然科學(xué)基金(61562081) 新疆高技術(shù)研究發(fā)展計(jì)劃(201312103)資助~~
【分類號(hào)】:TP391.1
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 ;中央電臺(tái)新疆維吾爾語(yǔ)編輯部開工建設(shè)[J];中國(guó)廣播;2010年06期
2 盛朝川;;維吾爾語(yǔ)專線廣播[J];新聞?dòng)浾?1984年03期
3 艾山·吾買爾;吐爾根·依步拉音;;基于最大熵的維吾爾語(yǔ)句子邊界識(shí)別模型[J];計(jì)算機(jī)工程;2010年06期
4 王昆侖;張貫虹;吐爾洪江·阿布都克力木;;維吾爾語(yǔ)元音的聲頻特性分析和識(shí)別[J];中文信息學(xué)報(bào);2010年02期
5 地里木拉提.吐爾遜;艾斯卡爾.艾木都拉;;維吾爾語(yǔ)中清化元音的實(shí)驗(yàn)語(yǔ)音學(xué)研究[J];中文信息學(xué)報(bào);2010年05期
6 丁玉忠;吾守爾·斯拉木;那斯?fàn)柦ね聽栠d;;基于垃圾模型的維吾爾語(yǔ)關(guān)鍵詞識(shí)別[J];現(xiàn)代計(jì)算機(jī)(專業(yè)版);2011年13期
7 塔世根·加帕爾,帕爾哈提·艾孜木,伊力亞斯·吐爾遜;維吾爾語(yǔ)地理學(xué)術(shù)語(yǔ)規(guī)范表達(dá)的必要性和緊迫性[J];術(shù)語(yǔ)標(biāo)準(zhǔn)化與信息技術(shù);1998年04期
8 阿麗葉.阿布列孜;;中央人民廣播電臺(tái)維吾爾語(yǔ)頻道《生活》欄目探析[J];新聞世界;2014年05期
9 哈妮克孜·伊拉洪;祖麗皮亞·阿曼;艾斯卡爾·艾木都拉;;維吾爾語(yǔ)單音節(jié)詞復(fù)輔音聲學(xué)分析[J];中文信息學(xué)報(bào);2009年04期
10 劉改霞;;從《維吾爾語(yǔ)會(huì)話300句速成》談選題策劃的特性[J];新疆新聞出版;2010年05期
相關(guān)會(huì)議論文 前10條
1 吾買爾江·庫(kù)爾班;阿里甫·庫(kù)爾班;;維吾爾語(yǔ)框架語(yǔ)義知識(shí)庫(kù)語(yǔ)義角色描述體系研究[A];少數(shù)民族青年自然語(yǔ)言處理技術(shù)研究與進(jìn)展——第三屆全國(guó)少數(shù)民族青年自然語(yǔ)言信息處理、第二屆全國(guó)多語(yǔ)言知識(shí)庫(kù)建設(shè)聯(lián)合學(xué)術(shù)研討會(huì)論文集[C];2010年
2 阿里甫·庫(kù)爾班;吾買爾江·庫(kù)爾班;尼加提·阿不都肉蘇力;;維吾爾語(yǔ)框架語(yǔ)義網(wǎng)的數(shù)據(jù)庫(kù)結(jié)構(gòu)的設(shè)計(jì)[A];少數(shù)民族青年自然語(yǔ)言處理技術(shù)研究與進(jìn)展——第三屆全國(guó)少數(shù)民族青年自然語(yǔ)言信息處理、第二屆全國(guó)多語(yǔ)言知識(shí)庫(kù)建設(shè)聯(lián)合學(xué)術(shù)研討會(huì)論文集[C];2010年
3 古麗娜爾·艾力;買買提玉素甫·蘇來曼;;維吾爾語(yǔ)語(yǔ)音數(shù)據(jù)自動(dòng)標(biāo)注[A];少數(shù)民族青年自然語(yǔ)言處理技術(shù)研究與進(jìn)展——第三屆全國(guó)少數(shù)民族青年自然語(yǔ)言信息處理、第二屆全國(guó)多語(yǔ)言知識(shí)庫(kù)建設(shè)聯(lián)合學(xué)術(shù)研討會(huì)論文集[C];2010年
4 阿布都熱依木·熱合曼;艾山·吾買爾;吐爾根·依布拉音;帕里旦·吐爾遜;哈里旦木·阿布都克里木;;維吾爾語(yǔ)句法樹庫(kù)標(biāo)注體系[A];少數(shù)民族青年自然語(yǔ)言處理技術(shù)研究與進(jìn)展——第三屆全國(guó)少數(shù)民族青年自然語(yǔ)言信息處理、第二屆全國(guó)多語(yǔ)言知識(shí)庫(kù)建設(shè)聯(lián)合學(xué)術(shù)研討會(huì)論文集[C];2010年
5 艾斯卡爾·艾木都拉;;維吾爾語(yǔ)鼻音的聲學(xué)特征分析[A];第九屆中國(guó)語(yǔ)音學(xué)學(xué)術(shù)會(huì)議論文集[C];2010年
6 梁潔;楊新璐;;維吾爾語(yǔ)韻律層級(jí)邊界感知及其聲學(xué)特征研究[A];第九屆中國(guó)語(yǔ)音學(xué)學(xué)術(shù)會(huì)議論文集[C];2010年
7 阿依克孜.卡德爾;開沙爾.卡德爾;吐爾根.依布拉音;;面向自然語(yǔ)言信息處理的維吾爾語(yǔ)名詞形態(tài)分析研究[A];第二屆全國(guó)學(xué)生計(jì)算語(yǔ)言學(xué)研討會(huì)論文集[C];2004年
8 吾守爾.斯拉木;馬歡;;維吾爾語(yǔ)文語(yǔ)轉(zhuǎn)換系統(tǒng)的研究[A];第十屆全國(guó)少數(shù)民族語(yǔ)言文字信息處理學(xué)術(shù)研討會(huì)論文集[C];2005年
9 易斌;;維吾爾語(yǔ)元音/y/的聲學(xué)特征分析[A];第十屆全國(guó)少數(shù)民族語(yǔ)言文字信息處理學(xué)術(shù)研討會(huì)論文集[C];2005年
10 艾斯卡爾·艾木都拉;賽爾達(dá)爾·雅力坤;祖麗皮亞·阿曼;地里木拉提·吐爾遜;;維吾爾語(yǔ)濁塞音的聲學(xué)特征分析[A];第十二屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議(NCMMSC'2013)論文集[C];2013年
相關(guān)重要報(bào)紙文章 前10條
1 記者井波、實(shí)習(xí)生郁萌;維吾爾語(yǔ)水平考試系統(tǒng)進(jìn)入研發(fā)階段[N];新疆日?qǐng)?bào)(漢);2010年
2 特約記者 藺高峰 通訊員 武瑞;女法醫(yī)“西日古麗”[N];喀什日?qǐng)?bào)(漢);2010年
3 本報(bào)記者 任紅芳;阿克蘇電視臺(tái)維吾爾語(yǔ)譯制中心錄音棚投用[N];阿克蘇日?qǐng)?bào);2010年
4 一東;以多語(yǔ)種服務(wù)打造溝通新渠道[N];亞洲中心時(shí)報(bào)(漢);2011年
5 自治區(qū)地方志編委會(huì)、自治區(qū)黨委駐伽師縣工作隊(duì) 張堅(jiān)義;語(yǔ)言架起溝通心靈的橋梁[N];新疆日?qǐng)?bào)(漢);2012年
6 劉冰;從王蒙流利的維吾爾語(yǔ)想到的[N];中國(guó)民族報(bào);2013年
7 記者 江亞平;搞分裂慌不擇言,熱比婭謊話連篇[N];新華每日電訊;2009年
8 陳學(xué)迅;王蒙談維吾爾民族語(yǔ)言文化[N];新疆日?qǐng)?bào)(漢);2005年
9 記者 王新紅;中央人民廣播電臺(tái)新疆維吾爾語(yǔ)編輯部工程開建[N];新疆日?qǐng)?bào)(漢);2010年
10 記者 達(dá)·照日格圖;我國(guó)首部蒙古文字手機(jī)研制成功[N];內(nèi)蒙古日?qǐng)?bào)(漢);2006年
相關(guān)博士學(xué)位論文 前10條
1 阿布都那扎爾·阿布都拉;維吾爾語(yǔ)構(gòu)詞詞綴歷時(shí)比較研究[D];中央民族大學(xué);2009年
2 巴克力·阿卜杜熱西提;古代維吾爾語(yǔ)醫(yī)學(xué)文獻(xiàn)的語(yǔ)文學(xué)研究[D];中央民族大學(xué);2013年
3 倪宏鳴;維吾爾語(yǔ)和阿美語(yǔ)語(yǔ)言特征對(duì)比分析[D];中央民族大學(xué);2007年
4 魏玉清;維吾爾語(yǔ)和諧現(xiàn)象的音系學(xué)研究[D];華東師范大學(xué);2010年
5 尼加提·蘇皮;維吾爾語(yǔ)伊犁土語(yǔ)研究[D];中央民族大學(xué);2010年
6 斯迪克江·伊布拉音;現(xiàn)代維吾爾語(yǔ)中的比喻研究[D];華東師范大學(xué);2008年
7 阿克里·先木西;維吾爾語(yǔ)表語(yǔ)—系動(dòng)詞謂語(yǔ)結(jié)構(gòu)[D];中央民族大學(xué);2012年
8 吐爾遜·卡得;維吾爾語(yǔ)柯坪土語(yǔ)研究[D];中央民族大學(xué);2011年
9 木再帕爾(Muzappar Abdurusul);論維吾爾語(yǔ)的名詞化短語(yǔ)[D];中央民族大學(xué);2007年
10 席艷玲;維吾爾語(yǔ)失語(yǔ)癥特點(diǎn)及其檢查法的標(biāo)準(zhǔn)化研究和維吾爾族、漢族正常人腦激活區(qū)差異性的fMRI研究[D];新疆醫(yī)科大學(xué);2013年
相關(guān)碩士學(xué)位論文 前10條
1 魏文娟;改革開放以來維吾爾語(yǔ)新詞研究[D];新疆大學(xué);2008年
2 阿孜古麗·阿不都熱西提;維吾爾語(yǔ)伊犁土語(yǔ)中的借詞研究[D];西北民族大學(xué);2008年
3 張紅;探析維吾爾語(yǔ)中茶文化[D];新疆師范大學(xué);2012年
4 熱依拉·艾紕漏拉;漢語(yǔ)—維吾爾語(yǔ)顏色詞翻譯對(duì)比研究[D];中央民族大學(xué);2013年
5 孔席梅;維吾爾語(yǔ)和回族話中借詞的分析比較[D];新疆師范大學(xué);2013年
6 吾斯曼·艾買爾(Osman Emer);《五體清文鑒》中的近代維吾爾語(yǔ)動(dòng)物名稱研究[D];伊犁師范學(xué)院;2015年
7 瑪依熱·吾司曼;漢維動(dòng)力情態(tài)對(duì)比研究[D];中央民族大學(xué);2015年
8 錢悅;漢語(yǔ)“V1著V2”結(jié)構(gòu)與維吾爾語(yǔ)相關(guān)表達(dá)方式對(duì)比研究[D];中央民族大學(xué);2015年
9 奇曼古麗·許庫(kù)力;現(xiàn)代維吾爾語(yǔ)同義詞研究[D];中央民族大學(xué);2015年
10 田媛瑋;漢語(yǔ)—維吾爾語(yǔ)五官詞匯的對(duì)比研究[D];中央民族大學(xué);2015年
,本文編號(hào):2341429
本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/2341429.html