融合多特征的老撾語人名地名命名實(shí)體識(shí)別
發(fā)布時(shí)間:2022-10-04 20:25
本文依據(jù)老撾語人名地名語言學(xué)中句法與詞法的相關(guān)特征,使用不同的算法進(jìn)行特征間的實(shí)現(xiàn)與融合,形成特定的老撾語人名地名命名實(shí)體識(shí)別模型。首先,依據(jù)老撾語地名特征,將有限個(gè)省份和國家詞語組建成詞典。其次使用Word2vec在較大規(guī)模的老撾語訓(xùn)練語料中,訓(xùn)練具有上下文語義特征信息的詞向量,依據(jù)老撾語人名地名的構(gòu)詞特征使用BLSTM進(jìn)行詞語字符級(jí)向量訓(xùn)練,將字符級(jí)特征向量和詞向量組合拼接成組合向量。將老撾語地名做狀語后置的句法特征,通過One-Hot算法進(jìn)行向量化,和組合向量進(jìn)行融合。再將完整的特征向量輸入到最后一層CRF中進(jìn)行命名實(shí)體識(shí)別訓(xùn)練,融合了多特征的老撾語命名實(shí)體識(shí)別模型,模型識(shí)別人名地名的準(zhǔn)確率、F值得到4%左右的提高。
【文章頁數(shù)】:4 頁
【部分圖文】:
老撾語地名的句法特征
老撾語人名的句法特征
老撾語人名地名命名實(shí)體識(shí)別模型
【參考文獻(xiàn)】:
期刊論文
[1]基于遷移學(xué)習(xí)和BiLSTM-CRF的中文命名實(shí)體識(shí)別[J]. 武惠,呂立,于碧輝. 小型微型計(jì)算機(jī)系統(tǒng). 2019(06)
[2]基于CRF和BI-LSTM的命名實(shí)體識(shí)別方法[J]. 柏兵,侯霞,石松. 北京信息科技大學(xué)學(xué)報(bào)(自然科學(xué)版). 2018(06)
[3]基于CRF和半監(jiān)督學(xué)習(xí)的維吾爾文命名實(shí)體識(shí)別[J]. 王路路,艾山·吾買爾,買合木提·買買提,卡哈爾江·阿比的熱西提,吐爾根·依布拉音. 中文信息學(xué)報(bào). 2018(11)
[4]基于LSTM-CRF命名實(shí)體識(shí)別技術(shù)的研究與應(yīng)用[J]. 張聰品,方滔,劉昱良. 計(jì)算機(jī)技術(shù)與發(fā)展. 2019(02)
[5]基于CNN-BLSTM-CRF模型的生物醫(yī)學(xué)命名實(shí)體識(shí)別[J]. 李麗雙,郭元?jiǎng)P. 中文信息學(xué)報(bào). 2018(01)
[6]基于BLSTM的命名實(shí)體識(shí)別方法[J]. 馮艷紅,于紅,孫庚,孫娟娟. 計(jì)算機(jī)科學(xué). 2018(02)
[7]基于極性轉(zhuǎn)移和LSTM遞歸網(wǎng)絡(luò)的情感分析[J]. 梁軍,柴玉梅,原慧斌,高明磊,昝紅英. 中文信息學(xué)報(bào). 2015(05)
[8]基于層疊隱馬爾可夫模型的中文命名實(shí)體識(shí)別[J]. 俞鴻魁,張華平,劉群,呂學(xué)強(qiáng),施水才. 通信學(xué)報(bào). 2006(02)
[9]一個(gè)統(tǒng)計(jì)與規(guī)則相結(jié)合的中文命名實(shí)體識(shí)別系統(tǒng)[J]. 向曉雯,史曉東,曾華琳. 計(jì)算機(jī)應(yīng)用. 2005(10)
碩士論文
[1]漢老雙語命名實(shí)體識(shí)別及對(duì)齊方法研究[D]. 韓銳.昆明理工大學(xué) 2018
[2]老撾語命名實(shí)體識(shí)別方法的研究[D]. 楊夢(mèng)杰.昆明理工大學(xué) 2016
本文編號(hào):3685702
【文章頁數(shù)】:4 頁
【部分圖文】:
老撾語地名的句法特征
老撾語人名的句法特征
老撾語人名地名命名實(shí)體識(shí)別模型
【參考文獻(xiàn)】:
期刊論文
[1]基于遷移學(xué)習(xí)和BiLSTM-CRF的中文命名實(shí)體識(shí)別[J]. 武惠,呂立,于碧輝. 小型微型計(jì)算機(jī)系統(tǒng). 2019(06)
[2]基于CRF和BI-LSTM的命名實(shí)體識(shí)別方法[J]. 柏兵,侯霞,石松. 北京信息科技大學(xué)學(xué)報(bào)(自然科學(xué)版). 2018(06)
[3]基于CRF和半監(jiān)督學(xué)習(xí)的維吾爾文命名實(shí)體識(shí)別[J]. 王路路,艾山·吾買爾,買合木提·買買提,卡哈爾江·阿比的熱西提,吐爾根·依布拉音. 中文信息學(xué)報(bào). 2018(11)
[4]基于LSTM-CRF命名實(shí)體識(shí)別技術(shù)的研究與應(yīng)用[J]. 張聰品,方滔,劉昱良. 計(jì)算機(jī)技術(shù)與發(fā)展. 2019(02)
[5]基于CNN-BLSTM-CRF模型的生物醫(yī)學(xué)命名實(shí)體識(shí)別[J]. 李麗雙,郭元?jiǎng)P. 中文信息學(xué)報(bào). 2018(01)
[6]基于BLSTM的命名實(shí)體識(shí)別方法[J]. 馮艷紅,于紅,孫庚,孫娟娟. 計(jì)算機(jī)科學(xué). 2018(02)
[7]基于極性轉(zhuǎn)移和LSTM遞歸網(wǎng)絡(luò)的情感分析[J]. 梁軍,柴玉梅,原慧斌,高明磊,昝紅英. 中文信息學(xué)報(bào). 2015(05)
[8]基于層疊隱馬爾可夫模型的中文命名實(shí)體識(shí)別[J]. 俞鴻魁,張華平,劉群,呂學(xué)強(qiáng),施水才. 通信學(xué)報(bào). 2006(02)
[9]一個(gè)統(tǒng)計(jì)與規(guī)則相結(jié)合的中文命名實(shí)體識(shí)別系統(tǒng)[J]. 向曉雯,史曉東,曾華琳. 計(jì)算機(jī)應(yīng)用. 2005(10)
碩士論文
[1]漢老雙語命名實(shí)體識(shí)別及對(duì)齊方法研究[D]. 韓銳.昆明理工大學(xué) 2018
[2]老撾語命名實(shí)體識(shí)別方法的研究[D]. 楊夢(mèng)杰.昆明理工大學(xué) 2016
本文編號(hào):3685702
本文鏈接:http://www.sikaile.net/waiyulunwen/zhichangyingyu/3685702.html
最近更新
教材專著