中國英語新詞語料庫構(gòu)建技術(shù)研究
發(fā)布時(shí)間:2021-08-25 10:59
隨著中國英語新詞大量出現(xiàn),缺少中國英語新詞語料庫成為研究中國英語的主要障礙,新詞識別是建設(shè)語料庫主要的技術(shù)問題。針對現(xiàn)有的點(diǎn)互信息和鄰接熵新詞識別算法中的詞內(nèi)部凝聚度低,及點(diǎn)互信息單閾值設(shè)置存在較多高閾值無效詞組,且低閾值新詞組無法識別的問題,提出了改進(jìn)多字點(diǎn)互信息和鄰接熵中國英語新詞識別算法。利用多字點(diǎn)互信息以及點(diǎn)互信息雙閾值的設(shè)定來識別新詞。實(shí)驗(yàn)結(jié)果表明,相同數(shù)據(jù)和實(shí)驗(yàn)環(huán)境下,該方法提高了準(zhǔn)確率、召回率和F值,對語料庫建設(shè)是有效可行的。
【文章來源】:計(jì)算機(jī)工程與應(yīng)用. 2020,56(16)北大核心CSCD
【文章頁數(shù)】:4 頁
【參考文獻(xiàn)】:
期刊論文
[1]近十五年國內(nèi)英語詞匯學(xué)習(xí)策略的文獻(xiàn)計(jì)量分析[J]. 鄭已東,郭艷珍. 兵團(tuán)教育學(xué)院學(xué)報(bào). 2018(03)
[2]基于改進(jìn)互信息和鄰接熵的微博新詞發(fā)現(xiàn)方法[J]. 夭榮朋,許國艷,宋健. 計(jì)算機(jī)應(yīng)用. 2016(10)
[3]A novel unsupervised method for new word extraction[J]. Lili MEI,Heyan HUANG,Xiaochi WEI,Xianling MAO. Science China(Information Sciences). 2016(09)
[4]中文植物物種多樣性描述文本的信息抽取研究[J]. 段宇鋒,黃思思. 現(xiàn)代圖書情報(bào)技術(shù). 2016(01)
[5]基于詞內(nèi)部結(jié)合度和邊界自由度的新詞發(fā)現(xiàn)[J]. 李文坤,張仰森,陳若愚. 計(jì)算機(jī)應(yīng)用研究. 2015(08)
[6]順應(yīng)論視角下的“中國英語詞匯”[J]. 李瑞棉,承紅. 海外英語. 2015(02)
[7]Geliable Lexical Borrowings in China English on the Internet[J]. 付雪芬,程金花. 海外英語. 2012(21)
[8]面向術(shù)語抽取的雙閾值互信息過濾方法[J]. 陳士超,郁濱. 計(jì)算機(jī)應(yīng)用. 2011(04)
[9]英語全球化、本土化視野中的中國英語[J]. 李少華. 寧夏大學(xué)學(xué)報(bào)(人文社會(huì)科學(xué)版). 2005(04)
碩士論文
[1]中文新詞檢測與分析[D]. 崔世起.中國科學(xué)院研究生院(計(jì)算技術(shù)研究所) 2006
本文編號:3361989
【文章來源】:計(jì)算機(jī)工程與應(yīng)用. 2020,56(16)北大核心CSCD
【文章頁數(shù)】:4 頁
【參考文獻(xiàn)】:
期刊論文
[1]近十五年國內(nèi)英語詞匯學(xué)習(xí)策略的文獻(xiàn)計(jì)量分析[J]. 鄭已東,郭艷珍. 兵團(tuán)教育學(xué)院學(xué)報(bào). 2018(03)
[2]基于改進(jìn)互信息和鄰接熵的微博新詞發(fā)現(xiàn)方法[J]. 夭榮朋,許國艷,宋健. 計(jì)算機(jī)應(yīng)用. 2016(10)
[3]A novel unsupervised method for new word extraction[J]. Lili MEI,Heyan HUANG,Xiaochi WEI,Xianling MAO. Science China(Information Sciences). 2016(09)
[4]中文植物物種多樣性描述文本的信息抽取研究[J]. 段宇鋒,黃思思. 現(xiàn)代圖書情報(bào)技術(shù). 2016(01)
[5]基于詞內(nèi)部結(jié)合度和邊界自由度的新詞發(fā)現(xiàn)[J]. 李文坤,張仰森,陳若愚. 計(jì)算機(jī)應(yīng)用研究. 2015(08)
[6]順應(yīng)論視角下的“中國英語詞匯”[J]. 李瑞棉,承紅. 海外英語. 2015(02)
[7]Geliable Lexical Borrowings in China English on the Internet[J]. 付雪芬,程金花. 海外英語. 2012(21)
[8]面向術(shù)語抽取的雙閾值互信息過濾方法[J]. 陳士超,郁濱. 計(jì)算機(jī)應(yīng)用. 2011(04)
[9]英語全球化、本土化視野中的中國英語[J]. 李少華. 寧夏大學(xué)學(xué)報(bào)(人文社會(huì)科學(xué)版). 2005(04)
碩士論文
[1]中文新詞檢測與分析[D]. 崔世起.中國科學(xué)院研究生院(計(jì)算技術(shù)研究所) 2006
本文編號:3361989
本文鏈接:http://www.sikaile.net/waiyulunwen/waiguoyuyanwenhua/3361989.html
最近更新
教材專著