天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 外語論文 > 外語文化論文 >

中國英語新詞語料庫構(gòu)建技術(shù)研究

發(fā)布時(shí)間:2021-08-25 10:59
  隨著中國英語新詞大量出現(xiàn),缺少中國英語新詞語料庫成為研究中國英語的主要障礙,新詞識別是建設(shè)語料庫主要的技術(shù)問題。針對現(xiàn)有的點(diǎn)互信息和鄰接熵新詞識別算法中的詞內(nèi)部凝聚度低,及點(diǎn)互信息單閾值設(shè)置存在較多高閾值無效詞組,且低閾值新詞組無法識別的問題,提出了改進(jìn)多字點(diǎn)互信息和鄰接熵中國英語新詞識別算法。利用多字點(diǎn)互信息以及點(diǎn)互信息雙閾值的設(shè)定來識別新詞。實(shí)驗(yàn)結(jié)果表明,相同數(shù)據(jù)和實(shí)驗(yàn)環(huán)境下,該方法提高了準(zhǔn)確率、召回率和F值,對語料庫建設(shè)是有效可行的。 

【文章來源】:計(jì)算機(jī)工程與應(yīng)用. 2020,56(16)北大核心CSCD

【文章頁數(shù)】:4 頁

【參考文獻(xiàn)】:
期刊論文
[1]近十五年國內(nèi)英語詞匯學(xué)習(xí)策略的文獻(xiàn)計(jì)量分析[J]. 鄭已東,郭艷珍.  兵團(tuán)教育學(xué)院學(xué)報(bào). 2018(03)
[2]基于改進(jìn)互信息和鄰接熵的微博新詞發(fā)現(xiàn)方法[J]. 夭榮朋,許國艷,宋健.  計(jì)算機(jī)應(yīng)用. 2016(10)
[3]A novel unsupervised method for new word extraction[J]. Lili MEI,Heyan HUANG,Xiaochi WEI,Xianling MAO.  Science China(Information Sciences). 2016(09)
[4]中文植物物種多樣性描述文本的信息抽取研究[J]. 段宇鋒,黃思思.  現(xiàn)代圖書情報(bào)技術(shù). 2016(01)
[5]基于詞內(nèi)部結(jié)合度和邊界自由度的新詞發(fā)現(xiàn)[J]. 李文坤,張仰森,陳若愚.  計(jì)算機(jī)應(yīng)用研究. 2015(08)
[6]順應(yīng)論視角下的“中國英語詞匯”[J]. 李瑞棉,承紅.  海外英語. 2015(02)
[7]Geliable Lexical Borrowings in China English on the Internet[J]. 付雪芬,程金花.  海外英語. 2012(21)
[8]面向術(shù)語抽取的雙閾值互信息過濾方法[J]. 陳士超,郁濱.  計(jì)算機(jī)應(yīng)用. 2011(04)
[9]英語全球化、本土化視野中的中國英語[J]. 李少華.  寧夏大學(xué)學(xué)報(bào)(人文社會(huì)科學(xué)版). 2005(04)

碩士論文
[1]中文新詞檢測與分析[D]. 崔世起.中國科學(xué)院研究生院(計(jì)算技術(shù)研究所) 2006



本文編號:3361989

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/waiyulunwen/waiguoyuyanwenhua/3361989.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶655b9***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請E-mail郵箱bigeng88@qq.com