基于SVR模型的中文領(lǐng)域術(shù)語自動(dòng)抽取研究——面向圖書情報(bào)領(lǐng)域
本文關(guān)鍵詞:基于SVR模型的中文領(lǐng)域術(shù)語自動(dòng)抽取研究——面向圖書情報(bào)領(lǐng)域
更多相關(guān)文章: 支持向量回歸機(jī) 本體構(gòu)建 本體學(xué)習(xí) 術(shù)語抽取
【摘要】:[目的/意義]術(shù)語是本體的重要組成部分,術(shù)語自動(dòng)抽取是本體自動(dòng)構(gòu)建的基礎(chǔ),文章采用回歸的方法對(duì)未登錄詞進(jìn)行概率(某個(gè)數(shù)值(組合)對(duì)應(yīng)的候選詞集合中術(shù)語的概率)預(yù)測(cè),獲得該詞可能為術(shù)語的概率。[方法/過程]文章結(jié)合語言學(xué)和統(tǒng)計(jì)方法,通過構(gòu)建術(shù)語庫提取術(shù)語抽取模板來抽取候選術(shù)語,此外,通過引入回歸的方法,將術(shù)語抽取問題轉(zhuǎn)化為對(duì)詞語成為術(shù)語的概率的預(yù)測(cè)問題。[結(jié)果/結(jié)論]提出的方法最后通過實(shí)驗(yàn)驗(yàn)證了其有效性。
【作者單位】: 南京大學(xué)信息管理學(xué)院;
【關(guān)鍵詞】: 支持向量回歸機(jī) 本體構(gòu)建 本體學(xué)習(xí) 術(shù)語抽取
【基金】:國家社會(huì)科學(xué)基金重大招標(biāo)項(xiàng)目“面向?qū)W科領(lǐng)域的網(wǎng)絡(luò)信息資源深度聚合與服務(wù)研究”的成果,項(xiàng)目編號(hào):12&ZD221
【分類號(hào)】:TP391.1
【正文快照】: 術(shù)語是本體構(gòu)建的基本元素,術(shù)語抽取是本體學(xué)習(xí)中最基本也是至關(guān)重要的一步,在自然語言處理領(lǐng)域(機(jī)器翻譯、信息檢索等)也有著很高的價(jià)值。術(shù)語抽取是從領(lǐng)域文本中自動(dòng)識(shí)別出與領(lǐng)域相關(guān)的有特殊意義的專業(yè)詞匯,術(shù)語主要存在以下兩個(gè)特點(diǎn):1領(lǐng)域性,術(shù)語與某一特定領(lǐng)域相關(guān),表達(dá)
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 程斌;張水茂;;基于統(tǒng)計(jì)與規(guī)則的術(shù)語抽取[J];科技廣場(chǎng);2009年09期
2 杜波,田懷鳳,王立,陸汝占;基于多策略的專業(yè)領(lǐng)域術(shù)語抽取器的設(shè)計(jì)[J];計(jì)算機(jī)工程;2005年14期
3 胡文敏;何婷婷;張勇;;基于卡方檢驗(yàn)的漢語術(shù)語抽取[J];計(jì)算機(jī)應(yīng)用;2007年12期
4 周浪;馮沖;黃河燕;;一種面向術(shù)語抽取的短語過濾技術(shù)[J];計(jì)算機(jī)工程與應(yīng)用;2009年19期
5 康小麗;章成志;王惠臨;;基于可比語料庫的雙語術(shù)語抽取研究述評(píng)[J];現(xiàn)代圖書情報(bào)技術(shù);2009年10期
6 許德山;張智雄;王峰;邢美鳳;;上下文分析與統(tǒng)計(jì)特征相結(jié)合的英文術(shù)語抽取研究[J];現(xiàn)代圖書情報(bào)技術(shù);2010年12期
7 劉里;劉小明;;基于分隔符和上下文術(shù)語的領(lǐng)域現(xiàn)象術(shù)語抽取[J];華南理工大學(xué)學(xué)報(bào)(自然科學(xué)版);2011年07期
8 唐濤;周俏麗;張桂平;;統(tǒng)計(jì)與規(guī)則相結(jié)合的術(shù)語抽取[J];沈陽航空航天大學(xué)學(xué)報(bào);2011年05期
9 鐘玉峰;;基于平行語料庫的文獻(xiàn)術(shù)語抽取研究[J];黑龍江工程學(xué)院學(xué)報(bào)(自然科學(xué)版);2011年04期
10 湯青;呂學(xué)強(qiáng);李卓;施水才;;領(lǐng)域本體術(shù)語抽取研究[J];現(xiàn)代圖書情報(bào)技術(shù);2014年01期
中國重要會(huì)議論文全文數(shù)據(jù)庫 前2條
1 章成志;王惠臨;;基于專業(yè)領(lǐng)域平行語料的雙語核心術(shù)語抽取研究[A];中國計(jì)算機(jī)語言學(xué)研究前沿進(jìn)展(2007-2009)[C];2009年
2 寧海燕;劉秉權(quán);張德園;劉遠(yuǎn)超;王曉龍;;基于統(tǒng)計(jì)的中文領(lǐng)域術(shù)語自動(dòng)抽取方法的比較研究[A];第五屆全國信息檢索學(xué)術(shù)會(huì)議論文集[C];2009年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前2條
1 周浪;中文術(shù)語抽取若干問題研究[D];南京理工大學(xué);2010年
2 肖奕;地質(zhì)數(shù)據(jù)信息服務(wù)參考模型及關(guān)鍵技術(shù)研究[D];中國地質(zhì)大學(xué)(北京);2013年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前8條
1 李丹;特定領(lǐng)域中文術(shù)語抽取[D];大連理工大學(xué);2011年
2 田俊瑋;軍事領(lǐng)域中文術(shù)語抽取的研究[D];大連理工大學(xué);2013年
3 趙欣;基于最大熵的中文術(shù)語抽取系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];西安電子科技大學(xué);2012年
4 段國成;基于CCD的術(shù)語抽取研究[D];鄭州大學(xué);2007年
5 唐濤;面向特定領(lǐng)域的中文分詞技術(shù)的研究[D];沈陽航空航天大學(xué);2012年
6 譚龍;領(lǐng)域文本術(shù)語抽取與語義概念圖構(gòu)建模型研究[D];華東交通大學(xué);2014年
7 姚賢明;領(lǐng)域概念自動(dòng)抽取研究[D];昆明理工大學(xué);2010年
8 劉颯;專業(yè)領(lǐng)域可比語料的構(gòu)建與評(píng)價(jià)研究[D];南京理工大學(xué);2012年
,本文編號(hào):593380
本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/593380.html