基于特征提取算法的輔助機(jī)器翻譯系統(tǒng)設(shè)計(jì)與開(kāi)發(fā)
發(fā)布時(shí)間:2017-09-21 23:37
本文關(guān)鍵詞:基于特征提取算法的輔助機(jī)器翻譯系統(tǒng)設(shè)計(jì)與開(kāi)發(fā)
更多相關(guān)文章: 特征提取 翻譯系統(tǒng) 設(shè)計(jì)
【摘要】:隨著電子信息技術(shù)的發(fā)展,如何準(zhǔn)確、高效、快捷的將數(shù)據(jù)分類(lèi),已成為當(dāng)前的熱點(diǎn)問(wèn)題。本文設(shè)計(jì)了一種基于x2統(tǒng)計(jì)算法和規(guī)則判斷方法相結(jié)合的多特征提取方法,利用該多特征提取算法生成特征詞集,采用TF-IDF頻率算法生成文本特征向量,使用支持向量機(jī)(SVM)分類(lèi)器模型進(jìn)行文本分類(lèi)。并且為分類(lèi)系統(tǒng)設(shè)計(jì)了相應(yīng)的調(diào)用接口,保證了該分類(lèi)模塊的可用性。同時(shí)還設(shè)計(jì)了分類(lèi)詞庫(kù),保存各個(gè)類(lèi)別的獨(dú)有特征詞,用于優(yōu)先判斷待分類(lèi)文件的類(lèi)別。
【作者單位】: 內(nèi)蒙古大學(xué)外國(guó)語(yǔ)學(xué)院;
【關(guān)鍵詞】: 特征提取 翻譯系統(tǒng) 設(shè)計(jì)
【分類(lèi)號(hào)】:TP391.2
【正文快照】: 隨著電子信息技術(shù)的發(fā)展,越來(lái)越多的人開(kāi)始接觸網(wǎng)絡(luò),從網(wǎng)上獲取和交流各種信息。隨之而來(lái)的,就是對(duì)海量數(shù)據(jù)的處理。如何準(zhǔn)確高效的從大量數(shù)據(jù)中找到我們關(guān)心的信息已成為當(dāng)前自然語(yǔ)言處理領(lǐng)域的一大機(jī)遇和挑戰(zhàn)[1]。對(duì)于文本信息,傳統(tǒng)的人工分類(lèi)方法不但耗費(fèi)大量的人力和時(shí)間,
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 余成波;秦華鋒;;手指靜脈圖像特征提取算法的研究[J];計(jì)算機(jī)工程與應(yīng)用;2008年24期
2 周嬌;李端明;曹泰峰;;導(dǎo)彈圖像特征提取算法及系統(tǒng)架構(gòu)[J];兵工自動(dòng)化;2011年03期
3 毛建鑫;劉煒;侯秋華;孫紅彬;;一種改進(jìn)的水果特征提取算法[J];計(jì)算機(jī)工程與應(yīng)用;2013年06期
4 張向群;張旭;;基于二維判別局部排列的特征提取算法[J];計(jì)算機(jī)工程;2013年08期
5 王化U,
本文編號(hào):897551
本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/897551.html
最近更新
教材專(zhuān)著