蒙古語文本自動(dòng)分類研究
發(fā)布時(shí)間:2021-04-29 23:49
隨著蒙古語信息技術(shù)的發(fā)展和蒙語文編碼國際標(biāo)準(zhǔn)的公布,蒙古語電子文本數(shù)量日益增多,依靠人工處理這些海量文本費(fèi)時(shí)費(fèi)力。針對(duì)這種情形,本研究創(chuàng)建了基于貝葉斯、支持向量機(jī)和神經(jīng)網(wǎng)絡(luò)等有監(jiān)督學(xué)習(xí)方法的文本分類系統(tǒng),并對(duì)這些算法的分類性能進(jìn)行了比較。本文由緒論、正文及總結(jié)等部分組成。緒論部分介紹了選題依據(jù)及研究意義、研究概況、研究數(shù)據(jù)與研究步驟等內(nèi)容。第一章說明了去噪、詞元化、去除停用詞和特征選擇等相關(guān)的文本預(yù)處理方面的工作。第二章論述了關(guān)于貝葉斯算法的原理和本研究中實(shí)施的基于貝葉斯算法的蒙古語文本自動(dòng)分類實(shí)驗(yàn)。第三章論述了支持向量機(jī)算法的原理和本研究中實(shí)施的基于支持向量機(jī)算法的蒙古語文本自動(dòng)分類實(shí)驗(yàn)。第四章論述了神經(jīng)網(wǎng)絡(luò)算法的原理及本研究所運(yùn)用的網(wǎng)絡(luò)模型結(jié)構(gòu),并介紹了本研究中實(shí)施的基于神經(jīng)網(wǎng)絡(luò)算法的蒙古語文本自動(dòng)分類實(shí)驗(yàn)。結(jié)論部分總結(jié)了全部研究過程及三個(gè)有監(jiān)督機(jī)器學(xué)習(xí)方法的運(yùn)行結(jié)果,并提出了今后需要改進(jìn)的工作。
【文章來源】:內(nèi)蒙古師范大學(xué)內(nèi)蒙古自治區(qū)
【文章頁數(shù)】:83 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
中文摘要
ABSTRACT
目錄
正文
參考文獻(xiàn)
附件
【參考文獻(xiàn)】:
期刊論文
[1]基于深度學(xué)習(xí)的文本分類研究進(jìn)展[J]. 劉婷婷,朱文東,劉廣一. 電力信息與通信技術(shù). 2018(03)
[2]詞元化處理在蒙古語文獻(xiàn)語料庫中的作用[J]. 金罡. 內(nèi)蒙古師范大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版). 2016(04)
[3]基于樸素貝葉斯的文本分類研究綜述[J]. 賀鳴,孫建軍,成穎. 情報(bào)科學(xué). 2016(07)
[4]蒙古文停用詞和英文停用詞比較研究[J]. 鞏政,關(guān)高娃. 中文信息學(xué)報(bào). 2011(04)
[5]高性能網(wǎng)絡(luò)爬蟲:研究綜述[J]. 周德懋,李舟軍. 計(jì)算機(jī)科學(xué). 2009(08)
[6]決策樹算法研究綜述[J]. 倪海鷗. 寧波廣播電視大學(xué)學(xué)報(bào). 2008(03)
[7]文本分類綜述[J]. 靳小波. 自動(dòng)化博覽. 2006(S1)
[8]主動(dòng)支持向量機(jī)的研究及其在蒙文文本分類中的應(yīng)用[J]. 賀慧,王俊義. 內(nèi)蒙古大學(xué)學(xué)報(bào)(自然科學(xué)版). 2006(05)
[9]KNN文本分類算法研究[J]. 楊麗華,戴齊,郭艷軍. 微計(jì)算機(jī)信息. 2006(21)
[10]中文停用詞表的自動(dòng)選取[J]. 顧益軍,樊孝忠,王建華,汪濤,黃維金. 北京理工大學(xué)學(xué)報(bào). 2005(04)
博士論文
[1]文本分類中若干問題研究[D]. 劉赫.吉林大學(xué) 2009
碩士論文
[1]文本分類中特征選擇和特征加權(quán)算法的研究與應(yīng)用[D]. 高聰.西安理工大學(xué) 2017
[2]文本分類中特征選擇方法研究—維吾爾語系[D]. 韓軍兵.新疆大學(xué) 2017
[3]文本分類停用詞處理和特征選擇技術(shù)研究[D]. 馬治濤.西安電子科技大學(xué) 2014
[4]蒙古文停用詞表和詞干提取對(duì)蒙古文文本分類的影響[D]. 阿雅娜.內(nèi)蒙古大學(xué) 2009
[5]基于改進(jìn)向量空間模型的郵件分類[D]. 廖玲.中南大學(xué) 2007
[6]蒙文文本分類技術(shù)研究與系統(tǒng)設(shè)計(jì)實(shí)現(xiàn)[D]. 蘇道.內(nèi)蒙古大學(xué) 2007
[7]基于主動(dòng)學(xué)習(xí)SVM的蒙文文本分類系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D]. 賀慧.內(nèi)蒙古大學(xué) 2006
本文編號(hào):3168418
【文章來源】:內(nèi)蒙古師范大學(xué)內(nèi)蒙古自治區(qū)
【文章頁數(shù)】:83 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
中文摘要
ABSTRACT
目錄
正文
參考文獻(xiàn)
附件
【參考文獻(xiàn)】:
期刊論文
[1]基于深度學(xué)習(xí)的文本分類研究進(jìn)展[J]. 劉婷婷,朱文東,劉廣一. 電力信息與通信技術(shù). 2018(03)
[2]詞元化處理在蒙古語文獻(xiàn)語料庫中的作用[J]. 金罡. 內(nèi)蒙古師范大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版). 2016(04)
[3]基于樸素貝葉斯的文本分類研究綜述[J]. 賀鳴,孫建軍,成穎. 情報(bào)科學(xué). 2016(07)
[4]蒙古文停用詞和英文停用詞比較研究[J]. 鞏政,關(guān)高娃. 中文信息學(xué)報(bào). 2011(04)
[5]高性能網(wǎng)絡(luò)爬蟲:研究綜述[J]. 周德懋,李舟軍. 計(jì)算機(jī)科學(xué). 2009(08)
[6]決策樹算法研究綜述[J]. 倪海鷗. 寧波廣播電視大學(xué)學(xué)報(bào). 2008(03)
[7]文本分類綜述[J]. 靳小波. 自動(dòng)化博覽. 2006(S1)
[8]主動(dòng)支持向量機(jī)的研究及其在蒙文文本分類中的應(yīng)用[J]. 賀慧,王俊義. 內(nèi)蒙古大學(xué)學(xué)報(bào)(自然科學(xué)版). 2006(05)
[9]KNN文本分類算法研究[J]. 楊麗華,戴齊,郭艷軍. 微計(jì)算機(jī)信息. 2006(21)
[10]中文停用詞表的自動(dòng)選取[J]. 顧益軍,樊孝忠,王建華,汪濤,黃維金. 北京理工大學(xué)學(xué)報(bào). 2005(04)
博士論文
[1]文本分類中若干問題研究[D]. 劉赫.吉林大學(xué) 2009
碩士論文
[1]文本分類中特征選擇和特征加權(quán)算法的研究與應(yīng)用[D]. 高聰.西安理工大學(xué) 2017
[2]文本分類中特征選擇方法研究—維吾爾語系[D]. 韓軍兵.新疆大學(xué) 2017
[3]文本分類停用詞處理和特征選擇技術(shù)研究[D]. 馬治濤.西安電子科技大學(xué) 2014
[4]蒙古文停用詞表和詞干提取對(duì)蒙古文文本分類的影響[D]. 阿雅娜.內(nèi)蒙古大學(xué) 2009
[5]基于改進(jìn)向量空間模型的郵件分類[D]. 廖玲.中南大學(xué) 2007
[6]蒙文文本分類技術(shù)研究與系統(tǒng)設(shè)計(jì)實(shí)現(xiàn)[D]. 蘇道.內(nèi)蒙古大學(xué) 2007
[7]基于主動(dòng)學(xué)習(xí)SVM的蒙文文本分類系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D]. 賀慧.內(nèi)蒙古大學(xué) 2006
本文編號(hào):3168418
本文鏈接:http://www.sikaile.net/wenyilunwen/yuyanyishu/3168418.html
最近更新
教材專著