天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 軟件論文 >

文本的特征選擇與分類算法研究

發(fā)布時間:2023-03-05 11:29
  隨著在21世紀(jì)互聯(lián)網(wǎng)信息技術(shù)的不斷發(fā)展,文本分類作為對文本數(shù)據(jù)管理的有效手段越來越成為當(dāng)今的研究熱點。但文本數(shù)據(jù)大多以雜亂的形式存在,造成文檔特征數(shù)量多、分布不均等問題,嚴(yán)重影響文本數(shù)據(jù)的分類準(zhǔn)確率和分類效率;诖,本文在前人的基礎(chǔ)上對文本分類中的特征選擇和文本分類算法進行研究,分別給出改進的互信息特征選擇模型、基于K中心點和粗糙集理論的KNN分類算法(K Center Point and Rough Set KNN,KRS-KNN)以解決這些問題。針對傳統(tǒng)的互信息特征選擇算法沒有考慮特征詞頻率、詞性及特征詞分布問題,分別在傳統(tǒng)的互信息模型的基礎(chǔ)上結(jié)合類內(nèi)特征頻度、特征覆蓋率及詞性系數(shù)這三個指標(biāo),構(gòu)造出新的互信息評估函數(shù)。然后通過向量空間模型對特征向量化,并結(jié)合KNN分類模型對文本特征集合分類。最后通過實驗對該算法進行驗證,實驗結(jié)果表明該算法在特征選擇上具有顯著的效果,提高了文本分類的準(zhǔn)確率。同時相比于傳統(tǒng)的互信息模型在分類上的查全率和F1值也得到了一定提升,證明了該算法應(yīng)用于文本分類中的有效性和可行性。在文本分類過程中,由于特征維度高,計算難度大,使得分類效率低下,因此引入一種基于...

【文章頁數(shù)】:74 頁

【學(xué)位級別】:碩士

【文章目錄】:
摘要
abstract
注釋表
第1章 緒論
    1.1 課題研究背景及意義
    1.2 課題現(xiàn)狀及分析
        1.2.1 國外研究現(xiàn)狀
        1.2.2 國內(nèi)研究現(xiàn)狀
        1.2.3 存在的問題
    1.3 論文主要工作及組織結(jié)構(gòu)
        1.3.1 論文主要研究內(nèi)容
        1.3.2 論文主要結(jié)構(gòu)安排
第2章 文本分類相關(guān)技術(shù)簡介
    2.1 文本分類流程
    2.2 文本數(shù)據(jù)集
    2.3 文本預(yù)處理
        2.3.1 分詞
        2.3.2 去停用詞
    2.4 文本表示模型
        2.4.1 布爾模型
        2.4.2 向量空間模型
        2.4.3 概率模型
    2.5 特征降維
        2.5.1 特征提取
        2.5.2 特征選擇
    2.6 文本分類算法
        2.6.1 樸素貝葉斯算法
        2.6.2 支持向量機算法
        2.6.3 K近鄰算法
    2.7 分類評價指標(biāo)
    2.8 本章小結(jié)
第3章 互信息特征選擇算法的分析與改進
    3.1 引言
    3.2 互信息特征選擇算法的分析
        3.2.1 傳統(tǒng)的互信息特征選擇算法
        3.2.2 互信息特征選擇算法的不足
    3.3 互信息特征選擇算法的改進
        3.3.1 類內(nèi)特征頻度
        3.3.2 特征詞覆蓋率
        3.3.3 詞性系數(shù)
    3.4 算法流程描述
    3.5 實驗設(shè)計
        3.5.1 實驗數(shù)據(jù)集
        3.5.2 實驗環(huán)境
        3.5.3 分類框架
        3.5.4 仿真結(jié)果分析
    3.6 本章小結(jié)
第4章 基于K中心點和粗糙集的KNN分類算法
    4.1 引言
    4.2 相關(guān)算法介紹
        4.2.1 K中心點算法
        4.2.2 粗糙集理論
    4.3 KRS-KNN算法分類流程
    4.4 實驗設(shè)計
        4.4.1 實驗數(shù)據(jù)集
        4.4.2 實驗環(huán)境
        4.4.3 K值確定
        4.4.4 仿真結(jié)果分析
    4.5 本章小結(jié)
第5章 總結(jié)與展望
    5.1 全文總結(jié)
    5.2 未來工作展望
參考文獻
致謝
攻讀碩士學(xué)位期間從事的科研工作及取得的成果



本文編號:3756110

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/3756110.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶2d66d***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com