天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

王煜, 導(dǎo)師:王正歐,基于決策樹(shù)和K最近鄰算法的文本分類(lèi)研究

發(fā)布時(shí)間:2016-09-01 14:07

  本文關(guān)鍵詞:基于決策樹(shù)和K最近鄰算法的文本分類(lèi)研究,,由筆耕文化傳播整理發(fā)布。


首頁(yè) > 專(zhuān)家 > 內(nèi)容

文獻(xiàn)名稱(chēng):基于決策樹(shù)和K最近鄰算法的文本分類(lèi)研究

    前言:文本分類(lèi)是文本挖掘的重要內(nèi)容,是對(duì)信息的一種最基本的認(rèn)知形式。目前的文本特征降維算法、改進(jìn)或創(chuàng)造適應(yīng)文本數(shù)據(jù)的分類(lèi)算法、抽取文本分類(lèi)規(guī)則等方面的研究仍遠(yuǎn)遠(yuǎn)不能滿(mǎn)足實(shí)際的需要。本文主要研究了文本特征空間的降維問(wèn)題、利用決策樹(shù)抽取文本分類(lèi)規(guī)則問(wèn)題和改進(jìn)KNN算法以適應(yīng)文本分類(lèi)問(wèn)題。 本文提出了三種特征降維方法:一種是基于模式聚合和改進(jìn)χ~2統(tǒng)計(jì)量的文本降維方法,有效地降低文本維數(shù)并可提高分類(lèi)精度;一種是基于CHI值原理和粗糙集理論的屬性約減的文本降維方法,據(jù)此提出的基于決策樹(shù)的文本分類(lèi)規(guī)則獲取方法,可獲得分類(lèi)精度較高且易于理解的文本分類(lèi)規(guī)則;第三種是基于神經(jīng)網(wǎng)絡(luò)的特征抽取方法,此方法根據(jù)靈敏度將特征進(jìn)行排序,采用二分法的方式去掉部分特征,降低了神經(jīng)網(wǎng)絡(luò)特征提取的計(jì)算量。 本文提出了兩種基于模糊決策樹(shù)的模糊文本分類(lèi)規(guī)則抽取方法。第一種方法采用分枝合并減少了分類(lèi)規(guī)則,第二種方法提出了一種基于類(lèi)信息熵和密度分布函數(shù)的數(shù)據(jù)模糊化方法,降低了數(shù)據(jù)模糊化的工作量和模糊決策樹(shù)的規(guī)模,減少了分類(lèi)規(guī)則數(shù)量。 本文關(guān)于KNN算法的改進(jìn)主要做了三個(gè)方面的工作: 歐氏距離中的權(quán)重求解問(wèn)題:提出了...
    Text categorization is one of the most important issues of text mining, which is thought as a basic cognitional form. The researches on the methods of feature dimensions reduction, text categorization and text categorization rule extraction have not satisfied the actual applications so far. In this paper, the text feature dimensions reduction and text categorization rule extraction using decision tree are investigated, and some new KNN algorithms are represented for text categorization. In this pap...

文獻(xiàn)名稱(chēng) 基于決策樹(shù)和K最近鄰算法的文本分類(lèi)研究

Article Name
英文(英語(yǔ))翻譯 Study on Text Categorization Based on Decision Tree and K Nearest Neighbors;

作者 王煜; 導(dǎo)師:王正歐;

Author

作者單位
Author Agencies 天津大學(xué);

文獻(xiàn)出處
Article From 中國(guó)科學(xué)院上海冶金研究所; 材料物理與化學(xué)(專(zhuān)業(yè)) 博士論文 2000年度

關(guān)鍵詞 文本分類(lèi); 決策樹(shù); KNN算法; 模糊邏輯; 粗糙集理論; 神經(jīng)網(wǎng)絡(luò);

Keywords text categorization;decision tree;KNN algorithm;fuzzy logic;rough set theory;neural network;

基于文本分類(lèi)的本體匹配及其應(yīng)用研究
文本分類(lèi)及其相關(guān)技術(shù)研究
關(guān)聯(lián)文本分類(lèi)關(guān)鍵技術(shù)研究
文本分類(lèi)和聚類(lèi)中若干問(wèn)題的研究
粗糙集理論在中文文本分類(lèi)中的應(yīng)用
高性能文本分類(lèi)算法研究
現(xiàn)代信息檢索中的文本分類(lèi)及圖像恢復(fù)研究
支持向量機(jī)分類(lèi)方法及其在文本分類(lèi)中的應(yīng)用研究
自動(dòng)文本分類(lèi)若干基本問(wèn)題研究
城市休閑產(chǎn)業(yè)集群化發(fā)展理論與創(chuàng)新研究


  本文關(guān)鍵詞:基于決策樹(shù)和K最近鄰算法的文本分類(lèi)研究,由筆耕文化傳播整理發(fā)布。



本文編號(hào):107694

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/guanlilunwen/tongjijuecelunwen/107694.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶(hù)c3194***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com