天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 管理論文 > 組織管理論文 >

基于物流車隊(duì)?wèi)?yīng)用SVM文本挖掘研究

發(fā)布時(shí)間:2017-03-21 19:06

  本文關(guān)鍵詞:基于物流車隊(duì)?wèi)?yīng)用SVM文本挖掘研究,,由筆耕文化傳播整理發(fā)布。


【摘要】:隨著計(jì)算機(jī)技術(shù)和系統(tǒng)工程學(xué)的飛速發(fā)展,在全球信息化大潮的推動(dòng)下,數(shù)據(jù)挖掘已成為研究中活躍份子之一,從數(shù)據(jù)中發(fā)現(xiàn)有價(jià)值的知識(shí)模式已成為具有重要意義的研究領(lǐng)域。支持向量機(jī)是一種新型機(jī)器學(xué)習(xí)方法,它較好地解決了非線性、高維數(shù)等問題,已經(jīng)應(yīng)用在許多領(lǐng)域,如手寫數(shù)字識(shí)別、對(duì)象識(shí)別、文本分類等。但是新的方法也存在問題需要解決,如文本分類具有類別和樣本數(shù)目多、噪音多、各類別樣本數(shù)目不均衡等特點(diǎn),使得支持向量機(jī)用于文本分類時(shí)存在訓(xùn)練速度和分類速度較慢的缺點(diǎn)。 為了解決實(shí)體物流公司車隊(duì)車輛使用情況不易監(jiān)控,保養(yǎng)維護(hù)不能及時(shí)到位等問題,本文針對(duì)物流公司車隊(duì)行車記錄進(jìn)行文本挖掘,監(jiān)控每一次運(yùn)輸任務(wù)對(duì)車輛使用強(qiáng)度,利用信息技術(shù)對(duì)車輛保養(yǎng)維修做到精細(xì)化管理。行車記錄挖掘基于中文分詞處理技術(shù),利用TF×IDF方法將特征項(xiàng)進(jìn)行加權(quán),并用向量空間方法將行車記錄文本表達(dá)為數(shù)學(xué)方式經(jīng)行后續(xù)挖掘計(jì)算。在特征項(xiàng)降維處理中,通過實(shí)驗(yàn)對(duì)信息增益、交叉熵、互信息和χ2統(tǒng)計(jì)四種降維方法進(jìn)行比較,觀察出信息增益和互信息最合適行車記錄特點(diǎn),最終作為降維方法。行車記錄分類采用支持向量機(jī)算法。標(biāo)準(zhǔn)支持向量機(jī)只能用于單標(biāo)號(hào)樣本分類,本文針對(duì)多類分類問題,提出了樹形結(jié)構(gòu)構(gòu)建多類支持向量機(jī)分類器。為了優(yōu)化分類器效率,提出使用聚類算法思想,構(gòu)造平衡二叉樹結(jié)構(gòu),以提高分類器分類速度。還對(duì)常用的h次多項(xiàng)式核函數(shù),高斯徑向基核函數(shù)和S型核函數(shù)三種核函數(shù)經(jīng)行實(shí)驗(yàn),找出準(zhǔn)確性較高的核函數(shù)。在系統(tǒng)設(shè)計(jì)上,各個(gè)模塊采用低耦合方式設(shè)計(jì),便于監(jiān)視文本挖掘過程中各個(gè)環(huán)節(jié)的輸出值,并提高系統(tǒng)靈活性,使各個(gè)模塊便于維護(hù)和修改。
【關(guān)鍵詞】:支持向量機(jī) 文本分類 平衡二叉樹結(jié)構(gòu) 低耦合
【學(xué)位授予單位】:天津財(cái)經(jīng)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2012
【分類號(hào)】:C931.6;F253.9
【目錄】:
  • 內(nèi)容摘要4-5
  • Abstract5-8
  • 第1章 引言8-10
  • 1.1 研究背景8
  • 1.2 本文內(nèi)容安排8-9
  • 1.3 研究方法9-10
  • 第2章 文獻(xiàn)綜述10-13
  • 2.1 國(guó)外研究現(xiàn)狀10-11
  • 2.2 國(guó)內(nèi)研究現(xiàn)狀11-13
  • 第3章 中文文本分類技術(shù)13-22
  • 3.1 本文分類概述13-14
  • 3.2 文本預(yù)處理及中文分詞14
  • 3.3 向量空間模型表示文本14-18
  • 3.4 文本分類算法18-21
  • 3.5 分類器性能評(píng)估21-22
  • 第4章 基于SVM文本分類的研究22-30
  • 4.1 SVM概述22-23
  • 4.2 線性可分的SVM23-25
  • 4.3 非線性可分的SVM25-27
  • 4.4 SVM訓(xùn)練算法27-30
  • 第5章 基于支持向量機(jī)的多類分類研究30-39
  • 5.1 多類SVM研究現(xiàn)狀30-32
  • 5.2 一種改進(jìn)的多類SVM32-35
  • 5.3 基于聚類算法改進(jìn)的二叉樹SVM35-39
  • 第6章 系統(tǒng)建模和設(shè)計(jì)39-52
  • 6.1 系統(tǒng)背景及目的39-40
  • 6.2 系統(tǒng)模型設(shè)計(jì)及改進(jìn)40-42
  • 6.3 系統(tǒng)結(jié)構(gòu)42-43
  • 6.4 分詞模塊研究與設(shè)計(jì)43-46
  • 6.5 文本表示模塊研究與設(shè)計(jì)46-49
  • 6.6 SVM訓(xùn)練模塊研究與設(shè)計(jì)49-52
  • 第7章 實(shí)驗(yàn)分析52-56
  • 7.1 實(shí)驗(yàn)環(huán)境及評(píng)價(jià)指標(biāo)52-53
  • 7.2 降維算法實(shí)驗(yàn)53-55
  • 7.3 支持向量機(jī)核函數(shù)實(shí)驗(yàn)55-56
  • 第8章 總結(jié)與展望56-58
  • 8.1 總結(jié)56-57
  • 8.2 研究工作展望57-58
  • 參考文獻(xiàn)58-61
  • 后記61

【參考文獻(xiàn)】

中國(guó)期刊全文數(shù)據(jù)庫(kù) 前5條

1 張文生,王玨,戴國(guó)忠;支持向量機(jī)中引入后驗(yàn)概率的理論和方法研究[J];計(jì)算機(jī)研究與發(fā)展;2002年04期

2 李雪蕾,張冬茉;一種基于向量空間模型的文本分類方法[J];計(jì)算機(jī)工程;2003年17期

3 應(yīng)志偉,柴佩琪,陳其暉;文語(yǔ)轉(zhuǎn)換系統(tǒng)中基于語(yǔ)料的漢語(yǔ)自動(dòng)分詞研究[J];計(jì)算機(jī)應(yīng)用;2000年02期

4 秦進(jìn),陳笑蓉,汪維家,陸汝占;文本分類中的特征抽取[J];計(jì)算機(jī)應(yīng)用;2003年02期

5 周茜,趙明生,扈e

本文編號(hào):260134


資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/guanlilunwen/yunyingzuzhiguanlilunwen/260134.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶d0c16***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com