基于GPU的支持向量機文本挖掘算法的研究
本文關鍵詞:基于格網(wǎng)單元的縣級土地利用總體規(guī)劃生態(tài)環(huán)境影響評價方法與應用,由筆耕文化傳播整理發(fā)布。
《北京郵電大學》 2014年
基于GPU的支持向量機文本挖掘算法的研究
王亮
【摘要】:在21世紀,隨著互聯(lián)網(wǎng)信息的大規(guī)模累積,在互聯(lián)網(wǎng)中充斥大量的文本數(shù)據(jù)。對網(wǎng)絡中的文本數(shù)據(jù)進行收集,再通過數(shù)據(jù)文本挖據(jù)的方法進行整合、預處理、建模訓練和最終的預測,可以完成聚類、分類和推薦等重要的決策。這一類的技術(shù)是目前計算機科學與技術(shù)領域研究的熱點和焦點,也是在大數(shù)據(jù)時代解決問題的關鍵途徑。 支持向量機算法是一個經(jīng)典的分類算法,它適合解決小數(shù)據(jù)集的分類問題。當數(shù)據(jù)集的規(guī)模比較大時,支持向量機的算法的效果不是很好,它需要付出較大的內(nèi)存空間的代價而且需要更多的訓練時間去建模。如何高速的訓練大規(guī)模的數(shù)據(jù)集,是支持向量機領域研究的熱點。目前存在很多高性能的并行化計算模型,基于GPU的CUDA編程就是其中的一種,它跟其他的計算方式相比,有著個人計算機先天優(yōu)勢,僅僅依靠自己的力量就可以進行高速的計算。 本文將支持向量機和GPU編程相結(jié)合,完成了LIBSVM算法的并行化改進,保證預測精確度基本不下降的前提下,訓練和預測階段的計算效率得到了一定提升。本文完成的主要工作如下:針對高性能計算的起源和發(fā)展做了簡單的回顧與陳述,重點研究了基于GPU的CUDA的體系結(jié)構(gòu)和它所帶來的在GPU上編程的革新。針對基于GPU的CUDA編程體系做了深入和全面地研究,對SVM算法的原理做了完整和詳細的研究與分析。進行了基于LIBSVM的若干經(jīng)典數(shù)據(jù)集的仿真測試,完成了LIBSVM算法的訓練和預測流程的分解,對基于LIBSVM算法的CUDA框架進行了搭建,對算法的特點進行了分析,完成了CPU和GPU計算任務的劃分,重點研究并完成了核函數(shù)矩陣形成的CUDA實現(xiàn),用于加速LIBSVM算法的訓練建模和預測建模兩個過程。在不同的測試平臺上使用七組經(jīng)典的數(shù)據(jù)集進行比對測試,從數(shù)據(jù)集本身、特征值、訓練樣本和分類個數(shù)等多個角度對測試結(jié)果進行了分析。 經(jīng)過改造可以有效地提升訓練建模和預測建模的運行效率,減少它們的運行時間,針對特征值和樣本數(shù)很大的數(shù)據(jù)集的效果更明顯。
【關鍵詞】:
【學位授予單位】:北京郵電大學
【學位級別】:碩士
【學位授予年份】:2014
【分類號】:TP391.1;TP181
【目錄】:
下載全文 更多同類文獻
CAJ全文下載
(如何獲取全文? 歡迎:購買知網(wǎng)充值卡、在線充值、在線咨詢)
CAJViewer閱讀器支持CAJ、PDF文件格式
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前9條
1 陳述彭,陳秋曉,周成虎;網(wǎng)格地圖與網(wǎng)格計算[J];測繪科學;2002年04期
2 程鵬飛,蔡艷輝,王華;GridGNSS——網(wǎng)格化全球衛(wèi)星導航系統(tǒng)[J];測繪科學;2005年04期
3 韓冀中,韓承德;高性能計算技術(shù)的發(fā)展現(xiàn)狀及趨勢[J];中國工程科學;2000年01期
4 夏永祥;史志才;;基于GPU和特征選擇的SVM入侵檢測模型[J];計算機工程;2012年08期
5 王慧勤;雷剛;;基于LIBSVM的風速預測方法研究[J];科學技術(shù)與工程;2011年22期
6 羅成石;;基于LIBSVM的糧食水分數(shù)據(jù)融合研究[J];科學技術(shù)與工程;2012年02期
7 王世春;王平根;;基于CUDA的快速車牌字符識別[J];計算機應用與軟件;2012年10期
8 任立輝;李文東;慈興華;史曉鳳;孫政;鄭榮兒;;基于LIBSVM的石油錄井中巖屑巖性識別方法研究[J];中國海洋大學學報(自然科學版);2010年09期
9 魏洪濤,石峰,李群,王維平;網(wǎng)格計算在軍事仿真中的應用[J];系統(tǒng)仿真學報;2005年03期
【共引文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 陽安國;熊助國;劉向銅;;基于AutoCAD的網(wǎng)格化調(diào)查數(shù)據(jù)文件生成綜合方法[J];北京測繪;2007年03期
2 王華;程鵬飛;蔡艷輝;;單基站GPS差分系統(tǒng)設計與實現(xiàn)方法[J];測繪工程;2006年01期
3 王喜;楊華;范況生;;城市網(wǎng)格化管理系統(tǒng)的關鍵技術(shù)及示范應用研究[J];測繪科學;2006年04期
4 劉宇;李成名;劉德欽;馬維軍;;空間信息格網(wǎng)研究進展[J];測繪科學;2007年04期
5 楊帆;米紅;;一種基于網(wǎng)格的空間聚類方法在區(qū)域劃分中的應用[J];測繪科學;2007年S1期
6 陽安國;熊助國;劉向銅;;基于AutoCAD的城市市政信息網(wǎng)格化調(diào)查與數(shù)據(jù)集成方法[J];測繪科學;2008年05期
7 祝會忠;高星偉;李明;;Winsock在網(wǎng)絡RTK數(shù)據(jù)傳輸中的應用[J];測繪科學;2009年05期
8 胡引翠;網(wǎng)格計算技術(shù)的應用及其發(fā)展趨勢[J];測繪通報;2005年03期
9 李健;呂志平;喬書波;李昌貴;;大規(guī)模連續(xù)運行基準站網(wǎng)的技術(shù)體系[J];測繪通報;2009年01期
10 馬昕煒;曾永年;;基于格網(wǎng)單元的縣級土地利用總體規(guī)劃生態(tài)環(huán)境影響評價方法與應用[J];長江流域資源與環(huán)境;2011年10期
中國重要會議論文全文數(shù)據(jù)庫 前5條
1 李雄;黨生;;基于網(wǎng)格的復雜戰(zhàn)爭系統(tǒng)仿真研究[A];第二十六屆中國控制會議論文集[C];2007年
2 呂蓬;梁曉燕;李磊;李強;;網(wǎng)格GIS在數(shù)字城市中的研究和應用[A];中國地理信息系統(tǒng)協(xié)會第四次會員代表大會暨第十一屆年會論文集[C];2007年
3 王喜珍;滕云田;胡星星;張旸;吳瓊;周鶴鳴;;中國月震探測系統(tǒng)研制[A];中國地球物理·2009[C];2009年
4 郭達志;;天地一體化數(shù)字影像地理空間信息的獲取與更新[A];煤炭資源高效綠色開采與數(shù)字礦山學術(shù)討論會論文集[C];2005年
5 Xiyun Yang;Feifei Jiang;Xiaoning Wu;;Prediction of Lead-acid Storage Battery's Remaining Capacity Based on LM-BP Neural Network[A];第25屆中國控制與決策會議論文集[C];2013年
中國博士學位論文全文數(shù)據(jù)庫 前10條
1 馮麟涵;艦船系統(tǒng)抗沖擊性能全局優(yōu)化方法研究[D];哈爾濱工程大學;2009年
2 鄭偉;聯(lián)邦式圖書館資源管理模型研究[D];吉林大學;2011年
3 劉民岷;基于網(wǎng)格計算的分布式仿真關鍵問題研究[D];電子科技大學;2011年
4 劉嶸;集群式網(wǎng)格地理信息服務注冊中心的構(gòu)建研究[D];解放軍信息工程大學;2011年
5 李健;聯(lián)合型連續(xù)運行基準站網(wǎng)的動態(tài)定位服務機制[D];解放軍信息工程大學;2011年
6 傅明;基于Web的空間數(shù)據(jù)挖掘研究[D];中南大學;2004年
7 魏洪濤;基于網(wǎng)格計算的仿真任務管理與調(diào)度方法研究[D];國防科學技術(shù)大學;2005年
8 張建兵;基于網(wǎng)格的空間信息服務關鍵技術(shù)研究[D];中國科學院研究生院(遙感應用研究所);2006年
9 危擁軍;三維GIS數(shù)據(jù)組織管理及符號化表示研究[D];解放軍信息工程大學;2006年
10 阮啟明;面向區(qū)域目標的成像偵察衛(wèi)星調(diào)度問題研究[D];國防科學技術(shù)大學;2006年
中國碩士學位論文全文數(shù)據(jù)庫 前10條
1 崔俊芳;邯鄲市網(wǎng)格化管理信息系統(tǒng)的研究與開發(fā)[D];河北工程大學;2010年
2 張展華;網(wǎng)格計算中容錯策略的研究[D];哈爾濱理工大學;2010年
3 曹份檳;基于PCA和SVM的貨車故障檢測[D];北京交通大學;2011年
4 楊麗婷;基于云計算數(shù)據(jù)存儲技術(shù)的研究[D];中北大學;2011年
5 鄭偉偉;基于UI調(diào)用的地理信息平臺[D];太原科技大學;2011年
6 馬昕煒;基于格網(wǎng)單元的縣級土地利用總體規(guī)劃生態(tài)環(huán)境影響評價方法與應用[D];中南大學;2011年
7 秦氏雪;城市網(wǎng)格化管理工作流引擎建模與實現(xiàn)[D];電子科技大學;2011年
8 賀雅璇;教育社交網(wǎng)絡平臺的設計與實現(xiàn)[D];北京郵電大學;2012年
9 劉勇燕;基于網(wǎng)格的礦井通風計算并行處理模式研究[D];西安科技大學;2003年
10 于雷易;基于空間數(shù)據(jù)網(wǎng)格的空間數(shù)據(jù)共享技術(shù)研究[D];武漢大學;2004年
【二級參考文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 蔡艷輝,程鵬飛,李夕銀;用遞歸算法實現(xiàn)整周模糊度矢量空間的遍歷[J];測繪科學;2002年04期
2 許妙忠;4D產(chǎn)品的生產(chǎn)和應用系列講座 第三講 數(shù)字柵格地圖的生產(chǎn)和應用[J];測繪信息與工程;2002年01期
3 趙振斌,包浩生,馬榮華;城市格網(wǎng)化及其景觀生態(tài)效應研究——以西安市為例[J];地理科學;2001年05期
4 秦昆,關澤群,李德仁,周軍其;基于柵格數(shù)據(jù)的最佳路徑分析方法研究[J];國土資源遙感;2002年02期
5 陳麗;陳靜;高新濤;王來生;;基于支持向量機與反K近鄰的分類算法研究[J];計算機工程與應用;2010年24期
6 張小云,劉允才;高斯核支撐向量機的性能分析[J];計算機工程;2003年08期
7 史志才;夏永祥;;基于知識約簡的網(wǎng)絡入侵特征提取[J];計算機工程;2011年05期
8 于海鵬;劉一星;劉鎮(zhèn)波;;基于圖像紋理特征的木材樹種識別[J];林業(yè)科學;2007年04期
9 李小昱,王為,雷廷武,沈逸;多傳感器信息融合技術(shù)及在農(nóng)業(yè)工程中的應用前景[J];農(nóng)業(yè)工程學報;2003年03期
10 蔣平;朱傳祥;呂德志;高成沖;;循環(huán)式糧食干燥機的智能控制系統(tǒng)[J];農(nóng)業(yè)工程學報;2006年11期
中國重要會議論文全文數(shù)據(jù)庫 前1條
1 程鵬飛;;伽利略衛(wèi)星導航定位系統(tǒng)最新進展[A];地理空間信息技術(shù)與應用——中國科協(xié)2002年學術(shù)年會測繪論文集[C];2002年
中國碩士學位論文全文數(shù)據(jù)庫 前1條
1 肖洋;風電場風速和發(fā)電功率預測研究[D];東北電力大學;2005年
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 楊強,吳中福,余平,鐘將;基于正反饋的支持向量機[J];重慶大學學報(自然科學版);2004年05期
2 孫蕾,周明全,李丙春;一種非平衡分布數(shù)據(jù)的支持向量機新算法[J];計算機應用;2004年12期
3 黃勇;鄭春穎;宋忠虎;;多類支持向量機算法綜述[J];計算技術(shù)與自動化;2005年04期
4 楊強,吳中福,余萍,鐘將;一種新型支持向量機[J];重慶大學學報(自然科學版);2005年02期
5 張猛,付麗華,王高峰;模糊臨近支持向量機[J];計算機工程與應用;2005年05期
6 張浩然;汪曉東;張長江;徐秀玲;;一種新型回歸支持向量機的學習算法[J];測試技術(shù)學報;2006年02期
7 王曄;黃上騰;;基于間隔區(qū)域樣本數(shù)量的加權(quán)支持向量機[J];計算機工程;2006年06期
8 梁新榮;劉智勇;孫德山;毛宗源;;支持向量機在混沌系統(tǒng)預測中的應用[J];計算機應用研究;2006年05期
9 盧敏;張展羽;馮寶平;賈仁輔;;基于支持向量機的區(qū)域水安全預警模型及應用[J];計算機工程;2006年15期
10 張陽;劉永革;景旭;;一種改進的線性支持向量機的特征篩選算法[J];西北農(nóng)林科技大學學報(自然科學版);2006年10期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 侯澍旻;李友榮;劉光臨;;基于支持向量機的設備振動信號趨勢預測[A];12省區(qū)市機械工程學會2006年學術(shù)年會湖北省論文集[C];2006年
2 張曉濱;尹英順;趙培坤;馬秀蘭;;基于漸進直推支持向量機的半對半多類文本分類[A];第三屆全國信息檢索與內(nèi)容安全學術(shù)會議論文集[C];2007年
3 徐會敏;王玉蘭;;線性規(guī)劃支持向量機模型的研究[A];計算機技術(shù)與應用進展·2007——全國第18屆計算機技術(shù)與應用(CACIS)學術(shù)會議論文集[C];2007年
4 晏慶華;;支持向量機算法綜述[A];2008'中國信息技術(shù)與應用學術(shù)論壇論文集(二)[C];2008年
5 郭一楠;程健;肖大偉;楊梅;;分布式多分類支持向量機[A];2011年中國智能自動化學術(shù)會議論文集(第一分冊)[C];2011年
6 林關成;李亞安;;一種支持向量機訓練集選取算法改進[A];2009’中國西部地區(qū)聲學學術(shù)交流會論文集[C];2009年
7 楊凌;劉玉樹;;基于支持向量機的坦克識別算法[A];第三屆全國數(shù)字成像技術(shù)及相關材料發(fā)展與應用學術(shù)研討會論文摘要集[C];2004年
8 李方方;趙英凱;賈玉瑩;杜杰;;基于最小二乘支持向量機的油品質(zhì)量預測[A];第25屆中國控制會議論文集(上冊)[C];2006年
9 曾江輝;耿金鳳;汪邦軍;郝建春;;面向時間序列質(zhì)量波動預測的支持向量機回歸模型研究[A];使命與責任—以質(zhì)量方法促轉(zhuǎn)型升級——第五屆中國質(zhì)量學術(shù)與創(chuàng)新論壇論文集(上)[C];2012年
10 戴林超;吳琳麗;趙海娜;李訓銘;;基于最小二乘支持向量機的故障預測法[A];2009年中國智能自動化會議論文集(第六分冊)[中南大學學報(增刊)][C];2009年
中國博士學位論文全文數(shù)據(jù)庫 前10條
1 周喜川;非可信環(huán)境下的支持向量機研究[D];浙江大學;2010年
2 常甜甜;支持向量機學習算法若干問題的研究[D];西安電子科技大學;2010年
3 王超;三類不確定支持向量機及其應用[D];河北大學;2013年
4 杜喆;幾類支持向量機變型算法的研究[D];西安電子科技大學;2009年
5 張國云;支持向量機算法及其應用研究[D];湖南大學;2006年
6 李海生;支持向量機回歸算法與應用研究[D];華南理工大學;2005年
7 李華慶;支持向量機及其在人臉識別中的應用研究[D];上海交通大學;2006年
8 劉京禮;魯棒最小二乘支持向量機研究與應用[D];中國科學技術(shù)大學;2010年
9 董春曦;支持向量機及其在入侵檢測中的應用研究[D];西安電子科技大學;2004年
10 唐發(fā)明;基于統(tǒng)計學習理論的支持向量機算法研究[D];華中科技大學;2005年
中國碩士學位論文全文數(shù)據(jù)庫 前10條
1 周林成;小波支持向量機在數(shù)據(jù)建模中的研究及應用[D];江南大學;2008年
2 王芳;支持向量機算法的研究及應用[D];江南大學;2008年
3 高泓;基于支持向量機的動態(tài)預測方法與實現(xiàn)技術(shù)研究[D];大慶石油學院;2009年
4 王永吉;支持向量機泛化性能的研究及其應用[D];江南大學;2009年
5 梁宏霞;支持向量機模型研究及應用[D];遼寧師范大學;2009年
6 孫慶嘉;多類支持向量機的研究與分析[D];北京交通大學;2010年
7 朱杰;基于最小二乘支持向量機的傳染病預測與研究[D];蘇州大學;2009年
8 王琳;支持向量機及相關理論研究[D];遼寧師范大學;2010年
9 萬家強;支持向量機在質(zhì)量管理中的應用研究[D];重慶理工大學;2010年
10 李響;基于半監(jiān)督支持向量機的網(wǎng)絡流量分類機制的研究與實現(xiàn)[D];北京郵電大學;2011年
本文關鍵詞:基于格網(wǎng)單元的縣級土地利用總體規(guī)劃生態(tài)環(huán)境影響評價方法與應用,,由筆耕文化傳播整理發(fā)布。
本文編號:228782
本文鏈接:http://www.sikaile.net/shengtaihuanjingbaohulunwen/228782.html