Spark平臺(tái)上基于K-Means算法的熱點(diǎn)路徑發(fā)現(xiàn)方法研究
本文關(guān)鍵詞:Spark平臺(tái)上基于K-Means算法的熱點(diǎn)路徑發(fā)現(xiàn)方法研究 出處:《信息工程大學(xué)學(xué)報(bào)》2016年06期 論文類(lèi)型:期刊論文
更多相關(guān)文章: 移動(dòng)對(duì)象 熱點(diǎn)路徑發(fā)現(xiàn) Spark 停留點(diǎn) K-means算法
【摘要】:移動(dòng)對(duì)象的熱點(diǎn)路徑發(fā)現(xiàn)問(wèn)題是大數(shù)據(jù)環(huán)境下位置服務(wù)研究的一個(gè)熱點(diǎn),可支撐用戶(hù)行程推薦、智能交通管控以及城市道路規(guī)劃等諸多應(yīng)用。當(dāng)前,隨著智能移動(dòng)終端的快速發(fā)展和應(yīng)用,移動(dòng)對(duì)象軌跡數(shù)據(jù)的規(guī)模量日益增大,而現(xiàn)有的軌跡熱點(diǎn)路徑發(fā)現(xiàn)方法在大數(shù)據(jù)環(huán)境下存在處理效率不高的問(wèn)題。針對(duì)該問(wèn)題,提出了在Spark平臺(tái)上基于K-means聚類(lèi)算法的熱點(diǎn)路徑發(fā)現(xiàn)方法。該方法首先確定軌跡中的停留點(diǎn),通過(guò)停留點(diǎn)將軌跡劃分為若干軌跡段,給出軌跡段之間距離的定義和計(jì)算方法,在此基礎(chǔ)上采用K-means算法,對(duì)移動(dòng)軌跡段進(jìn)行聚類(lèi),聚類(lèi)結(jié)果即反映出軌跡中的熱點(diǎn)路徑。實(shí)驗(yàn)結(jié)果表明,在Spark平臺(tái)上實(shí)現(xiàn)該方法有效的提高了在大規(guī)模數(shù)據(jù)集上發(fā)現(xiàn)熱點(diǎn)路徑的效率。
[Abstract]:Hot path of moving objects found that the problem is a hot research topic in location services under the big data environment, and can support the user travel recommendation, intelligent traffic control and city road planning and many other applications. At present, with the rapid development and application of intelligent mobile terminal, the mobile object scale trajectory data is increasing, and the trajectory of hot path the existing discovery method has the problem of low efficiency in large data environment. To solve this problem, proposed on the platform of Spark hot path clustering algorithm based on K-means method. This method firstly determined to stay in the path, stay will be divided into several trajectory trajectory trajectory is given the distance between. The definition and calculation method on the basis of K-means algorithm to cluster the mobile trajectory, the clustering results reflected the hot path. The experimental results It shows that the implementation of this method on the Spark platform effectively improves the efficiency of finding hot spots on a large dataset.
【作者單位】: 數(shù)學(xué)工程與先進(jìn)計(jì)算國(guó)家重點(diǎn)實(shí)驗(yàn)室;
【分類(lèi)號(hào)】:TP311.13
【正文快照】: 近年來(lái),隨著衛(wèi)星定位導(dǎo)航系統(tǒng)的日益成熟,以及Web GIS、移動(dòng)互聯(lián)網(wǎng)、移動(dòng)智能終端等技術(shù)的快速發(fā)展和廣泛應(yīng)用,位置服務(wù)已經(jīng)成為當(dāng)前產(chǎn)業(yè)界和學(xué)術(shù)界研究的熱點(diǎn),熱點(diǎn)路徑的發(fā)現(xiàn)是位置服務(wù)中的關(guān)鍵內(nèi)容之一。熱點(diǎn)路徑是指一段時(shí)間內(nèi)移動(dòng)對(duì)象頻繁經(jīng)過(guò)的路線(xiàn),可以很大程度上反映移
【參考文獻(xiàn)】
相關(guān)期刊論文 前4條
1 吳俊偉;朱云龍;庫(kù)濤;王亮;;基于網(wǎng)格聚類(lèi)的熱點(diǎn)路徑探測(cè)[J];吉林大學(xué)學(xué)報(bào)(工學(xué)版);2015年01期
2 盧帥;趙卓峰;韓燕波;;一種車(chē)輛移動(dòng)對(duì)象相似軌跡查詢(xún)算法[J];計(jì)算機(jī)與數(shù)字工程;2014年09期
3 尹成祥;張宏軍;張睿;綦秀利;王彬;;一種改進(jìn)的K-Means算法[J];計(jì)算機(jī)技術(shù)與發(fā)展;2014年10期
4 夏英;溫海平;張旭;;基于軌跡聚類(lèi)的熱點(diǎn)路徑分析方法[J];重慶郵電大學(xué)學(xué)報(bào)(自然科學(xué)版);2011年05期
【共引文獻(xiàn)】
相關(guān)期刊論文 前10條
1 陳平;皇甫大鵬;林曼筠;趙現(xiàn)綱;;基于主成分分析和運(yùn)行特征的軟件聚類(lèi)分析[J];中國(guó)教育信息化;2017年06期
2 崔艷超;周剛;;Spark平臺(tái)上基于K-Means算法的熱點(diǎn)路徑發(fā)現(xiàn)方法研究[J];信息工程大學(xué)學(xué)報(bào);2016年06期
3 賈若然;劉曙光;孫啟龍;;基于位置軌跡數(shù)據(jù)的用戶(hù)相似性分析[J];計(jì)算機(jī)與數(shù)字工程;2016年08期
4 鄭誠(chéng);俞青云;;基于kNN的聚類(lèi)算法研究[J];赤峰學(xué)院學(xué)報(bào)(自然科學(xué)版);2016年08期
5 彭艷兵;馮利容;;基于網(wǎng)格概率的離群點(diǎn)檢測(cè)算法[J];計(jì)算機(jī)系統(tǒng)應(yīng)用;2016年04期
6 翟婷;宋文愛(ài);富麗貞;史磊;;基于路網(wǎng)感知的時(shí)空軌跡聚類(lèi)[J];計(jì)算機(jī)工程與設(shè)計(jì);2016年03期
7 毛秀;冒純麗;丁岳偉;;基于密度和聚類(lèi)指數(shù)改進(jìn)的K-means算法[J];電子科技;2015年11期
8 曹波;韓燕波;王桂玲;;基于車(chē)牌識(shí)別大數(shù)據(jù)的伴隨車(chē)輛組發(fā)現(xiàn)方法[J];計(jì)算機(jī)應(yīng)用;2015年11期
9 蔡文學(xué);蕭超武;黃曉宇;;基于LDA的用戶(hù)軌跡分析[J];計(jì)算機(jī)應(yīng)用與軟件;2015年05期
10 吳俊偉;朱云龍;庫(kù)濤;王亮;;基于網(wǎng)格聚類(lèi)的熱點(diǎn)路徑探測(cè)[J];吉林大學(xué)學(xué)報(bào)(工學(xué)版);2015年01期
【二級(jí)參考文獻(xiàn)】
相關(guān)期刊論文 前10條
1 周婷;張君瑛;羅成;;基于Hadoop的K-means聚類(lèi)算法的實(shí)現(xiàn)[J];計(jì)算機(jī)技術(shù)與發(fā)展;2013年07期
2 趙新勇;安實(shí);;伴隨車(chē)檢測(cè)技術(shù)應(yīng)用研究[J];交通運(yùn)輸系統(tǒng)工程與信息;2012年03期
3 趙秀麗;徐維祥;;一種移動(dòng)物體時(shí)空軌跡聚類(lèi)的相似性度量方法[J];信息與控制;2012年01期
4 方艾芬;李先通;,
本文編號(hào):1436993
本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/1436993.html