云計算下基于優(yōu)化XGBoost的網約車供需預測研究
發(fā)布時間:2021-08-11 02:55
隨著“互聯網+出行”的浪潮,智能出行平臺有了長足發(fā)展,吸引著越來越多的人使用網約車出行。但使用平臺約車服務依然需要花費較長的時間等待網約車到達,為了解決這個問題,網約車供需預測研究應運而生。通過預測可以提前調度網約車,從而縮短用戶的等待時間、最大化平臺的收益并且在一定程度上提升地區(qū)的運輸能力。本文研究相關預測算法及數據挖掘技術,結合數據分析構建了影響網約車供需的特征,設計了基于XGBoost的網約車供需預測模型,預測出城市中各區(qū)域未來10分鐘的網約車供需差額范圍。主要研究內容包括:(1)分析網約車供需預測的背景意義及研究現狀。在此基礎上,研究預測算法和數據挖掘領域的相關理論和最新技術,對原始數據進行分析和預處理并構建影響網約車供需的特征。(2)設計并實現基于XGBoost的網約車供需預測模型。深入分析XGBoost原理和網約車供需預測模型實現過程,設定模型的輸入特征、相關參數和預測目標,為構建基于XGBoost的網約車供需模型打下基礎。(3)分析并構建興趣點特征。首先論證興趣點特征與網約車供需預測存在關系,之后證明不同種類不同數量的興趣點對預測會產生不同的影響,在此基礎上提出興趣點特征...
【文章來源】:內蒙古工業(yè)大學內蒙古自治區(qū)
【文章頁數】:67 頁
【學位級別】:碩士
【部分圖文】:
隨機森林模型預測過程
圖 2-2 K-means 算法流程圖Fig.2-2 K-meansAlgorithm Flow Chart存在一個很大的缺點:如果一開始的聚類中大的影響;诖耍蟪霈F的K-means++是在確定初始的聚類中心時,使它們之間的簇)有較大差別[37-38]。ans++算法對興趣點數據集進行數據預處理。,用K-means++算法確定5個供需差額分布最法對58個區(qū)塊進行聚簇。方法主要有以下三種。相似度。皮爾遜相似度用于度量兩個變量 X1 之間。計算公式如(2-1)所示,結果越大
圖 2-3 Spark 架構圖Fig.2-3 Spark Architecture Figure客戶端提交程序到 Spark 集群后,Master 節(jié)點啟動 Driver。Driver 代表整個應序運行的開始,負責分發(fā)任務。收到任務的工作節(jié)點創(chuàng)建任務執(zhí)行器執(zhí)行任務,程序由多個節(jié)點共同完成[40]。表 2-1 Spark 相關名稱解釋Tab.2-1 Spark Related Name Explanation名稱 含義Client 客戶端,負責提交程序Drive 驅動程序Spark Context 程序的入口,與 Spark 集群連接的對象RDD DAG RDD 有向無環(huán)圖(Directed Acyclic Graph,DAG)DAG Scheduler DAG 調度器Task Scheduler 任務調度器Spark Env 包含 Spark 執(zhí)行時需要的重要組件
【參考文獻】:
期刊論文
[1]大數據Spark技術研究[J]. 劉峰波. 數字技術與應用. 2015(09)
[2]基于Spark的大數據混合計算模型[J]. 胡俊,胡賢德,程家興. 計算機系統(tǒng)應用. 2015(04)
[3]支持向量機理論及算法研究綜述[J]. 汪海燕,黎建輝,楊風雷. 計算機應用研究. 2014(05)
[4]基于過采樣技術和隨機森林的不平衡微陣列數據分類方法研究[J]. 于化龍,高尚,趙靖,秦斌. 計算機科學. 2012(05)
[5]支持在線學習的增量式極端隨機森林分類器[J]. 王愛平,萬國偉,程志全,李思昆. 軟件學報. 2011(09)
[6]數據降維方法分析與研究[J]. 吳曉婷,閆德勤. 計算機應用研究. 2009(08)
[7]VB6在CSV文件格式處理中的應用研究[J]. 李旭,馬力. 信息技術. 2009(07)
[8]離散粒子群優(yōu)化算法研究現狀綜述[J]. 沈林成,霍霄華,牛軼峰. 系統(tǒng)工程與電子技術. 2008(10)
[9]高維數據特征降維研究綜述[J]. 胡潔. 計算機應用研究. 2008(09)
[10]初始聚類中心優(yōu)化的k-means算法[J]. 袁方,周志勇,宋鑫. 計算機工程. 2007(03)
博士論文
[1]支持向量機算法的研究及其應用[D]. 范昕煒.浙江大學 2003
碩士論文
[1]基于梯度漸進回歸樹的引文推薦方法研究[D]. 陳俊鵬.北京理工大學 2016
[2]智能出行平臺下的城市出租車需求預測研究[D]. 梁婷婷.吉林大學 2016
[3]基于MongoDB的應用平臺的研究與實現[D]. 呂林.北京郵電大學 2015
[4]基于Spark的機器學習應用框架研究與實現[D]. 孫科.上海交通大學 2015
[5]基于MongoDB云存儲平臺的論壇信息抽取與存儲研究[D]. 陳敏敏.上海交通大學 2012
[6]基于 MongoDB的云數據管理技術的研究與應用[D]. 劉一夢.北京交通大學 2012
[7]NoSQL數據庫技術及其應用研究[D]. 沈姝.南京信息工程大學 2012
[8]云計算中數據庫的關鍵問題研究與實現[D]. 王海波.吉林大學 2011
本文編號:3335301
【文章來源】:內蒙古工業(yè)大學內蒙古自治區(qū)
【文章頁數】:67 頁
【學位級別】:碩士
【部分圖文】:
隨機森林模型預測過程
圖 2-2 K-means 算法流程圖Fig.2-2 K-meansAlgorithm Flow Chart存在一個很大的缺點:如果一開始的聚類中大的影響;诖耍蟪霈F的K-means++是在確定初始的聚類中心時,使它們之間的簇)有較大差別[37-38]。ans++算法對興趣點數據集進行數據預處理。,用K-means++算法確定5個供需差額分布最法對58個區(qū)塊進行聚簇。方法主要有以下三種。相似度。皮爾遜相似度用于度量兩個變量 X1 之間。計算公式如(2-1)所示,結果越大
圖 2-3 Spark 架構圖Fig.2-3 Spark Architecture Figure客戶端提交程序到 Spark 集群后,Master 節(jié)點啟動 Driver。Driver 代表整個應序運行的開始,負責分發(fā)任務。收到任務的工作節(jié)點創(chuàng)建任務執(zhí)行器執(zhí)行任務,程序由多個節(jié)點共同完成[40]。表 2-1 Spark 相關名稱解釋Tab.2-1 Spark Related Name Explanation名稱 含義Client 客戶端,負責提交程序Drive 驅動程序Spark Context 程序的入口,與 Spark 集群連接的對象RDD DAG RDD 有向無環(huán)圖(Directed Acyclic Graph,DAG)DAG Scheduler DAG 調度器Task Scheduler 任務調度器Spark Env 包含 Spark 執(zhí)行時需要的重要組件
【參考文獻】:
期刊論文
[1]大數據Spark技術研究[J]. 劉峰波. 數字技術與應用. 2015(09)
[2]基于Spark的大數據混合計算模型[J]. 胡俊,胡賢德,程家興. 計算機系統(tǒng)應用. 2015(04)
[3]支持向量機理論及算法研究綜述[J]. 汪海燕,黎建輝,楊風雷. 計算機應用研究. 2014(05)
[4]基于過采樣技術和隨機森林的不平衡微陣列數據分類方法研究[J]. 于化龍,高尚,趙靖,秦斌. 計算機科學. 2012(05)
[5]支持在線學習的增量式極端隨機森林分類器[J]. 王愛平,萬國偉,程志全,李思昆. 軟件學報. 2011(09)
[6]數據降維方法分析與研究[J]. 吳曉婷,閆德勤. 計算機應用研究. 2009(08)
[7]VB6在CSV文件格式處理中的應用研究[J]. 李旭,馬力. 信息技術. 2009(07)
[8]離散粒子群優(yōu)化算法研究現狀綜述[J]. 沈林成,霍霄華,牛軼峰. 系統(tǒng)工程與電子技術. 2008(10)
[9]高維數據特征降維研究綜述[J]. 胡潔. 計算機應用研究. 2008(09)
[10]初始聚類中心優(yōu)化的k-means算法[J]. 袁方,周志勇,宋鑫. 計算機工程. 2007(03)
博士論文
[1]支持向量機算法的研究及其應用[D]. 范昕煒.浙江大學 2003
碩士論文
[1]基于梯度漸進回歸樹的引文推薦方法研究[D]. 陳俊鵬.北京理工大學 2016
[2]智能出行平臺下的城市出租車需求預測研究[D]. 梁婷婷.吉林大學 2016
[3]基于MongoDB的應用平臺的研究與實現[D]. 呂林.北京郵電大學 2015
[4]基于Spark的機器學習應用框架研究與實現[D]. 孫科.上海交通大學 2015
[5]基于MongoDB云存儲平臺的論壇信息抽取與存儲研究[D]. 陳敏敏.上海交通大學 2012
[6]基于 MongoDB的云數據管理技術的研究與應用[D]. 劉一夢.北京交通大學 2012
[7]NoSQL數據庫技術及其應用研究[D]. 沈姝.南京信息工程大學 2012
[8]云計算中數據庫的關鍵問題研究與實現[D]. 王海波.吉林大學 2011
本文編號:3335301
本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/3335301.html