基于數(shù)據(jù)挖掘的城市共享單車出行分析及區(qū)域需求量預測
發(fā)布時間:2023-03-02 20:27
共享單車作為新興的“互聯(lián)網(wǎng)+交通”的出行方式,不僅緩解了城市的噪音污染和交通擁堵,而且憑借其靈活方便、低碳環(huán)保、經(jīng)濟節(jié)能、可達性好的優(yōu)勢,已經(jīng)逐漸成為解決城市“最后一公里”出行的首選方式。但其獨有的特征給用戶和運營商帶來了許多問題,例如區(qū)域單車投放量不合理、高峰時段各區(qū)域車輛供需不平衡、運營管理收支不平衡等等。解決這些問題的關鍵在于對區(qū)域未來單車需求量的分析和預測,這對共享單車的車輛調度和運營商的運營管理有著十分重要的意義。本文首先對共享單車數(shù)據(jù)進行可視化分析,包括租借量的分布情況、時間特征(如季節(jié)、月份、小時等)對租車量的影響、環(huán)境特征(如溫度、濕度、風速等)對租車量的影響等。然后,在特征工程部分對數(shù)據(jù)的空缺異常值進行填充,并由可視化分析結果進行特征構造,時間因子對租車量的影響較為明顯,于是基于時間屬性構造了租車量時間特征、環(huán)境時間特征和周期性特征等,另外,針對一天中的早晚高峰期時段的特性也構造了一系列特征,并進行特征選擇。最后,分別建立支持向量機回歸模型、隨機森林回歸模型和GBDT回歸模型對共享單車的需求量進行預測。并利用stacking方法將三個模型進行融合,提出建立一種SSRG...
【文章頁數(shù)】:71 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 課題研究背景及意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 國外研究現(xiàn)狀
1.2.2 國內(nèi)研究現(xiàn)狀
1.3 本文主要研究內(nèi)容與章節(jié)安排
第二章 共享單車數(shù)據(jù)可視化分析
2.1 數(shù)據(jù)介紹
2.2 數(shù)據(jù)可視化分析
2.2.1 查找異常值
2.2.2 各個特征之間的相關性
2.2.3 時間特征對用戶出行租車的影響
2.2.4 環(huán)境因素對租車量的影響
2.3 本章小結
第三章 特征工程
3.1 數(shù)據(jù)清洗
3.1.1 缺失值的處理
3.1.2 異常值(離群點)的處理
3.2 特征構造
3.2.1 常規(guī)特征構造
3.2.2 復雜特征構造
3.2.3 其它特征構造
3.3 特征選擇
3.4 特征處理
3.4.1 數(shù)值型特征處理
3.4.2 類別型特征處理
3.5 本章小結
第四章 模型算法原理及評價指標
4.1 基本模型算法原理
4.1.1 支持向量機
4.1.2 隨機森林
4.1.3 梯度提升決策樹
4.2 評價標準
4.3 本章小結
第五章 模型的建立和優(yōu)化及預測結果分析
5.1 建模過程
5.2 模型參數(shù)調優(yōu)
5.2.1 支持向量機回歸模型參數(shù)調優(yōu)
5.2.2 隨機森林回歸模型參數(shù)調優(yōu)
5.2.3 梯度提升回歸模型參數(shù)調優(yōu)
5.3 模型融合構建SSRG預測模型
5.4 預測結果分析
5.5 本章小結
結論和展望
工作總結
工作展望
參考文獻
攻讀學位期間的科研成果
致謝
本文編號:3752573
【文章頁數(shù)】:71 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 課題研究背景及意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 國外研究現(xiàn)狀
1.2.2 國內(nèi)研究現(xiàn)狀
1.3 本文主要研究內(nèi)容與章節(jié)安排
第二章 共享單車數(shù)據(jù)可視化分析
2.1 數(shù)據(jù)介紹
2.2 數(shù)據(jù)可視化分析
2.2.1 查找異常值
2.2.2 各個特征之間的相關性
2.2.3 時間特征對用戶出行租車的影響
2.2.4 環(huán)境因素對租車量的影響
2.3 本章小結
第三章 特征工程
3.1 數(shù)據(jù)清洗
3.1.1 缺失值的處理
3.1.2 異常值(離群點)的處理
3.2 特征構造
3.2.1 常規(guī)特征構造
3.2.2 復雜特征構造
3.2.3 其它特征構造
3.3 特征選擇
3.4 特征處理
3.4.1 數(shù)值型特征處理
3.4.2 類別型特征處理
3.5 本章小結
第四章 模型算法原理及評價指標
4.1 基本模型算法原理
4.1.1 支持向量機
4.1.2 隨機森林
4.1.3 梯度提升決策樹
4.2 評價標準
4.3 本章小結
第五章 模型的建立和優(yōu)化及預測結果分析
5.1 建模過程
5.2 模型參數(shù)調優(yōu)
5.2.1 支持向量機回歸模型參數(shù)調優(yōu)
5.2.2 隨機森林回歸模型參數(shù)調優(yōu)
5.2.3 梯度提升回歸模型參數(shù)調優(yōu)
5.3 模型融合構建SSRG預測模型
5.4 預測結果分析
5.5 本章小結
結論和展望
工作總結
工作展望
參考文獻
攻讀學位期間的科研成果
致謝
本文編號:3752573
本文鏈接:http://www.sikaile.net/kejilunwen/daoluqiaoliang/3752573.html