AP聚類算法在商圈挖掘中的應用研究
發(fā)布時間:2020-05-15 15:23
【摘要】:城市商圈是現實世界中經濟網絡的一種基本結構。通過挖掘城市中的商圈數據,擴展新的應用場景,可以使終端用戶受益。用戶在訪問商圈后產生的基于位置的簽到數據可以被用于挖掘商圈,并提供數據支持。然而,基于簽到數據的商圈挖掘工作面臨幾方面的問題。(1)在傳統的商圈挖掘模型和方法中,存在參數難以設置的問題;(2)標準AP聚類算法的計算復雜度較高且只能發(fā)現球形狀商圈,不適合用于大規(guī)模數據聚類問題和挖掘商圈呈非球形狀的情況。針對以上問題,為了有效地挖掘城市商圈,本文提出了改進的AP聚類商圈挖掘算法,主要研究內容如下:首先,提出并設計了基于簽到數據的AP聚類商圈挖掘算法。將標準AP聚類算法引入城市商圈挖掘領域中,并通過利用位置簽到數據中的簽到量特征來合理地設置AP算法的偏向參數值,使得在聚類實施的信息更新過程中,增加了類代表點的約束條件。通過使用Yelp數據集為實驗數據,對比標準的AP聚類算法以及貪心搜索算法,實驗結果證明了所提出的算法的有效性。其次,提出并設計了改進的AP聚類商圈挖掘算法。首先通過分析標準AP聚類算法的信息傳播過程,利用密度最大值聚類算法挖掘出潛在商圈中心,從而壓縮了算法的輸入相似度矩陣,進而提升了算法計算效率;然后對經過標準AP聚類算法處理而得到的初始商圈集合,分析其內部的距離屬性,設計了與類內距離和類間距離相關的合并策略,提高了挖掘結果的準確性;最后使用Yelp數據集為實驗數據,對比標準的AP聚類算法,所得實驗結果證明了算法在基本保留全部信息的基礎上,提升了算法執(zhí)行效率。本研究具有重要的應用價值:(1)通過對標準AP聚類算法的改進,使其具有有效分析、處理數據的能力,為數據科學的發(fā)展提供了新的工具;(2)從給定的簽到數據中挖掘出城市商圈的分布,可以為探測商圈內的熱點、分析商圈的動態(tài)變化提供數據支持。
【圖文】:
因素干擾挖掘準確性的缺陷。采用商圈的簽到數據作為數據基礎,并利用簽到數據的簽逡逑到量特征更加合理地來設置輸入矩陣的偏好度,避免了數據信息缺失,進而完成挖掘任逡逑務,圖3.2展示了模擬數據的挖掘結果。逡逑邐[邐:逡逑圖3.2商圈挖掘結果示意圖逡逑接下來的內容,本章節(jié)首先提出基于AP聚類的商圈挖掘問題的相關定義。然后介逡逑紹標準AP聚類算法的理論與算法實現過程。最后設計對比實驗來驗證該算法的有效性。逡逑3.2相關定義與問題描述逡逑本節(jié)主要涉及的知識有:城市商圈相關概念的定義以及城市商圈挖掘需要解決的問逡逑題和AP算法的理論基礎描述。逡逑3.2.1商圈相關定義逡逑定義3.1商業(yè)網點(Venue)商業(yè)網點?般是指代進行商業(yè)經營交易、城市居民進行逡逑消費活動,提供產品或者服務的場所,記作商業(yè)網點組成的集合記為T/。一般來說,逡逑城幣主城IX里的商業(yè)網點呈現聚集的狀態(tài),向城K外的方向輻射擴散。逡逑定義3.2商圈(Business邋District)商圈是由商業(yè)網點所組成的集合,記為A,它是逡逑整個城市商圈的子集/)=丨叢,認,...,^丨,其中iV表示城市商圈的個數。如圖3.3所示,逡逑圈內分布的商業(yè)網點構成了一個商業(yè)圈。商業(yè)網點構成商業(yè)圈的形狀會根據現實情況的逡逑交通路況和政府規(guī)劃呈現不同的形狀,如規(guī)則狀的圓形或不規(guī)則的形狀。逡逑19逡逑
定義3.4城市商圈挖掘問題(Business邋Districts邋Mining邋Problem)給定商業(yè)網點集合逡逑F,使用標準AP聚類算法從集合中挖掘出城市商圈中心點,然后將歸屬于該商圈中逡逑心點的商業(yè)網點聚集在一起得到城市商圈A,完成城市商圈挖掘任務。如圖3.2所示,給逡逑定模擬的商業(yè)網點集合,經過對集合使用AP聚類算法聚類后,找到了聚類中心(中間的逡逑大點),然后將周圍的點中分配給所屬的聚類中心點,類中心點與所屬的點組成了族,即逡逑城市商圈。逡逑3.2.2問題描述與分析逡逑在對城市商圈分布測定的傳統方法中,,一般由下面幾個方面組成[53]:逡逑(1)預測分析逡逑首先對城市商圈這一對象附近的消費者環(huán)境、經濟環(huán)境、公共交通設施、以及政府逡逑對該商業(yè)區(qū)域的未來規(guī)劃等信息進行收集,再對商圈內的商業(yè)網點的經營范圍、經營品逡逑20逡逑
【學位授予單位】:杭州電子科技大學
【學位級別】:碩士
【學位授予年份】:2019
【分類號】:F713;TP311.13
【圖文】:
因素干擾挖掘準確性的缺陷。采用商圈的簽到數據作為數據基礎,并利用簽到數據的簽逡逑到量特征更加合理地來設置輸入矩陣的偏好度,避免了數據信息缺失,進而完成挖掘任逡逑務,圖3.2展示了模擬數據的挖掘結果。逡逑邐[邐:逡逑圖3.2商圈挖掘結果示意圖逡逑接下來的內容,本章節(jié)首先提出基于AP聚類的商圈挖掘問題的相關定義。然后介逡逑紹標準AP聚類算法的理論與算法實現過程。最后設計對比實驗來驗證該算法的有效性。逡逑3.2相關定義與問題描述逡逑本節(jié)主要涉及的知識有:城市商圈相關概念的定義以及城市商圈挖掘需要解決的問逡逑題和AP算法的理論基礎描述。逡逑3.2.1商圈相關定義逡逑定義3.1商業(yè)網點(Venue)商業(yè)網點?般是指代進行商業(yè)經營交易、城市居民進行逡逑消費活動,提供產品或者服務的場所,記作商業(yè)網點組成的集合記為T/。一般來說,逡逑城幣主城IX里的商業(yè)網點呈現聚集的狀態(tài),向城K外的方向輻射擴散。逡逑定義3.2商圈(Business邋District)商圈是由商業(yè)網點所組成的集合,記為A,它是逡逑整個城市商圈的子集/)=丨叢,認,...,^丨,其中iV表示城市商圈的個數。如圖3.3所示,逡逑圈內分布的商業(yè)網點構成了一個商業(yè)圈。商業(yè)網點構成商業(yè)圈的形狀會根據現實情況的逡逑交通路況和政府規(guī)劃呈現不同的形狀,如規(guī)則狀的圓形或不規(guī)則的形狀。逡逑19逡逑
定義3.4城市商圈挖掘問題(Business邋Districts邋Mining邋Problem)給定商業(yè)網點集合逡逑F,使用標準AP聚類算法從集合中挖掘出城市商圈中心點,然后將歸屬于該商圈中逡逑心點的商業(yè)網點聚集在一起得到城市商圈A,完成城市商圈挖掘任務。如圖3.2所示,給逡逑定模擬的商業(yè)網點集合,經過對集合使用AP聚類算法聚類后,找到了聚類中心(中間的逡逑大點),然后將周圍的點中分配給所屬的聚類中心點,類中心點與所屬的點組成了族,即逡逑城市商圈。逡逑3.2.2問題描述與分析逡逑在對城市商圈分布測定的傳統方法中,,一般由下面幾個方面組成[53]:逡逑(1)預測分析逡逑首先對城市商圈這一對象附近的消費者環(huán)境、經濟環(huán)境、公共交通設施、以及政府逡逑對該商業(yè)區(qū)域的未來規(guī)劃等信息進行收集,再對商圈內的商業(yè)網點的經營范圍、經營品逡逑20逡逑
【學位授予單位】:杭州電子科技大學
【學位級別】:碩士
【學位授予年份】:2019
【分類號】:F713;TP311.13
【參考文獻】
相關期刊論文 前6條
1 江頡;王卓芳;陳鐵明;朱陳晨;陳波;;自適應AP聚類算法及其在入侵檢測中的應用[J];通信學報;2015年11期
2 王士君;馮章獻;張石磊;;經濟地域系統理論視角下的中心地及其擴散域[J];地理科學;2010年06期
3 王磊;汪西莉;劉高霞;趙琳;;一種結合半監(jiān)督的改進自適應親和傳播聚類[J];計算機應用研究;2010年12期
4 張宇;吳t
本文編號:2665246
本文鏈接:http://www.sikaile.net/jingjilunwen/guojimaoyilunwen/2665246.html