天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 軟件論文 >

數(shù)據(jù)挖掘在智能手機(jī)銷(xiāo)售數(shù)據(jù)中的應(yīng)用

發(fā)布時(shí)間:2021-04-25 23:13
  手機(jī)作為目前人們使用最多的電子設(shè)備,一方面既承擔(dān)著網(wǎng)絡(luò)購(gòu)物的終端作用,另一方面,本身也是消費(fèi)人群最多的商品之一,現(xiàn)在社會(huì)幾乎是人手一部。目前來(lái)看,手機(jī)還同時(shí)有逐漸取代傳統(tǒng)錢(qián)包以及銀行卡的趨勢(shì)。每年都有大量的各式各樣的手機(jī)通過(guò)線(xiàn)上渠道或者實(shí)體店被銷(xiāo)售出去,然而不同的手機(jī)商品銷(xiāo)量卻是大不相同,這其中影響手機(jī)銷(xiāo)量的因素有哪些呢?這是銷(xiāo)售手機(jī)的商家十分關(guān)注的問(wèn)題,也正是本文要研究的問(wèn)題。本文首先簡(jiǎn)單介紹了網(wǎng)絡(luò)爬蟲(chóng),利用網(wǎng)絡(luò)爬蟲(chóng)從某大型電商網(wǎng)站爬取所有在架銷(xiāo)售手機(jī)的詳細(xì)信息,包括各種參數(shù)配置信息以及銷(xiāo)量,評(píng)論數(shù)等等,其次對(duì)數(shù)據(jù)進(jìn)行清洗,提取各種字段用于后續(xù)建模分析。通過(guò)特征信息度以及Spearman相關(guān)系數(shù)對(duì)影響手機(jī)銷(xiāo)量水平的因素進(jìn)行了相關(guān)分析。為了預(yù)測(cè)一款特定手機(jī)商品的銷(xiāo)量水平情況,根據(jù)數(shù)據(jù)的特點(diǎn),文中分別利用決策樹(shù)算法,Bagging算法,隨機(jī)森林算法三種機(jī)器學(xué)習(xí)方法進(jìn)行建模分析,并利用交叉驗(yàn)證以及網(wǎng)格搜索選取隨機(jī)森林模型最優(yōu)的超參數(shù)。最后對(duì)各種算法的結(jié)果進(jìn)行比較發(fā)現(xiàn),基于決策樹(shù)的集成算法隨機(jī)森林算法要優(yōu)于其它兩種算法。當(dāng)選取合適的超參數(shù)后,隨機(jī)森林算法的結(jié)果明顯好于使用其默認(rèn)參數(shù)的結(jié)果,并... 

【文章來(lái)源】:北京工業(yè)大學(xué)北京市 211工程院校

【文章頁(yè)數(shù)】:52 頁(yè)

【學(xué)位級(jí)別】:碩士

【文章目錄】:
摘要
Abstract
第1章 緒論
    1.1 選題背景
    1.2 國(guó)內(nèi)外研究現(xiàn)狀
        1.2.1 國(guó)內(nèi)研究現(xiàn)狀
        1.2.2 國(guó)外研究現(xiàn)狀
    1.3 論文研究?jī)?nèi)容
第2章 網(wǎng)絡(luò)爬蟲(chóng)介紹以及數(shù)據(jù)抓取
    2.1 網(wǎng)絡(luò)爬蟲(chóng)介紹以及論文數(shù)據(jù)來(lái)源
        2.1.1 網(wǎng)絡(luò)爬蟲(chóng)介紹
        2.1.2 論文數(shù)據(jù)
    2.2 本文中使用的三個(gè)網(wǎng)絡(luò)爬蟲(chóng)
        2.2.1 爬蟲(chóng)一號(hào)介紹
        2.2.2 爬蟲(chóng)二號(hào)介紹
        2.2.3 爬蟲(chóng)三號(hào)介紹
    2.3 本章小結(jié)
第3章 數(shù)據(jù)清洗轉(zhuǎn)換
    3.1 數(shù)據(jù)質(zhì)量檢查以及修正
    3.2 衍生特征構(gòu)造
        3.2.1 手機(jī)支持網(wǎng)絡(luò)類(lèi)型
        3.2.2 評(píng)論比率
        3.2.3 官方店鋪
        3.2.4 累計(jì)銷(xiāo)售天數(shù)
    3.3 分類(lèi)變量編碼
        3.3.1 二水平分類(lèi)變量編碼
        3.3.2 多水平分類(lèi)變量編碼
    3.4 連續(xù)變量信息提取
    3.5 本章小結(jié)
第4章 手機(jī)銷(xiāo)量水平的影響因素分析及預(yù)測(cè)建模
    4.1 手機(jī)銷(xiāo)量水平的影響因素分析
        4.1.1 手機(jī)月平均銷(xiāo)量的分布情況
        4.1.2 手機(jī)月平均銷(xiāo)量的影響因素
    4.2 預(yù)測(cè)建模的相關(guān)算法原理介紹
        4.2.1 決策樹(shù)算法原理介紹
        4.2.2 工具箱sklearn中實(shí)現(xiàn)的決策樹(shù)算法
        4.2.3 集成算法原理介紹
        4.2.4 評(píng)價(jià)標(biāo)準(zhǔn)
    4.3 手機(jī)銷(xiāo)量水平的預(yù)測(cè)建模
        4.3.1 基于決策樹(shù)構(gòu)建預(yù)測(cè)模型
        4.3.2 基于集成算法構(gòu)建預(yù)測(cè)模型
    4.4 本章小結(jié)
結(jié)論
參考文獻(xiàn)
致謝


【參考文獻(xiàn)】:
期刊論文
[1]基于隨機(jī)森林回歸算法的感應(yīng)電機(jī)驅(qū)動(dòng)控制[J]. 彭喜英,李博文.  電氣傳動(dòng). 2018(06)
[2]基于網(wǎng)絡(luò)爬蟲(chóng)的京東電商平臺(tái)數(shù)據(jù)分析[J]. 魏倩男,賀正楚,陳一鳴.  經(jīng)濟(jì)數(shù)學(xué). 2018(01)
[3]基于Python的電商書(shū)籍?dāng)?shù)據(jù)爬蟲(chóng)研究[J]. 晉振杰,曹少中,項(xiàng)宏峰,王明道,李新佩.  北京印刷學(xué)院學(xué)報(bào). 2018(03)
[4]基于Python的Web信息獲取方法研究[J]. 魏冬梅,何忠秀,唐建梅.  軟件導(dǎo)刊. 2018(01)
[5]基于指數(shù)平滑與回歸分析的手機(jī)銷(xiāo)量預(yù)測(cè)研究[J]. 孫威,代明君.  牡丹江師范學(xué)院學(xué)報(bào)(自然科學(xué)版). 2017(04)
[6]基于Selenium的Python網(wǎng)絡(luò)爬蟲(chóng)的實(shí)現(xiàn)[J]. 花君林.  電腦編程技巧與維護(hù). 2017(15)
[7]基于爬蟲(chóng)的低價(jià)折扣推薦系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[J]. 鄭志越.  信息與電腦(理論版). 2016(19)
[8]網(wǎng)絡(luò)爬蟲(chóng)的設(shè)計(jì)與實(shí)現(xiàn)[J]. 董日壯,郭曙超.  電腦知識(shí)與技術(shù). 2014(17)
[9]基于隨機(jī)森林的特征選擇算法[J]. 姚登舉,楊靜,詹曉娟.  吉林大學(xué)學(xué)報(bào)(工學(xué)版). 2014(01)
[10]基于品牌手機(jī)未來(lái)銷(xiāo)量預(yù)測(cè)[J]. 陳紅周,劉碧玉,李學(xué)全.  數(shù)學(xué)理論與應(yīng)用. 2009(03)

碩士論文
[1]手機(jī)銷(xiāo)量影響因素分析及預(yù)測(cè)研究[D]. 唐楚.湖南大學(xué) 2017
[2]iPhone在華銷(xiāo)量影響因素研究[D]. 鄭雅微.湖南大學(xué) 2017
[3]基于數(shù)據(jù)挖掘的銷(xiāo)售預(yù)測(cè)研究[D]. 杜新武.山東輕工業(yè)學(xué)院 2011



本文編號(hào):3160261

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/3160261.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶(hù)8c6e0***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com