天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 文藝論文 > 影視論文 >

基于Stacking方法的電影票房預(yù)測(cè)

發(fā)布時(shí)間:2021-09-02 21:14
  隨著電影產(chǎn)業(yè)的不斷發(fā)展壯大和自媒體的出現(xiàn),越來(lái)越多的研究人員開(kāi)始關(guān)注如何利用自媒體上的數(shù)據(jù)預(yù)測(cè)一些社會(huì)事件。本文以豆瓣數(shù)據(jù)預(yù)測(cè)電影票房為例,通過(guò)爬蟲(chóng)得到豆瓣平臺(tái)上電影信息數(shù)據(jù)以及評(píng)論數(shù)據(jù)以達(dá)到準(zhǔn)確預(yù)測(cè)電影票房的效果,對(duì)電影的制作方以及電影的營(yíng)銷(xiāo)具有很好的指導(dǎo)作用。本文基于2016年全年以及2017年1月-11月國(guó)內(nèi)上映的150部電影,篩選出上映兩周短評(píng)數(shù)量最多的100部電影作為數(shù)據(jù)集進(jìn)行分析。鑒于預(yù)測(cè)電影票房影響因素選擇的重要性,往往一部電影的上映前兩周的口碑往往影響了后期電影票房的走勢(shì)情況,電影評(píng)論成為了觀眾是否進(jìn)入影院觀看電影的一大影響因素。于是本文在進(jìn)行電影票房預(yù)測(cè)的變量選擇時(shí),創(chuàng)新性的加入了情感特征因子,該情感特征因子是通過(guò)構(gòu)建電影評(píng)論情感傾向詞典來(lái)提取的,提取后的正向情感特征因子、負(fù)向情感特征因子與中性情感特征因子與電影票房的相關(guān)系數(shù)達(dá)到了0.87,-0.89,0.78。充分說(shuō)明了口碑對(duì)電影票房預(yù)測(cè)的重要性,同時(shí)也為電影票房預(yù)測(cè)新增了三個(gè)量化指標(biāo)。本文還改進(jìn)了電影票房的預(yù)測(cè)模型。通常用的電影票房預(yù)測(cè)模型是BP神經(jīng)網(wǎng)絡(luò)模型。但由于豆瓣網(wǎng)站上數(shù)據(jù)類(lèi)型多元,很難用單一的模型去描述其... 

【文章來(lái)源】:上海師范大學(xué)上海市

【文章頁(yè)數(shù)】:74 頁(yè)

【學(xué)位級(jí)別】:碩士

【部分圖文】:

基于Stacking方法的電影票房預(yù)測(cè)


票房市場(chǎng)規(guī)模和增速圖

算法流程圖,集成學(xué)習(xí),基礎(chǔ)層次


師范大學(xué)碩士學(xué)位論文 第 1 章 緒論集成學(xué)習(xí)(Ensemble learning)是最近幾年來(lái)機(jī)器學(xué)習(xí)中非常流行的思想之是通過(guò)組合幾種模型來(lái)提高機(jī)器學(xué)習(xí)的效果,與單一模型相比,該方法可以更好的預(yù)測(cè)結(jié)果。正因?yàn)槿绱,集成方法在許多著名的機(jī)器學(xué)習(xí)比賽中(如tflix,KDD 和 Kaggle 比賽)中能取得很好的名次[3]。Stacking 是一種集成學(xué)習(xí)技通過(guò)元分類(lèi)器或者元回歸聚合成多個(gè)分類(lèi)或者回歸模型,基礎(chǔ)層次模型基于的訓(xùn)練集進(jìn)行訓(xùn)練,然后元模型基于基礎(chǔ)層次模型的輸出進(jìn)行訓(xùn)練。下圖為cking 算法的基本思路圖:

刺客,票房,信條,豆瓣


形金剛 5 15.45 春嬌救志明 1.755彈專(zhuān)家 4.0049 刺客信條 1.610風(fēng)破浪 10.4852對(duì)電影票房評(píng)論進(jìn)行爬取的時(shí)候,存在一個(gè)問(wèn)題,選取上映多久后于預(yù)測(cè)電影票房。如果采取的票房評(píng)論時(shí)間線很長(zhǎng),那么得到的結(jié)告訴電影的制作方,這樣話(huà)電影制作方?jīng)]有辦法采取營(yíng)銷(xiāo)活動(dòng)盡可到最少。而采用的時(shí)間周期過(guò)短,并沒(méi)有足夠的量去做文本分析。映時(shí)間取決于電影的好壞,比如《戰(zhàn)狼 2》上映時(shí)間長(zhǎng)達(dá) 4 個(gè)多月為上映三周后的票房過(guò)差而提前下映。于是本文分析了 95 部電影周豆瓣評(píng)論總量所占比例,如下圖所示:

【參考文獻(xiàn)】:
期刊論文
[1]基于Holt-Winters無(wú)季節(jié)指數(shù)平滑模型的國(guó)內(nèi)電影票房預(yù)測(cè)[J]. 滑瑤,張輝,劉悅悅,韓晶晶.  中國(guó)傳媒大學(xué)學(xué)報(bào)(自然科學(xué)版). 2017(04)
[2]豆瓣電影評(píng)論文本的情感分析研究——基于2017年電影《乘風(fēng)破浪》爬蟲(chóng)數(shù)據(jù)[J]. 馮莎.  中國(guó)統(tǒng)計(jì). 2017(07)
[3]基于兩個(gè)單項(xiàng)模型的組合預(yù)測(cè)模型構(gòu)建方法[J]. 張延利,張德生.  統(tǒng)計(jì)與決策. 2017(07)
[4]遺傳神經(jīng)網(wǎng)絡(luò)模型在CPI預(yù)測(cè)中的實(shí)證檢驗(yàn)[J]. 何丹.  統(tǒng)計(jì)與決策. 2017(02)
[5]基于評(píng)論情感分析的用戶(hù)在線評(píng)價(jià)研究——以豆瓣網(wǎng)電影為例[J]. 馬松岳,許鑫.  圖書(shū)情報(bào)工作. 2016(10)
[6]基于隨機(jī)森林的影片票房預(yù)測(cè)[J]. 張?chǎng)?郭振宇.  現(xiàn)代電影技術(shù). 2016(03)
[7]情感詞典自動(dòng)構(gòu)建方法綜述[J]. 王科,夏睿.  自動(dòng)化學(xué)報(bào). 2016(04)
[8]基于社交媒體用戶(hù)評(píng)論和關(guān)注度的電影票房預(yù)測(cè)模型[J]. 周明升,韓冬梅.  微型機(jī)與應(yīng)用. 2014(18)
[9]基于SVM與BP的分類(lèi)與回歸比較研究[J]. 肖曉,徐啟華.  新型工業(yè)化. 2014(05)
[10]基于神經(jīng)網(wǎng)絡(luò)的電影票房預(yù)測(cè)建模[J]. 鄭堅(jiān),周尚波.  計(jì)算機(jī)應(yīng)用. 2014(03)

碩士論文
[1]基于深度學(xué)習(xí)卷積神經(jīng)網(wǎng)絡(luò)的電影票房預(yù)測(cè)[D]. 張雪.首都經(jīng)濟(jì)貿(mào)易大學(xué) 2017
[2]基于多元線性回歸模型的電影票房預(yù)測(cè)系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D]. 任丹.中山大學(xué) 2015
[3]電影票房預(yù)測(cè)研究發(fā)展史簡(jiǎn)論[D]. 王雪娟.重慶大學(xué) 2015
[4]基于微博數(shù)據(jù)的電影票房預(yù)測(cè)研究[D]. 王偉.重慶大學(xué) 2015



本文編號(hào):3379746

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/wenyilunwen/dianyingdianshilunwen/3379746.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶(hù)048c6***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com