基于約簡隨機森林的電影票房預測分析
本文關(guān)鍵詞:基于約簡隨機森林的電影票房預測分析
更多相關(guān)文章: 中國影院 票房 隨機森林 決策樹
【摘要】:預測電影在影院的票房是許多影院管理者關(guān)注的一個困難且富有挑戰(zhàn)性的難題。影院管理者通過對一部影片的估計來決定其在上映期間的拍片方案。優(yōu)秀的排片表能夠大大提高影城的票房收入,降低影城的運營成本,因此排片對于影城的經(jīng)營很重要,對影院來說排片就是生產(chǎn)力。在本文中,我們使用一種約簡的隨機森林模型來預測電影在中國影院的首周票房。在機器學習中,隨機森林是一個包含多個決策樹的分類器,并且其輸出的類別是由個別樹輸出的類別的眾數(shù)而定。對一個新樣本進行分類時,我們把樣本所有的特征隨機輸入到隨機森林的各決策樹中。最后,隨機森林選取投票最多的類作為輸出結(jié)果。我們從兩個方面約簡隨機森林,隨機森林的強度和隨機森林樹之間的相關(guān)性。從最后的實驗結(jié)果來看,約簡隨機森林的表現(xiàn)優(yōu)于傳統(tǒng)的隨機森林。在本文中,我們把預測問題轉(zhuǎn)換為分類問題,其中根據(jù)電影票房的大小被分類8類。我們能從全國的68影院獲得票房數(shù)據(jù),從中國各大電影網(wǎng)站獲得電影的特征數(shù)據(jù)。我們對中國68家影院票房2013年和2014年的電影票房數(shù)據(jù)進行了分析,結(jié)果表明我們提出模型表現(xiàn)優(yōu)于其他的統(tǒng)計分析模型,如支持向量機和隨機森林等。在實際中,我們的模型可以預測一部電影在某個影院的收益情況,同時也為院線經(jīng)理安排電影排片方案提供的有效的參考。
【學位授予單位】:天津大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:J943;TP181
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 李建更;高志坤;;隨機森林:一種重要的腫瘤特征基因選擇法[J];生物物理學報;2009年01期
2 劉足華;熊惠霖;;基于隨機森林的目標檢測與定位[J];計算機工程;2012年13期
3 董師師;黃哲學;;隨機森林理論淺析[J];集成技術(shù);2013年01期
4 王象剛;;基于K均值隨機森林快速算法及入侵檢測中的應用[J];科技通報;2013年08期
5 陳姝;彭小寧;;基于粒子濾波和在線隨機森林分類的目標跟蹤[J];江蘇大學學報(自然科學版);2014年02期
6 羅知林;陳挺;蔡皖東;;一個基于隨機森林的微博轉(zhuǎn)發(fā)預測算法[J];計算機科學;2014年04期
7 王麗婷;丁曉青;方馳;;基于隨機森林的人臉關(guān)鍵點精確定位方法[J];清華大學學報(自然科學版);2009年04期
8 李建更;高志坤;;隨機森林針對小樣本數(shù)據(jù)類權(quán)重設(shè)置[J];計算機工程與應用;2009年26期
9 張建;武東英;劉慧生;;基于隨機森林的流量分類方法[J];信息工程大學學報;2012年05期
10 吳華芹;;基于訓練集劃分的隨機森林算法[J];科技通報;2013年10期
中國重要會議論文全文數(shù)據(jù)庫 前7條
1 謝程利;王金橋;盧漢清;;核森林及其在目標檢測中的應用[A];第六屆和諧人機環(huán)境聯(lián)合學術(shù)會議(HHME2010)、第19屆全國多媒體學術(shù)會議(NCMT2010)、第6屆全國人機交互學術(shù)會議(CHCI2010)、第5屆全國普適計算學術(shù)會議(PCC2010)論文集[C];2010年
2 武曉巖;方慶偉;;基因表達數(shù)據(jù)分析的隨機森林方法及算法改進[A];黑龍江省第十次統(tǒng)計科學討論會論文集[C];2008年
3 張?zhí)忑?梁龍;王康;李華;;隨機森林結(jié)合激光誘導擊穿光譜技術(shù)用于的鋼鐵分類[A];中國化學會第29屆學術(shù)年會摘要集——第19分會:化學信息學與化學計量學[C];2014年
4 相玉紅;張卓勇;;組蛋白去乙酰化酶抑制劑的構(gòu)效關(guān)系研究[A];第十一屆全國計算(機)化學學術(shù)會議論文摘要集[C];2011年
5 張濤;李貞子;武曉巖;李康;;隨機森林回歸分析方法及在代謝組學中的應用[A];2011年中國衛(wèi)生統(tǒng)計學年會會議論文集[C];2011年
6 馮飛翔;馮輔周;江鵬程;劉菁;劉建敏;;隨機森林和k-近鄰法在某型坦克變速箱狀態(tài)識別中的應用[A];第八屆全國轉(zhuǎn)子動力學學術(shù)討論會論文集[C];2008年
7 曹東升;許青松;梁逸曾;陳憲;李洪東;;組合樹的集合體和后向消除策略去分類P-糖蛋白化合物[A];第十屆全國計算(機)化學學術(shù)會議論文摘要集[C];2009年
中國博士學位論文全文數(shù)據(jù)庫 前6條
1 張乾;基于隨機森林的視覺數(shù)據(jù)分類關(guān)鍵技術(shù)研究[D];華南理工大學;2016年
2 薛小明;基于時頻分析與特征約簡的水電機組故障診斷方法研究[D];華中科技大學;2016年
3 曹正鳳;隨機森林算法優(yōu)化研究[D];首都經(jīng)濟貿(mào)易大學;2014年
4 雷震;隨機森林及其在遙感影像處理中應用研究[D];上海交通大學;2012年
5 岳明;基于隨機森林和規(guī)則集成法的酒類市場預測與發(fā)展戰(zhàn)略[D];天津大學;2008年
6 李書艷;單點氨基酸多態(tài)性與疾病相關(guān)關(guān)系的預測及其機制研究[D];蘭州大學;2010年
中國碩士學位論文全文數(shù)據(jù)庫 前10條
1 錢維;藥品不良反應監(jiān)測中隨機森林方法的建立與實現(xiàn)[D];第二軍醫(yī)大學;2012年
2 韓燕龍;基于隨機森林的指數(shù)化投資組合構(gòu)建研究[D];華南理工大學;2015年
3 賀捷;隨機森林在文本分類中的應用[D];華南理工大學;2015年
4 張文婷;交通環(huán)境下基于改進霍夫森林的目標檢測與跟蹤[D];華南理工大學;2015年
5 李強;基于多視角特征融合與隨機森林的蛋白質(zhì)結(jié)晶預測[D];南京理工大學;2015年
6 朱玟謙;一種收斂性隨機森林在人臉檢測中的應用研究[D];武漢理工大學;2015年
7 肖宇;基于序列圖像的手勢檢測與識別算法研究[D];電子科技大學;2014年
8 李慧;一種改進的隨機森林并行分類方法在運營商大數(shù)據(jù)的應用[D];電子科技大學;2015年
9 趙亞紅;面向多類標分類的隨機森林算法研究[D];哈爾濱工業(yè)大學;2014年
10 黎成;基于隨機森林和ReliefF的致病SNP識別方法[D];西安電子科技大學;2014年
,本文編號:1213374
本文鏈接:http://www.sikaile.net/jingjilunwen/whjj/1213374.html