基于微博數(shù)據(jù)的電影票房預測
發(fā)布時間:2017-04-02 19:17
本文關鍵詞:基于微博數(shù)據(jù)的電影票房預測,由筆耕文化傳播整理發(fā)布。
【摘要】:從全球范圍來看,電影行業(yè)是增長最迅速的產業(yè)。每年都有成千上萬部的電影上映,電影市場年均復合增長率也在逐年增長。然而人們的喜好是非常難預測的,一部電影上映之后,能夠滿足自負盈虧的平衡點具有相當高的風險,所以,電影票房預測一直是電影行業(yè)非常關注的問題。電影票房的研究在經歷“觀眾研究”和利用元數(shù)據(jù)、多因子的方法進行模型改進和影響因子的研究階段之后,研究者們充分利用了網民在線生成的海量內容作為預測的主要信息來源,建立了更加高效、準確的票房預測模型。預測算法都是在電影上映之前進行的,預測進行的越早價值越大,但是由于互聯(lián)網數(shù)據(jù)的滯后性,是電影上映之前和發(fā)布之后的微博數(shù)據(jù)量差距特別大,電影上映之前的微博數(shù)據(jù)量占總量的一小部分,大多數(shù)的微博數(shù)據(jù)都集中在電影上映的第一天或者是第一周,模型預測的性能和準確性一般都不高。為了盡量的消除互聯(lián)網數(shù)據(jù)的滯后性對預測結果的影響,本文提出了一種新的基于微博數(shù)據(jù)的預測模型來預測電影票房,我們提出將整個預測過程分為三個時間階段,使用預測算法構建了3個在時間維度連續(xù)的模型,即電影上映之前、電影上映一周以后、電影上映兩周以后分別預測電影上映后第一周的票房、電影上映后二周累計票房、電影上映后三周累計票房。將模型變量分為兩類,一是實際票房數(shù)據(jù),二是微博數(shù)據(jù)。在預測電影上映兩周、三周累計票房的時候,已經有了第一、二周的實時票房數(shù)據(jù),可以將實際票房也加入到預測模型中。在參考前人研究模型變量基礎之上,我們對微博數(shù)據(jù)做出提及、情感提及、積極情感、消極情感四個維度特征,并在這四個維度之上派生了十二個維度。3個預測模型都是通過遺傳算法優(yōu)化的支持向量回歸機進行構建的,通過仿真實驗得到了各個模型的最佳參數(shù),并通過絕對誤差值指標驗證了該模型的科學性和合理性,并且預測的時間越晚,準確率越高。
【關鍵詞】:票房預測 微博數(shù)據(jù) 支持向量回歸機 遺傳算法
【學位授予單位】:河北大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:J943
【目錄】:
- 摘要5-6
- Abstract6-10
- 第1章 緒論10-18
- 1.1 選題的背景及研究意義10-12
- 1.1.1 選題背景10-11
- 1.1.2 研究意義11-12
- 1.2 國內外研究進展12-15
- 1.2.1 電影觀眾研究12-13
- 1.2.2 模型改進及影響因子研究13-14
- 1.2.3 基于網民在線生成的海量內容14-15
- 1.3 研究目的和研究方法15-16
- 1.3.1 研究目的15
- 1.3.2 研究方法15-16
- 1.4 本文的創(chuàng)新點16
- 1.5 論文的基本框架16-18
- 第2章 相關的理論基礎18-27
- 2.1 微博數(shù)據(jù)18-20
- 2.1.1 微博的定義及功能分析18-19
- 2.1.2 微博數(shù)據(jù)的特性19-20
- 2.2 支持向量回歸機相關理論20-25
- 2.2.1 線性支持向量回歸機21-24
- 2.2.2 非線性支持向量回歸機24-25
- 2.3 遺傳算法優(yōu)化的支持向量回歸機25-26
- 2.4 本章小結26-27
- 第3章 基于微博數(shù)據(jù)的電影票房預測設計27-39
- 3.1 電影票房預測流程概述27-28
- 3.2 電影選擇和數(shù)據(jù)采集28-33
- 3.2.1 電影選擇28-29
- 3.2.2 電影票房數(shù)據(jù)采集29-30
- 3.2.3 微博數(shù)據(jù)采集30-33
- 3.3 模型架構和變量體系設計33-37
- 3.3.1 模型架構設計33
- 3.3.2 變量體系設計33-37
- 3.4 預測模型的構建37-38
- 3.5 性能評價38
- 3.6 本章小結38-39
- 第4章 仿真實驗與結果分析39-51
- 4.1 實驗數(shù)據(jù)39-45
- 4.2 仿真實驗與結果分析45-49
- 4.3 本章小結49-51
- 第5章 總結與展望51-52
- 5.1 論文的主要工作和結論51
- 5.2 進一步研究工作的展望51-52
- 參考文獻52-54
- 致謝54-55
- 攻讀碩士學位期間發(fā)表論文及科研情況55
本文關鍵詞:基于微博數(shù)據(jù)的電影票房預測,,由筆耕文化傳播整理發(fā)布。
本文編號:283037
本文鏈接:http://www.sikaile.net/wenyilunwen/dianyingdianshilunwen/283037.html