基于微博數(shù)據(jù)的電影票房預(yù)測(cè)研究
本文關(guān)鍵詞:基于微博數(shù)據(jù)的電影票房預(yù)測(cè)研究
更多相關(guān)文章: 微博 票房預(yù)測(cè) 情感強(qiáng)度 BP神經(jīng)網(wǎng)絡(luò)
【摘要】:隨著社交網(wǎng)絡(luò)的快速發(fā)展,越來(lái)越多的研究人員開(kāi)始關(guān)注如何利用社交媒體數(shù)據(jù)預(yù)測(cè)現(xiàn)實(shí)社會(huì)將要發(fā)生的事件。社交媒體中蘊(yùn)含著與用戶思想、行為相關(guān)的海量數(shù)據(jù),深入挖掘相關(guān)信息并將其應(yīng)用到預(yù)測(cè)恐怖活動(dòng)、國(guó)家選舉、社會(huì)突發(fā)事件等熱點(diǎn)問(wèn)題正成為當(dāng)前研究的熱門(mén)課題之一,這類研究對(duì)指導(dǎo)政府行為、商業(yè)活動(dòng)、生產(chǎn)生活都具有十分重要的意義。本文以微博數(shù)據(jù)預(yù)測(cè)電影票房為例,深入探究社交媒體預(yù)測(cè)現(xiàn)實(shí)事件的可行性和準(zhǔn)確性。本文首先介紹了電影票房預(yù)測(cè)的研究背景和意義,并從早期預(yù)測(cè)和實(shí)時(shí)預(yù)測(cè)兩方面分析了電影票房預(yù)測(cè)的研究現(xiàn)狀。在后續(xù)的章節(jié)中,文章介紹了微博的發(fā)展歷程和特點(diǎn)以及微博數(shù)據(jù)的抓取、清洗。然后我們提出了基于微博數(shù)量特征、情感強(qiáng)度和宣傳營(yíng)銷(xiāo)特征等多項(xiàng)特征分量融合的預(yù)測(cè)輸入模型,并引入多元線性回歸模型、BP神經(jīng)網(wǎng)絡(luò)模型、支持向量機(jī)模型對(duì)預(yù)測(cè)輸入模型的準(zhǔn)確性進(jìn)行驗(yàn)證。本文的主要研究?jī)?nèi)容和創(chuàng)新點(diǎn)如下:1.在微博數(shù)據(jù)清洗階段,提出了去除僵尸粉、廣告用戶和臨時(shí)用戶的算法,有效減少異常數(shù)據(jù),提高了預(yù)測(cè)精度;2.提出了基于情感強(qiáng)度的微博用戶行為分析方法,將用戶的情感傾向和情感的激烈程度相結(jié)合,更準(zhǔn)確地判定用戶對(duì)特定電影的喜好程度;3.對(duì)微博營(yíng)銷(xiāo)內(nèi)容分析歸類后提出將投資方、院線、演員的宣傳行為作為重要的參考因素加入預(yù)測(cè)模型;4.在對(duì)微博特征分析分類的基礎(chǔ)上,提出了基于數(shù)量特征、情感強(qiáng)度特征和宣傳特征的多特征預(yù)測(cè)輸入模型;5.針對(duì)微博中出現(xiàn)的異常數(shù)據(jù),提出了改進(jìn)的BP神經(jīng)網(wǎng)絡(luò),在輸入層和隱含層之間加入記憶層,減少異常數(shù)據(jù)對(duì)實(shí)驗(yàn)結(jié)果的影響,提高預(yù)測(cè)模型的容錯(cuò)能力。在實(shí)驗(yàn)仿真階段,文章對(duì)影響票房的各個(gè)特征分量進(jìn)行分析,找出其相關(guān)性,并對(duì)比分析不同預(yù)測(cè)模型和不同預(yù)測(cè)方法對(duì)預(yù)測(cè)準(zhǔn)確度的影響。實(shí)驗(yàn)驗(yàn)證了本文提出的預(yù)測(cè)模型與現(xiàn)有預(yù)測(cè)方法相比具有較高的準(zhǔn)確性和容錯(cuò)能力。同時(shí)實(shí)驗(yàn)得到一系列重要結(jié)論,對(duì)電影投資拍攝、影院排片和電影早期宣傳營(yíng)銷(xiāo)等提供了理論指導(dǎo)。
【關(guān)鍵詞】:微博 票房預(yù)測(cè) 情感強(qiáng)度 BP神經(jīng)網(wǎng)絡(luò)
【學(xué)位授予單位】:重慶大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類號(hào)】:TP393.092
【目錄】:
- 中文摘要3-4
- 英文摘要4-8
- 1 緒論8-13
- 1.1 電影票房預(yù)測(cè)的研究背景和意義8-10
- 1.1.1 電影市場(chǎng)發(fā)展迅速8
- 1.1.2 電影票房預(yù)測(cè)的商業(yè)價(jià)值8-10
- 1.2 國(guó)內(nèi)外研究現(xiàn)狀10-12
- 1.2.1 早期預(yù)測(cè)10-11
- 1.2.2 實(shí)時(shí)預(yù)測(cè)11-12
- 1.3 論文主要內(nèi)容和章節(jié)安排12-13
- 2 微博數(shù)據(jù)處理13-20
- 2.1 引言13
- 2.2 微博的進(jìn)化歷程13-14
- 2.3 微博特征分析14-16
- 2.4 微博數(shù)據(jù)的爬取16-17
- 2.5 微博數(shù)據(jù)的清洗17-19
- 2.6 小結(jié)19-20
- 3 基于微博多特征融合的電影票房預(yù)測(cè)模型20-31
- 3.1 引言20
- 3.2 微博數(shù)據(jù)的特征提取20-28
- 3.2.1 微博數(shù)據(jù)的數(shù)量特征20-21
- 3.2.2 微博數(shù)據(jù)的情感特征21-25
- 3.2.3 微博數(shù)的宣傳特征25-28
- 3.3 基于多特征的輸入模型28-29
- 3.4 小結(jié)29-31
- 4 現(xiàn)有預(yù)測(cè)模型分析和改進(jìn)31-46
- 4.1 引言31-32
- 4.2 多元線性回歸模型32-35
- 4.2.1 模型的推導(dǎo)33-34
- 4.2.2 最小二乘估計(jì)34-35
- 4.3 支持向量機(jī)模型35-38
- 4.3.1 最優(yōu)分類超平面35-36
- 4.3.2 支持向量回歸機(jī)36-37
- 4.3.3 非線性回歸問(wèn)題37-38
- 4.4 BP神經(jīng)網(wǎng)絡(luò)模型38-43
- 4.4.1 BP神經(jīng)網(wǎng)絡(luò)38
- 4.4.2 BP神經(jīng)元和BP網(wǎng)絡(luò)模型38-40
- 4.4.3 BP網(wǎng)絡(luò)的學(xué)習(xí)40-42
- 4.4.4 BP網(wǎng)絡(luò)的局限性42-43
- 4.5 改進(jìn)的BP神經(jīng)網(wǎng)絡(luò)模型43-45
- 4.6 小結(jié)45-46
- 5 實(shí)驗(yàn)結(jié)果及分析46-58
- 5.1 引言46
- 5.2 數(shù)據(jù)的初始化46-49
- 5.3 微博特征分量與票房相關(guān)性分析49-50
- 5.4 基于數(shù)量和情感強(qiáng)度的預(yù)測(cè)方法分析50-53
- 5.4.1 基于情感強(qiáng)度和基于傳統(tǒng)關(guān)鍵字方法對(duì)比50-52
- 5.4.2 基于數(shù)量和情感方法的預(yù)測(cè)準(zhǔn)確度對(duì)比52-53
- 5.5 不同預(yù)測(cè)模型準(zhǔn)確度分析53-54
- 5.6 與現(xiàn)有預(yù)測(cè)模型對(duì)比分析54-55
- 5.7 改進(jìn)的BP神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)準(zhǔn)確度分析55-57
- 5.8 小結(jié)57-58
- 6 總結(jié)與展望58-60
- 6.1 論文總結(jié)58
- 6.2 展望58-60
- 致謝60-61
- 參考文獻(xiàn)61-64
- 附錄 A. 作者在攻讀學(xué)位期間發(fā)表的論文目錄64
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 夏丹;;我國(guó)3D電影票房影響因素的實(shí)證分析[J];現(xiàn)代傳播(中國(guó)傳媒大學(xué)學(xué)報(bào));2012年09期
2 胡小莉;李波;吳正鵬;;電影票房的影響因素分析[J];中國(guó)傳媒大學(xué)學(xué)報(bào)(自然科學(xué)版);2013年01期
3 ;傳媒數(shù)字[J];現(xiàn)代視聽(tīng);2013年02期
4 ;每周熱門(mén)節(jié)點(diǎn)——1996年全美電影票房排行[J];每周電腦報(bào);1997年08期
5 ;中國(guó)電影票房破百億[J];青年記者;2011年03期
6 王文文;周澍民;;社會(huì)化媒體對(duì)電影票房的預(yù)測(cè)價(jià)值研究[J];新聞傳播;2013年12期
7 晉斌;張輝;;基于馬爾科夫鏈模型的中國(guó)3D電影票房研究[J];中國(guó)傳媒大學(xué)學(xué)報(bào)(自然科學(xué)版);2014年02期
8 笈藜;;電影票房分賬別讓觀眾買(mǎi)單[J];聲屏世界;2012年12期
9 ;傳媒數(shù)字[J];現(xiàn)代視聽(tīng);2013年07期
10 ;傳媒數(shù)字[J];現(xiàn)代視聽(tīng);2012年12期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前1條
1 昝勝鋒;朱文雁;;嵌入式廣告、文化暗合與電影票房[A];建設(shè)經(jīng)濟(jì)文化強(qiáng)。禾魬(zhàn)·機(jī)遇·對(duì)策——山東省社會(huì)科學(xué)界2009年學(xué)術(shù)年會(huì)文集(4)[C];2009年
中國(guó)重要報(bào)紙全文數(shù)據(jù)庫(kù) 前10條
1 記者 周南焱;北京電影票房10個(gè)月破6億元[N];北京日?qǐng)?bào);2009年
2 記者 張景華;北京2012年電影票房首超16億[N];光明日?qǐng)?bào);2013年
3 記者 李晚成;去年電影票房2.7億元[N];江西日?qǐng)?bào);2013年
4 記者 周南焱 實(shí)習(xí)生 孫杰;北京電影票房去年進(jìn)賬超16億元[N];北京日?qǐng)?bào);2013年
5 記者 龔雪 通訊員 于松業(yè);去年省電影票房突破8億元[N];湖北日?qǐng)?bào);2013年
6 記者 衛(wèi)小林;海南去年電影票房歷史性突破[N];海南日?qǐng)?bào);2013年
7 呂蓁;電影票房成新型炒股風(fēng)向標(biāo)[N];中國(guó)文化報(bào);2013年
8 記者 龔雪 通訊員 姚海陸 于松業(yè);春節(jié)假期電影票房超4千萬(wàn)[N];湖北日?qǐng)?bào);2013年
9 記者 吳園園;電影票房:5月一周頂過(guò)去一年[N];北京商報(bào);2013年
10 北京商報(bào)記者 吳園園;全年電影票房仍將平穩(wěn)增長(zhǎng)[N];北京商報(bào);2013年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前4條
1 王雪娟;電影票房預(yù)測(cè)研究發(fā)展史簡(jiǎn)論[D];重慶大學(xué);2015年
2 王偉;基于微博數(shù)據(jù)的電影票房預(yù)測(cè)研究[D];重慶大學(xué);2015年
3 楊威;基于微博數(shù)據(jù)的電影票房預(yù)測(cè)模型研究[D];安徽大學(xué);2014年
4 聶鴻迪;中國(guó)電影票房的影響因素及其實(shí)證研究[D];北京交通大學(xué);2015年
,本文編號(hào):972042
本文鏈接:http://www.sikaile.net/guanlilunwen/ydhl/972042.html