基于互聯(lián)網(wǎng)搜索數(shù)據(jù)的流感預(yù)警模型比較與優(yōu)化
本文關(guān)鍵詞:基于互聯(lián)網(wǎng)搜索數(shù)據(jù)的流感預(yù)警模型比較與優(yōu)化
更多相關(guān)文章: 流感 搜索引擎 百度指數(shù) 預(yù)警模型 模型比較
【摘要】:流行性感冒是由流感病毒引起的急性呼吸道感染,也是一種傳染性強(qiáng)、傳播速度快的流行病。傳統(tǒng)流行病監(jiān)測(cè)系統(tǒng)的數(shù)據(jù)源為手工收集的臨床數(shù)據(jù),對(duì)于報(bào)告新興疾病來(lái)說(shuō)有一定延遲。而對(duì)于突發(fā)疫情,實(shí)時(shí)反饋和快速響應(yīng)至關(guān)重要。利用開源的網(wǎng)絡(luò)數(shù)據(jù)監(jiān)測(cè)流行病趨勢(shì)是對(duì)傳統(tǒng)監(jiān)測(cè)手段的有效補(bǔ)充,它可以提供關(guān)于疫情嚴(yán)重程度的早期預(yù)警并降低監(jiān)測(cè)費(fèi)用。2008年,Google發(fā)現(xiàn),搜索流感相關(guān)主題的人數(shù)與實(shí)際患有流感癥狀的人數(shù)之間存在著密切關(guān)系,他們依據(jù)這種數(shù)量關(guān)系提出了谷歌流感趨勢(shì),受到廣泛關(guān)注。在我國(guó),網(wǎng)民對(duì)搜索引擎的使用率可達(dá)到80%,其中國(guó)內(nèi)滲透率最高的綜合搜索引擎品牌為百度。在流感預(yù)警方面,雖然以往的研究對(duì)搜索引擎數(shù)據(jù)進(jìn)行了一定程度上的應(yīng)用,但多數(shù)研究的數(shù)據(jù)源于谷歌,而少數(shù)利用百度搜索數(shù)據(jù)進(jìn)行國(guó)內(nèi)流感預(yù)測(cè)的研究也并不系統(tǒng),且很少有學(xué)者專門比較各個(gè)模型的預(yù)測(cè)效果并進(jìn)行模型優(yōu)化;诖,本文擬通過(guò)百度搜索數(shù)據(jù),分析中文網(wǎng)絡(luò)關(guān)鍵詞和我國(guó)流行性疾病監(jiān)測(cè)結(jié)果的相關(guān)性,擬合并比較各種預(yù)測(cè)模型,探討利用網(wǎng)絡(luò)搜索數(shù)據(jù)輔助流行病監(jiān)測(cè)的應(yīng)用可能。本文的主要研究?jī)?nèi)容和結(jié)果如下:(1)從信息行為、信息搜尋行為等理論概念出發(fā),對(duì)網(wǎng)絡(luò)搜索數(shù)據(jù)與流感病例數(shù)據(jù)之間的邏輯關(guān)系進(jìn)行探討,建立理論框架模型,認(rèn)為個(gè)體健康情況可能會(huì)激發(fā)其對(duì)健康信息的需求,從而進(jìn)一步驅(qū)使個(gè)體實(shí)施健康信息搜尋行為。(2)根據(jù)搜索數(shù)據(jù)與流感病例數(shù)的關(guān)聯(lián)框架圖,用范圍選詞法從流感預(yù)防、流感癥狀、流感治療和流感常用詞四個(gè)維度對(duì)關(guān)鍵詞進(jìn)行初步篩選,得到79個(gè)初始搜索詞;然后利用互相關(guān),分析出初始搜索關(guān)鍵詞與流感病例數(shù)之間的相關(guān)關(guān)系和時(shí)差關(guān)系,最后得到22個(gè)關(guān)鍵詞用于構(gòu)建模型。在實(shí)證研究的過(guò)程中,時(shí)差分析結(jié)果與本文給出的關(guān)聯(lián)框架大致相同,先行十周左右的關(guān)鍵詞內(nèi)容都和流感疫苗相關(guān),先行一周左右的關(guān)鍵詞多涉及到流感的癥狀表現(xiàn),而同步類關(guān)鍵詞多為常用搜索詞或治療方法,在一定程度上印證了理論基礎(chǔ)的可行性。(3)根據(jù)時(shí)差關(guān)系和模型原理的不同,擬合了8個(gè)模型,通過(guò)比較擬合優(yōu)度和預(yù)測(cè)效果,發(fā)現(xiàn)多元線性回歸和人工神經(jīng)網(wǎng)絡(luò)模型具有更好的擬合優(yōu)度,但擬合效果好并不一定代表預(yù)測(cè)精度準(zhǔn);主成分回歸模型雖然在理論上可以減少變量之間的共線性,但實(shí)踐證明無(wú)論是其擬合效果還是預(yù)測(cè)效果相對(duì)于多元回歸模型來(lái)說(shuō)都有所下降。(4)對(duì)僅基于搜索數(shù)據(jù)的模型進(jìn)行優(yōu)化,引入流感監(jiān)測(cè)的歷史信息,形成結(jié)合歷史信息與網(wǎng)絡(luò)數(shù)據(jù)兩個(gè)變量的綜合模型。通過(guò)比較該優(yōu)化模型與僅基于歷史信息的時(shí)間序列模型、基于搜索數(shù)據(jù)的最優(yōu)模型,發(fā)現(xiàn)歷史數(shù)據(jù)和搜索數(shù)據(jù)包含的信息具有一定程度的互補(bǔ)性,聯(lián)合使用兩種數(shù)據(jù)進(jìn)行預(yù)測(cè)具有最好的預(yù)測(cè)效果。
【關(guān)鍵詞】:流感 搜索引擎 百度指數(shù) 預(yù)警模型 模型比較
【學(xué)位授予單位】:南開大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:R511.7
【目錄】:
- 中文摘要3-5
- Abstract5-9
- 第一章 緒論9-17
- 第一節(jié) 研究背景9-13
- 一、流行病與“流行病情報(bào)學(xué)”9-11
- 二、中國(guó)互聯(lián)網(wǎng)及搜索引擎的普及11-12
- 三、互聯(lián)網(wǎng)技術(shù)在流行病監(jiān)測(cè)領(lǐng)域中的應(yīng)用和影響12-13
- 第二節(jié) 研究意義、目的與內(nèi)容13-15
- 一、研究意義13-14
- 二、研究目的14
- 三、研究?jī)?nèi)容14-15
- 第三節(jié) 研究方法與技術(shù)路線15-17
- 一、研究方法15-16
- 二、技術(shù)路線16-17
- 第二章 文獻(xiàn)綜述17-24
- 第一節(jié) 基于網(wǎng)絡(luò)搜索數(shù)據(jù)的應(yīng)用研究17-20
- 一、經(jīng)濟(jì)金融領(lǐng)域的應(yīng)用研究17-18
- 二、社會(huì)心理領(lǐng)域的應(yīng)用研究18-19
- 三、旅游管理領(lǐng)域的應(yīng)用研究19
- 四、消費(fèi)者行為領(lǐng)域的應(yīng)用研究19-20
- 第二節(jié) 基于網(wǎng)絡(luò)搜索數(shù)據(jù)的流行病監(jiān)測(cè)應(yīng)用研究20-24
- 一、流感監(jiān)測(cè)的應(yīng)用研究20-22
- 二、其它流行病監(jiān)測(cè)的應(yīng)用研究22-24
- 第三章 理論框架與模型原理24-34
- 第一節(jié) 理論基礎(chǔ)與框架24-26
- 第二節(jié) 關(guān)鍵詞選擇原理26-29
- 一、關(guān)鍵詞初選26-27
- 二、互相關(guān)分析27-29
- 第三節(jié) 預(yù)測(cè)模型原理29-34
- 一、一元線性回歸29-30
- 二、多元線性回歸30-31
- 三、主成分回歸31-32
- 四、人工神經(jīng)網(wǎng)絡(luò)模型32-33
- 五、時(shí)間序列分析33-34
- 第四章 實(shí)證分析34-63
- 第一節(jié) 數(shù)據(jù)來(lái)源34-35
- 一、中國(guó)國(guó)家流感中心流感周報(bào)34
- 二、百度指數(shù)34-35
- 第二節(jié) 關(guān)鍵詞選擇結(jié)果35-40
- 一、關(guān)鍵詞初選結(jié)果35-38
- 二、互相關(guān)分析結(jié)果38-40
- 第三節(jié) 基于搜索數(shù)據(jù)的流感預(yù)警模型擬合與檢驗(yàn)40-51
- 一、一元線性回歸模型40-43
- 二、多元線性回歸模型43-46
- 三、主成份回歸模型46-50
- 四、BP神經(jīng)網(wǎng)絡(luò)模型50-51
- 第四節(jié) 基于搜索數(shù)據(jù)的模型效果比較51-58
- 一、模型擬合效果比較52-54
- 二、模型預(yù)測(cè)能力比較54-58
- 第五節(jié) 優(yōu)化模型的建立與比較58-63
- 一、模型建立58-60
- 二、模型比較60-63
- 第五章 結(jié)論63-67
- 第一節(jié) 討論63-65
- 第二節(jié) 研究發(fā)現(xiàn)65-66
- 第三節(jié) 研究局限與未來(lái)展望66-67
- 參考文獻(xiàn)67-72
- 致謝72-73
- 個(gè)人簡(jiǎn)歷、在學(xué)期間發(fā)表的學(xué)術(shù)論文與研究成果73
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前4條
1 張敏;杜燮yN;朱彩云;劉國(guó)華;;高危作業(yè)有害因素預(yù)防控制水平預(yù)警模型[J];中國(guó)安全生產(chǎn)科學(xué)技術(shù);2009年02期
2 萬(wàn)歡英;過(guò)依;;慢性阻塞性肺疾病預(yù)警模型研究[J];內(nèi)科理論與實(shí)踐;2012年06期
3 劉如春;陳田木;;長(zhǎng)沙市流感/甲型H1N1流感預(yù)警模型建立與評(píng)價(jià)[J];醫(yī)學(xué)動(dòng)物防制;2010年04期
4 ;[J];;年期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前6條
1 張國(guó)興;劉鵬;汪應(yīng)洛;郭菊娥;;銀行集中信用違約預(yù)警模型[A];社會(huì)經(jīng)濟(jì)發(fā)展轉(zhuǎn)型與系統(tǒng)工程——中國(guó)系統(tǒng)工程學(xué)會(huì)第17屆學(xué)術(shù)年會(huì)論文集[C];2012年
2 鄭伯峰;張錦;李司鐸;劉瀟;;基于貝葉斯網(wǎng)絡(luò)的大客戶離網(wǎng)預(yù)警模型研究[A];第四屆中國(guó)智能計(jì)算大會(huì)論文集[C];2010年
3 應(yīng)江勇;周宇;;決策樹在我國(guó)通信行業(yè)用戶預(yù)警模型中的研究應(yīng)用[A];第十三屆中國(guó)管理科學(xué)學(xué)術(shù)年會(huì)論文集[C];2011年
4 翟東升;張金寶;王明吉;張書杰;;基于財(cái)務(wù)指標(biāo)的上市公司信用預(yù)警模型研究[A];中國(guó)現(xiàn)場(chǎng)統(tǒng)計(jì)研究會(huì)第12屆學(xué)術(shù)年會(huì)論文集[C];2005年
5 文柯;;基于Logistic的上市公司產(chǎn)融結(jié)合風(fēng)險(xiǎn)預(yù)警模型研究[A];第十四屆中國(guó)管理科學(xué)學(xué)術(shù)年會(huì)論文集(上冊(cè))[C];2012年
6 潘潔珠;吳共慶;胡學(xué)鋼;;基于關(guān)聯(lián)規(guī)則的成績(jī)預(yù)警模型研究[A];計(jì)算機(jī)技術(shù)與應(yīng)用進(jìn)展·2007——全國(guó)第18屆計(jì)算機(jī)技術(shù)與應(yīng)用(CACIS)學(xué)術(shù)會(huì)議論文集[C];2007年
中國(guó)重要報(bào)紙全文數(shù)據(jù)庫(kù) 前4條
1 本報(bào)通訊員 宋娟 嚴(yán)明良;構(gòu)建預(yù)警模型 降低路網(wǎng)風(fēng)險(xiǎn)[N];中國(guó)氣象報(bào);2013年
2 廣發(fā)證券股份有限公司 何沛俐 章早立;立體空間下的全新財(cái)務(wù)危機(jī)遠(yuǎn)期預(yù)警模型[N];證券時(shí)報(bào);2003年
3 記者 謝柳;合眾人壽完成信用風(fēng)險(xiǎn)預(yù)警模型[N];中國(guó)保險(xiǎn)報(bào);2011年
4 張憲邋郝力平 涂春輝 王法力 洪明 劉年財(cái);全流通后警惕公司財(cái)務(wù)危機(jī)[N];中國(guó)證券報(bào);2007年
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前9條
1 董鶴云;大型施工項(xiàng)目目標(biāo)偏差適時(shí)監(jiān)控方法及預(yù)警模型研究[D];華北電力大學(xué);2015年
2 劉彥文;上市公司財(cái)務(wù)危機(jī)預(yù)警模型研究[D];大連理工大學(xué);2009年
3 朱鈞鈞;主權(quán)違約風(fēng)險(xiǎn)的評(píng)估方法和預(yù)警模型[D];復(fù)旦大學(xué);2011年
4 丁寶成;煤礦安全預(yù)警模型及應(yīng)用研究[D];遼寧工程技術(shù)大學(xué);2010年
5 張?jiān)撇?工程項(xiàng)目工期延誤原因及預(yù)警模型研究[D];天津大學(xué);2004年
6 趙軍;基于GIS空間統(tǒng)計(jì)分析的區(qū)域房地產(chǎn)動(dòng)態(tài)預(yù)警模型[D];中國(guó)地質(zhì)大學(xué)(北京);2011年
7 張加強(qiáng);中國(guó)農(nóng)業(yè)類上市公司可持續(xù)發(fā)展預(yù)警模型研究[D];華中農(nóng)業(yè)大學(xué);2011年
8 汪冬華;我國(guó)上市公司行業(yè)分析方法及違約風(fēng)險(xiǎn)預(yù)警模型研究[D];華中科技大學(xué);2004年
9 馬輝;中國(guó)金融風(fēng)險(xiǎn)指標(biāo)體系構(gòu)建與預(yù)警研究[D];吉林大學(xué);2009年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 冷靜;秦皇島旅游業(yè)可持續(xù)發(fā)展預(yù)警模型建立[D];燕山大學(xué);2015年
2 陳小志;輸電線路鳥害預(yù)警模型及系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];電子科技大學(xué);2014年
3 汪旭穎;基于支持向量回歸機(jī)的油田異常井預(yù)警模型研究[D];東北石油大學(xué);2015年
4 劉若辰;我國(guó)建筑業(yè)上市公司財(cái)務(wù)危機(jī)預(yù)警模型研究[D];山東建筑大學(xué);2016年
5 王敏蝦;基于邏輯回歸關(guān)聯(lián)規(guī)則的疾病預(yù)警模型[D];山東大學(xué);2016年
6 明杰;企業(yè)安全生產(chǎn)預(yù)警模型與應(yīng)用研究[D];首都經(jīng)濟(jì)貿(mào)易大學(xué);2016年
7 王若佳;基于互聯(lián)網(wǎng)搜索數(shù)據(jù)的流感預(yù)警模型比較與優(yōu)化[D];南開大學(xué);2016年
8 潘志兵;我國(guó)上市公司財(cái)務(wù)失敗預(yù)警模型的實(shí)證研究及應(yīng)用[D];西北工業(yè)大學(xué);2002年
9 尚紅超;金融危機(jī)預(yù)警模型的系統(tǒng)研究[D];東北財(cái)經(jīng)大學(xué);2010年
10 張海蘭;基于平衡計(jì)分卡的企業(yè)預(yù)警模型構(gòu)建研究[D];首都經(jīng)濟(jì)貿(mào)易大學(xué);2006年
,本文編號(hào):820585
本文鏈接:http://www.sikaile.net/yixuelunwen/chuanranbingxuelunwen/820585.html