天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 搜索引擎論文 >

面向信息分析與預(yù)測的網(wǎng)絡(luò)搜索關(guān)鍵詞集中度和相關(guān)度研究

發(fā)布時間:2019-09-08 19:09
【摘要】:基于網(wǎng)絡(luò)搜索的信息分析與預(yù)測是依據(jù)用戶的網(wǎng)絡(luò)搜索行為來解釋事物內(nèi)在規(guī)律,并對事物未知變化趨勢進行估計的一種信息分析與預(yù)測活動。它的起源和發(fā)展離不開互聯(lián)網(wǎng)的普及和發(fā)展,尤其是網(wǎng)絡(luò)搜索引擎的出現(xiàn),為信息分析與預(yù)測提供了龐大的用戶樣本和海量的數(shù)據(jù)。國外研究人員在本世紀初就開始了該領(lǐng)域的實證研究, Ginsberg等人針對流感流行趨勢的研究成為該領(lǐng)域研究的重要代表成果,也推動了基于網(wǎng)絡(luò)搜索的信息分析與預(yù)測研究成為國內(nèi)外學(xué)者廣泛關(guān)注的研究內(nèi)容。 本文以基于網(wǎng)絡(luò)搜索的信息分析與預(yù)測活動中的重要環(huán)節(jié)——關(guān)鍵詞選擇作為研究對象,詳細介紹了基于網(wǎng)絡(luò)搜索的信息分析與預(yù)測活動的相關(guān)理論,闡述了面向信息分析與預(yù)測的網(wǎng)絡(luò)搜索關(guān)鍵詞選擇的基本過程,詳細介紹了關(guān)鍵詞選擇的兩種方法,即關(guān)鍵詞集中度和相關(guān)度,嘗試使用這兩種方法對觀測關(guān)鍵詞的選擇進行實驗效果分析。 全文共分六章,主要內(nèi)容如下: (1)基于網(wǎng)絡(luò)搜索的信息分析與預(yù)測的相關(guān)理論 本章系統(tǒng)闡述了基于網(wǎng)絡(luò)搜索的信息分析與預(yù)測的概念、起源和發(fā)展、作用、特點,以及基于網(wǎng)絡(luò)搜索的信息分析與預(yù)測的研究視角、內(nèi)在機制及影響因素,并利用Ginsberg的45個流感關(guān)鍵詞分析了基于網(wǎng)絡(luò)搜索的信息分析與預(yù)測的局限性,最后提出了基于網(wǎng)絡(luò)搜索的信息分析與預(yù)測的基本流程。 (2)面向信息分析與預(yù)測的網(wǎng)絡(luò)搜索關(guān)鍵詞選擇的基本過程 本章重點介紹了分析預(yù)測過程的重要環(huán)節(jié)——關(guān)鍵詞選擇的過程。關(guān)鍵詞、數(shù)據(jù)集以及分析預(yù)測模型是基于網(wǎng)絡(luò)搜索的信息分析與預(yù)測的三個主要因素;诰W(wǎng)絡(luò)搜索的信息分析與預(yù)測活動包括前期分析、關(guān)鍵詞選擇、相關(guān)分析及預(yù)測模型建立、效果驗證、實施預(yù)測、動態(tài)修正等六個主要環(huán)節(jié)。關(guān)鍵詞的選擇過程包括任務(wù)準備、選擇關(guān)鍵詞數(shù)據(jù)來源、選擇初始關(guān)鍵詞、收集候選關(guān)鍵詞以及確定觀測關(guān)鍵詞、確定關(guān)鍵詞的分析與預(yù)測組合以及反饋修改等七個主要過程。關(guān)鍵詞選擇過程是從初始關(guān)鍵詞、候選關(guān)鍵詞到觀測關(guān)鍵詞的一個過程。對于最終用于分析與預(yù)測的觀測關(guān)鍵詞則具有典型的馬太效應(yīng)、長尾效應(yīng)等現(xiàn)象,其離散分布則呈現(xiàn)出一種Zipf分布特征。 (3)關(guān)鍵詞集中度分析 本章引入了關(guān)鍵詞集中度、關(guān)鍵詞移動平均集中度、關(guān)鍵詞集中度變化率以及關(guān)鍵詞移動平均集中度變化率等概念。以Ginsberg的45個流感關(guān)鍵詞作為研究對象,發(fā)現(xiàn)在區(qū)分關(guān)鍵詞“穩(wěn)定—突變”特征的效果上,關(guān)鍵詞集中度變化率要優(yōu)于關(guān)鍵詞集中度。 (4)關(guān)鍵詞相關(guān)度分析 本章主要介紹了簡單相關(guān)性分析和時序相關(guān)分析方法,包括pearson、spearman、時差相關(guān)、峰谷對應(yīng)等相關(guān)分析方法。在與萬科股票相關(guān)的關(guān)鍵詞選擇實例分析中,發(fā)現(xiàn)pearson、spearman可以有效地判斷同步條件下的關(guān)鍵詞相關(guān)性強弱特征,而時差相關(guān)分析方法則可以有效地識別關(guān)鍵詞“領(lǐng)先—滯后”特征。 (5)H7N9禽流感關(guān)鍵詞選擇實驗研究 本章主要結(jié)合2013年上半年爆發(fā)的H7N9禽流感疫情,運用關(guān)鍵詞集中度和相關(guān)度分析方法,對與H7N9禽流感爆發(fā)有關(guān)的關(guān)鍵詞進行比較分析,并得出了可用于不同研究領(lǐng)域的三組觀測關(guān)鍵詞表。 (6)對論文的整體進行總結(jié)和展望 本章對全文的研究工作進行總結(jié),并對基于網(wǎng)絡(luò)搜索的信息分析與預(yù)測研究的未來發(fā)展方向進行了展望,提出了三個有價值的研究問題。
【圖文】:

全球互聯(lián)網(wǎng),互聯(lián)網(wǎng),移動應(yīng)用,節(jié)點狀態(tài)


選題背景和研究意義.1選題背景從上世紀90年代互聯(lián)網(wǎng)誕生后,網(wǎng)絡(luò)數(shù)據(jù)量急劇膨脹。據(jù)2009年英國衛(wèi)報篇報道稱,由于互聯(lián)網(wǎng)社交網(wǎng)站、帶有上網(wǎng)功能的移動電話和政府不斷膨脹頻監(jiān)視器的同T 作用下,全球的數(shù)據(jù)總量已經(jīng)達到4870億GB?。圖0-1是rl.com的internet map移動應(yīng)用軟件?展示的全球互聯(lián)網(wǎng)節(jié)點的發(fā)展歷程和趨三張圖分別是1994、2012和2020年全球互聯(lián)網(wǎng)節(jié)點狀態(tài)。從第三張圖可以,未來互聯(lián)網(wǎng)的發(fā)展將完全滲透全球各個角落。

網(wǎng)站,流感,全球


搜索“流感”的人都真的患有流感,但當把與流感有關(guān)的搜索查詢匯總按時間順序統(tǒng)計時,發(fā)現(xiàn)許多搜索查詢在流感季節(jié)確實會明顯增多②(如圖0-2所示,其中紅色連續(xù)實線表示cdc數(shù)據(jù),黑色分斷實線表示搜索分析數(shù)據(jù),,黑色虛線表示預(yù)測值區(qū)間)。通過對世界各地與流感相關(guān)搜索查詢次數(shù)進行統(tǒng)計,谷歌便估測出世界上不同國家和地區(qū)的流感爆發(fā)情況? (如圖0_3所示)。12 1 1 1 1~‘ 1 10 - I .-! 1 I -8 e - ;1 I -2004 2005 2006 2007 2008圖0 - 2 google flu預(yù)測模型結(jié)果-.... ‘圖0 - 3 google flu trends網(wǎng)站公布的全球流感監(jiān)測圖① http://www.cclc.gov/flu/index.htm? http://www.google.org/flutrends/about/how.html③ http://www.google.org/flutrends/7
【學(xué)位授予單位】:武漢大學(xué)
【學(xué)位級別】:博士
【學(xué)位授予年份】:2013
【分類號】:G252.7

【參考文獻】

相關(guān)期刊論文 前10條

1 王知津;韓正彪;;信息行為集成化研究框架初探[J];中國圖書館學(xué)報;2012年01期

2 鄧曉旭;;網(wǎng)絡(luò)傳播價值體系論[J];陜西師范大學(xué)學(xué)報(哲學(xué)社會科學(xué)版);2010年06期

3 曾潤喜;;網(wǎng)絡(luò)輿情管控工作機制研究[J];圖書情報工作;2009年18期

4 曾潤喜;;網(wǎng)絡(luò)輿情信息資源共享研究[J];情報雜志;2009年08期

5 胡軍;張超;陳平雁;;非參數(shù)雙變量相關(guān)分析方法Spearman和Kendall的Monte Carlo模擬比較[J];中國衛(wèi)生統(tǒng)計;2008年06期

6 紀良綱;王慧娟;;商品流通規(guī)模監(jiān)測預(yù)警指標的篩選——基于時差相關(guān)分析法的視角[J];經(jīng)濟與管理;2008年02期

7 蘇金樹;張博鋒;徐昕;;基于機器學(xué)習(xí)的文本分類技術(shù)研究進展[J];軟件學(xué)報;2006年09期

8 李雙雙;陳毅文;李江予;;消費者網(wǎng)上購物決策模型分析[J];心理科學(xué)進展;2006年02期

9 曹雙喜;鄧小昭;;網(wǎng)絡(luò)用戶信息行為研究述略[J];情報雜志;2006年02期

10 何明升;網(wǎng)絡(luò)消費方式的內(nèi)在結(jié)構(gòu)及其形成機理[J];哈爾濱工業(yè)大學(xué)學(xué)報(社會科學(xué)版);2002年01期

相關(guān)博士學(xué)位論文 前1條

1 王曰芬;文獻計量法與內(nèi)容分析法的綜合研究[D];南京理工大學(xué);2007年

相關(guān)碩士學(xué)位論文 前4條

1 邱娣;基于Web日志挖掘的用戶信息需求識別研究[D];華中師范大學(xué);2012年

2 王林生;我國網(wǎng)絡(luò)消費影響因素理論與實證分析[D];重慶工商大學(xué);2012年

3 劉華;論搜索數(shù)據(jù)在網(wǎng)絡(luò)傳播研究中的應(yīng)用價值與途徑[D];山東師范大學(xué);2011年

4 王斕樾;用戶行為分析在搜索引擎中的應(yīng)用[D];沈陽工業(yè)大學(xué);2007年



本文編號:2533401

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/sousuoyinqinglunwen/2533401.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶db3b2***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com