基于多源UGC數(shù)據(jù)的健康領(lǐng)域知識(shí)圖譜構(gòu)建
本文關(guān)鍵詞:基于多源UGC數(shù)據(jù)的健康領(lǐng)域知識(shí)圖譜構(gòu)建,由筆耕文化傳播整理發(fā)布。
【摘要】:消費(fèi)者的醫(yī)療保健觀念從過去的被動(dòng)就醫(yī),甚至諱疾忌醫(yī),到如今Web2.0時(shí)代的積極管理,主動(dòng)分享。消費(fèi)者的就醫(yī)模式也從原來的醫(yī)院掛號(hào)臨床就醫(yī),向著關(guān)注預(yù)防和日常保健、康復(fù)方向轉(zhuǎn)變。也因此,學(xué)術(shù)界、醫(yī)學(xué)界、商界都在積極探索如何才能為普通消費(fèi)者提供更加精準(zhǔn)、便捷和全面地醫(yī)療保健服務(wù)。而確認(rèn)消費(fèi)者對健康信息關(guān)注的主題是把握消費(fèi)者健康信息需求,進(jìn)而提供精準(zhǔn)醫(yī)療保健服務(wù)的先決條件。然而,就目前的研究來看,對消費(fèi)者健康主題分析的研究通常聚焦于某一類具體的疾病,所用到的數(shù)據(jù)樣本多直接來自于消費(fèi)者的,且用到的研究方法也大多是問卷調(diào)查法、實(shí)驗(yàn)法、訪談法等定性的研究方法。這些都有可能導(dǎo)致樣本量過小,研究范圍過窄,導(dǎo)致結(jié)論不夠全面,適用性不夠強(qiáng)。因此,本文提出結(jié)合使用定性和定量方法,對來自于為大眾普遍使用的社交媒體上的多種疾病數(shù)據(jù)進(jìn)行采集分析,提煉健康主題,提取特征詞匯及特征詞間關(guān)系,最終構(gòu)建消費(fèi)者健康知識(shí)圖譜,深入分析和討論了知識(shí)圖譜對于消費(fèi)者健康信息素養(yǎng)提升和健康信息系統(tǒng)設(shè)計(jì)的啟示,并探索了知識(shí)圖譜的具體應(yīng)用場景。本文的創(chuàng)新工作主要體現(xiàn)在以下幾點(diǎn):(1)研究對象的創(chuàng)新。本文綜合了四類社交媒體平臺(tái)上三種不同疾病的UGC數(shù)據(jù)作為研究對象,嘗試最大程度地覆蓋不同文本類型的不同疾病的健康信息文本,在此基礎(chǔ)上構(gòu)建消費(fèi)者關(guān)注的健康主題體系,并繪制圖譜和得出相關(guān)結(jié)論。(2)研究方法的應(yīng)用創(chuàng)新。本文提出了將定性研究方法開放式編碼與定量研究方法文本挖掘相結(jié)合,完成主題提煉和代表主題的特征詞提煉,以及特征詞間關(guān)系提煉,有效地從大量且結(jié)構(gòu)不一的文本數(shù)據(jù)中提取了多層次的主題特征,利于可視化展示和解讀。并在知識(shí)圖譜實(shí)現(xiàn)時(shí)引入圖形知識(shí)庫作為解決途徑。(3)研究成果的創(chuàng)新。本文通過研究分析,發(fā)現(xiàn),如果假設(shè)消費(fèi)對各類疾病的關(guān)注度一致,消費(fèi)者對于各類疾病的不同主題關(guān)注度存在明顯差異;不同健康主題之間也有遠(yuǎn)近親疏之分;來自不同社會(huì)化媒體的用詞用語在描述同一種疾病時(shí)也存在差異等有趣結(jié)論。
【關(guān)鍵詞】:知識(shí)圖譜 健康 UGC 社交媒體 編碼
【學(xué)位授予單位】:華東師范大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:G353.1
【目錄】:
- 內(nèi)容摘要6-7
- Abstract7-10
- 1 緒論10-19
- 1.1 研究背景與意義10-13
- 1.2 國內(nèi)外相關(guān)研究13-15
- 1.2.1 健康主題的研究角度13-15
- 1.2.2 健康主題的研究方法15
- 1.3 研究目的和研究內(nèi)容15-17
- 1.4 研究方法17-18
- 1.5 本文的組織結(jié)構(gòu)18-19
- 2 文獻(xiàn)綜述19-25
- 2.1 消費(fèi)者健康信息學(xué)19-21
- 2.2 知識(shí)圖譜方法及其應(yīng)用21-25
- 2.2.1 知識(shí)圖譜的主要應(yīng)用類型21-23
- 2.2.2 知識(shí)圖譜的構(gòu)建流程23
- 2.2.3 知識(shí)圖譜繪制工具23-25
- 3 健康領(lǐng)域知識(shí)圖譜構(gòu)建框架25-39
- 3.1 總體思路25-26
- 3.2 數(shù)據(jù)采集策略26-30
- 3.2.1 社會(huì)化媒體選擇26-28
- 3.2.2 疾病選擇28-29
- 3.2.3 數(shù)據(jù)采集方案29-30
- 3.3 開放式編碼30-32
- 3.3.1 引入開放式編碼技術(shù)的可行性與意義30-31
- 3.3.2 編碼策略的選擇31-32
- 3.4 特征詞提取32-35
- 3.4.1 分詞和文本預(yù)處理32-33
- 3.4.2 特征詞抽取33-35
- 3.5 特征詞關(guān)系提取35-37
- 3.5.1 選擇詞共現(xiàn)提取特征詞關(guān)系的原因35-36
- 3.5.2 特征詞關(guān)系提取的方案36-37
- 3.6 知識(shí)圖譜繪制37-39
- 3.6.1 選擇Neo4j繪制圖譜的原因37-38
- 3.6.2 Neo4j的基本使用38-39
- 4 健康領(lǐng)域基于UGC數(shù)據(jù)的知識(shí)圖譜繪制39-57
- 4.1 數(shù)據(jù)來源39-42
- 4.1.1 數(shù)據(jù)采集實(shí)現(xiàn)39-41
- 4.1.2 數(shù)據(jù)概述41-42
- 4.2 三種疾病UGC數(shù)據(jù)開放式編碼42-48
- 4.3 三種疾病UGC數(shù)據(jù)特征詞提取48-52
- 4.4 三種疾病UGC數(shù)據(jù)特征詞關(guān)系提取52-54
- 4.5 基于UGC數(shù)據(jù)的健康知識(shí)圖譜繪制54-57
- 4.5.1 數(shù)據(jù)導(dǎo)入54-55
- 4.5.2 圖譜繪制及分析55-57
- 5 分析與啟示57-69
- 5.1 不同疾病主題熱度差異探討57-60
- 5.1.1 分析57-59
- 5.1.2 啟示59-60
- 5.2 健康主題之間關(guān)系探討60-64
- 5.2.1 分析60-63
- 5.2.2 啟示63-64
- 5.3 特征詞特點(diǎn)探討64-67
- 5.3.1 分析64-66
- 5.3.2 啟示66-67
- 5.4 特征詞之間關(guān)系探討67-69
- 5.4.1 分析67-68
- 5.4.2 啟示68-69
- 6 健康知識(shí)圖譜的應(yīng)用69-72
- 6.1 為完善健康信息系統(tǒng)設(shè)計(jì)提供解決思路69-70
- 6.2 為提升公共圖書館健康信息服務(wù)提供借鑒70-71
- 6.3 為消費(fèi)者健康信息相關(guān)研究提供理論基礎(chǔ)71-72
- 7 總結(jié)和展望72-74
- 7.1 總結(jié)72-73
- 7.2 不足與展望73-74
- 參考文獻(xiàn)74-80
- 后記80
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前1條
1 李英英;王惠臨;;主題圖技術(shù)在消費(fèi)者健康信息資源組織中的應(yīng)用——以糖尿病為例[J];現(xiàn)代圖書情報(bào)技術(shù);2013年12期
中國重要會(huì)議論文全文數(shù)據(jù)庫 前4條
1 ;健康優(yōu)質(zhì)的食用油專家——上海佳格食品有限公司[A];“全國老年?duì)I養(yǎng)學(xué)術(shù)研討會(huì)”暨“四川省營養(yǎng)學(xué)會(huì)成立二十周年慶祝會(huì)”會(huì)議錄[C];2008年
2 蘇敬軾;;發(fā)展多種產(chǎn)品,滿足消費(fèi)者健康、營養(yǎng)的需求[A];21世紀(jì)人類食品面臨的新問題學(xué)術(shù)論文集[C];2001年
3 匡寶曉;;提高豬肉品質(zhì),保護(hù)消費(fèi)者健康[A];中國豬業(yè)發(fā)展大會(huì)暨中國畜牧業(yè)協(xié)會(huì)豬業(yè)分會(huì)第二屆會(huì)員代表大會(huì)論文集[C];2007年
4 尤如華;;標(biāo)準(zhǔn)化無公害養(yǎng)豬生產(chǎn)技術(shù)探討[A];云南省首屆無公害豬肉生產(chǎn)研討會(huì)、云南省奶業(yè)發(fā)展對策研討會(huì)論文集[C];2004年
中國重要報(bào)紙全文數(shù)據(jù)庫 前10條
1 市林業(yè)局局長 趙秀志;加強(qiáng)果品無公害生產(chǎn)監(jiān)管 切實(shí)保障消費(fèi)者健康安全[N];新鄉(xiāng)日報(bào);2006年
2 本報(bào)記者 張恒;五大問題危害消費(fèi)者健康[N];中國消費(fèi)者報(bào);2005年
3 呂妍 陳炳山;消費(fèi)者健康和安全不容漠視[N];新華日報(bào);2006年
4 ;以德結(jié)緣 擁抱健康[N];河北日報(bào);2010年
5 洪其華;消費(fèi)者健康才是關(guān)鍵[N];第一財(cái)經(jīng)日報(bào);2006年
6 記者 馬文生;政企攜手維護(hù)消費(fèi)者健康安全[N];中國國門時(shí)報(bào);2006年
7 中國消費(fèi)者報(bào) 劉焱;“消費(fèi)者健康洗滌承諾企業(yè)”品牌工程在全國展開[N];中國消費(fèi)者報(bào);2006年
8 ;食品生產(chǎn)經(jīng)營活動(dòng)中存在的問題[N];中國食品質(zhì)量報(bào);2003年
9 紀(jì)帆;健康與否決定人們是否買3D電視[N];中國信息報(bào);2010年
10 ;提高豬肉品質(zhì) 保護(hù)消費(fèi)者健康[N];中國畜牧獸醫(yī)報(bào);2007年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前2條
1 金碧漪;基于多源UGC數(shù)據(jù)的健康領(lǐng)域知識(shí)圖譜構(gòu)建[D];華東師范大學(xué);2016年
2 徐一方;消費(fèi)者健康信息需求模型的構(gòu)建與應(yīng)用[D];華東師范大學(xué);2015年
本文關(guān)鍵詞:基于多源UGC數(shù)據(jù)的健康領(lǐng)域知識(shí)圖譜構(gòu)建,,由筆耕文化傳播整理發(fā)布。
本文編號(hào):344208
本文鏈接:http://www.sikaile.net/tushudanganlunwen/344208.html