基于文本挖掘技術(shù)的社會(huì)熱點(diǎn)分析
發(fā)布時(shí)間:2024-04-18 20:29
隨著互聯(lián)網(wǎng)大數(shù)據(jù)時(shí)代的到來,互聯(lián)網(wǎng)上充斥著大量信息,如何獲取有效信息是一個(gè)值得研究的熱點(diǎn)問題。有別于傳統(tǒng)的數(shù)據(jù)挖掘技術(shù),文本挖掘需要我們從大量的非結(jié)構(gòu)或者半結(jié)構(gòu)化的文本數(shù)據(jù)中發(fā)現(xiàn)可能存在的、可以利用的知識(shí)模式,其現(xiàn)有的研究技術(shù)主要包括計(jì)算機(jī)、自然語言處理、機(jī)器學(xué)習(xí)等多個(gè)學(xué)科的理論;ヂ(lián)網(wǎng)中存在的數(shù)據(jù)是典型的半結(jié)構(gòu)化數(shù)據(jù),因而利用文本挖掘技術(shù)來分析處理互聯(lián)網(wǎng)數(shù)據(jù)對(duì)精準(zhǔn)的捕捉社會(huì)熱點(diǎn)問題和控制輿情具有重大的現(xiàn)實(shí)意義。本文研究的重點(diǎn)是如何利用文本挖掘理論對(duì)互聯(lián)網(wǎng)文本進(jìn)行分析研究,理論與實(shí)際相結(jié)合,將該方法用在現(xiàn)實(shí)社會(huì)中。外來務(wù)工人員作為一座城市不可分割的一部分,對(duì)城市的發(fā)展有重大作用。但是,大量的外來務(wù)工人員也帶來了落戶、住房、醫(yī)療、教育等方面的問題。因此本文將文本挖掘的技術(shù)同社會(huì)熱點(diǎn)相結(jié)合,希望通過文本挖掘技術(shù)對(duì)當(dāng)今社會(huì)存在的問題進(jìn)行研究分析,從而為政府提供政策制定的思路,為城市建設(shè)和經(jīng)濟(jì)發(fā)展提供保障。本文基于文本挖掘技術(shù),以進(jìn)杭務(wù)工人員為例分析了社會(huì)熱點(diǎn)問題,首先簡單介紹了本文研究的背景和國內(nèi)外文研究現(xiàn)狀。其次介紹了文本挖掘模型的理論,詳細(xì)介紹本文用到的文本挖掘模型、主題提取模型、聚類分...
【文章頁數(shù)】:62 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
本文編號(hào):3957698
【文章頁數(shù)】:62 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖1輿情、輿論分析的總體框架
現(xiàn)代傳播2014年第7期(總第216期)39圖1輿情、輿論分析的總體框架表1輿情分析指標(biāo)體系一級(jí)指標(biāo)二級(jí)指標(biāo)三級(jí)指標(biāo)指標(biāo)意義測量方法擴(kuò)散度含有事件相關(guān)信息的頁面的點(diǎn)擊量聚焦度對(duì)事件相關(guān)信息的搜索量解析度含有事件相關(guān)信息的頁面的點(diǎn)擊量(接收量)與事件相關(guān)的網(wǎng)絡(luò)輿情表達(dá)的數(shù)量之差參與....
本文編號(hào):3957698
本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/3957698.html
最近更新
教材專著