天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于汽車網(wǎng)絡(luò)輿情的數(shù)據(jù)分析系統(tǒng)研究與應(yīng)用

發(fā)布時(shí)間:2020-11-05 00:02
   隨著互聯(lián)網(wǎng)技術(shù)的快速發(fā)展,網(wǎng)站瀏覽與信息發(fā)布成為人們網(wǎng)絡(luò)生活不可缺少的一部分。與此同時(shí),各大網(wǎng)站與論壇中已經(jīng)積累了海量的網(wǎng)絡(luò)輿情數(shù)據(jù),其中蘊(yùn)含著一定的挖掘與分析的價(jià)值。企業(yè)也已經(jīng)將網(wǎng)絡(luò)輿情監(jiān)控、數(shù)據(jù)分析等工作列入企業(yè)數(shù)字化戰(zhàn)略的一部分。對(duì)于整車企業(yè)而言,網(wǎng)絡(luò)輿情數(shù)據(jù)分析正在不斷地凸顯其應(yīng)用價(jià)值。整車企業(yè)開拓新市場(chǎng)依賴于精準(zhǔn)的市場(chǎng)定位,并通過新車型的發(fā)布滿足市場(chǎng)需求。傳統(tǒng)的數(shù)據(jù)分析依賴于統(tǒng)計(jì)年鑒、行業(yè)管理部門數(shù)據(jù)、屬地市場(chǎng)調(diào)查等信息,這些數(shù)據(jù)大多存在準(zhǔn)確度低、時(shí)效性差、樣本量不足等缺點(diǎn)。其次,依靠傳統(tǒng)的數(shù)據(jù)收集和統(tǒng)計(jì)難以滿足大數(shù)據(jù)環(huán)境下的分析需求,缺乏自動(dòng)化的數(shù)據(jù)分析工具和有效的數(shù)據(jù)方法成為阻礙業(yè)務(wù)發(fā)展的痛點(diǎn)。除此之外,數(shù)據(jù)沒有積累,導(dǎo)致了數(shù)據(jù)復(fù)用性,分析方法拓展性的嚴(yán)重缺失。采集并積累汽車網(wǎng)絡(luò)輿情數(shù)據(jù),構(gòu)建高效、可靠的數(shù)據(jù)分析系統(tǒng),通過數(shù)據(jù)可視化支持整車企業(yè)的戰(zhàn)略決策成為了解決這些問題的關(guān)鍵。本文首先對(duì)網(wǎng)絡(luò)輿情數(shù)據(jù)分析的研究背景與現(xiàn)狀進(jìn)行論述,介紹了本文的研究?jī)?nèi)容。其次對(duì)網(wǎng)絡(luò)輿情分析的方法論,即文本挖掘進(jìn)行了介紹,同時(shí)介紹了相關(guān)的算法與技術(shù)。然后在基于目前的現(xiàn)狀,提出了一套整體的解決方案。對(duì)輿情情感分析、市場(chǎng)洞察分析和新詞發(fā)現(xiàn)的研究與實(shí)驗(yàn)進(jìn)行了論述。針對(duì)輿情情感分析,首先介紹了網(wǎng)絡(luò)輿情數(shù)據(jù)預(yù)處理的過程,包括數(shù)據(jù)清洗、文本轉(zhuǎn)換和分句分詞。其中著重介紹了文本分詞的原理和執(zhí)行方法。然后根據(jù)汽車行業(yè)的特點(diǎn)構(gòu)建了專業(yè)詞庫。本文將詞庫匹配和基于Spark的機(jī)器學(xué)習(xí)算法進(jìn)行結(jié)合,提出了一套輿情情感分析的整體流程。著重介紹了機(jī)器學(xué)習(xí)算法的訓(xùn)練與評(píng)價(jià)過程。對(duì)決策樹、邏輯回歸、樸素貝葉斯等多種文本分類算法進(jìn)行訓(xùn)練和測(cè)試,根據(jù)Fmeasure評(píng)價(jià)結(jié)果選擇運(yùn)行效果較好的算法運(yùn)用到系統(tǒng)構(gòu)建中。在汽車市場(chǎng)洞察分析中,本文針對(duì)整車產(chǎn)品的競(jìng)爭(zhēng)關(guān)系、購車比較以及購車決策路徑三個(gè)分析場(chǎng)景提出了相應(yīng)的分析方法。運(yùn)用詞庫匹配的方式進(jìn)行數(shù)據(jù)處理。依托數(shù)據(jù)倉庫技術(shù),設(shè)計(jì)提供了相關(guān)主題域的邏輯模型。最終提供了多種圖表展現(xiàn)的數(shù)據(jù)可視化方案呈現(xiàn)數(shù)據(jù)分析結(jié)果。為解決專業(yè)詞庫維護(hù)難度大的痛點(diǎn),運(yùn)用了隱馬爾科夫模型、信息熵和正則表達(dá)式三個(gè)算法結(jié)合的方式,進(jìn)行了基于汽車網(wǎng)絡(luò)輿情的新詞發(fā)現(xiàn)研究與應(yīng)用,實(shí)現(xiàn)了專業(yè)詞庫的補(bǔ)充與網(wǎng)絡(luò)流行語的洞察。為詞庫管理人員中提供了維護(hù)便利,為專業(yè)詞庫的管理工作提供了完整的解決方案。本文對(duì)基于汽車網(wǎng)絡(luò)輿情的數(shù)據(jù)分析系統(tǒng)的設(shè)計(jì)與實(shí)施進(jìn)行了介紹,最終完成了系統(tǒng)的構(gòu)建工作。該系統(tǒng)為業(yè)務(wù)用戶提供及時(shí)、可靠的數(shù)據(jù)分析成果,幫助整車企業(yè)了解消費(fèi)者的需求與喜好,洞悉產(chǎn)品的競(jìng)爭(zhēng)格局,為整車企業(yè)未來的汽車產(chǎn)品規(guī)劃和定位提供決策支持。該系統(tǒng)在企業(yè)數(shù)字化轉(zhuǎn)型的過程中證明了其實(shí)用性。
【學(xué)位單位】:上海交通大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位年份】:2018
【中圖分類】:TP391.1;TP393.092
【部分圖文】:

決策樹,示例,里程碑


圖 2-2 決策樹示例Fig.2-2 Decision Tree Example生于上世紀(jì) 60 年代,由 J Ross Quinla個(gè)里程碑[19]。ID3 算法的基本思想是隨低,從而提高算法的性能和精度。ID3,然后選擇增益率最大的屬性進(jìn)行分裂

邏輯函數(shù),圖像,形式,離散選擇


基于汽車網(wǎng)絡(luò)輿算法簡(jiǎn)單高效,在對(duì)待具有不同數(shù)據(jù)特點(diǎn)的對(duì)某種特點(diǎn)的數(shù)據(jù)集穩(wěn)定性較強(qiáng)。盡管實(shí)際常情況下,該分類效果仍比較精準(zhǔn)。離散選擇法模型之一,屬于多重變量分析的臨床醫(yī)學(xué)等領(lǐng)域中用于統(tǒng)計(jì)分析的常用方法 ),設(shè)條件概率P( = ) = 為根據(jù)歸模型可表示為:P( = ) = g( )函數(shù)稱為邏輯函數(shù)。圖 2-3 為該函數(shù)的圖象

建模法,分類間隔,標(biāo)簽,分類超平面


圖 2-4 SVM 基本思想圖示Fig.2-4 SVM Standard Method ImageSVM 的基本思想是對(duì)于兩類待分樣本,, 、 分別為過兩樣樣本中離分類超平面, 與 之間的距離叫做分類間隔(Mar本正確分開,且使分類間隔最大的超平面,圍最新,最終風(fēng)險(xiǎn)最小化[22]。SVM 常用于SVM 的運(yùn)行效果不好。文本數(shù)據(jù)將以標(biāo)簽化的形式在數(shù)據(jù)倉庫中存,則需要以通過范式建模法或維度建模法構(gòu)。另外,完成標(biāo)簽化的數(shù)據(jù)結(jié)果也從測(cè)試集化算法運(yùn)行結(jié)果。
【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 李連鐵;鄭雪芳;周姣;;秦皇島網(wǎng)絡(luò)輿情監(jiān)測(cè)研究[J];環(huán)渤海經(jīng)濟(jì)瞭望;2017年08期

2 沈陽;吳荊棘;;基于復(fù)雜因子的網(wǎng)絡(luò)輿情推演研究[J];情報(bào)學(xué)報(bào);2013年12期

3 李璟;;網(wǎng)絡(luò)輿情的發(fā)展和社會(huì)穩(wěn)定的關(guān)系[J];新聞研究導(dǎo)刊;2016年07期

4 蓋姝;劉子毅;;大學(xué)生受網(wǎng)絡(luò)輿情影響的因果機(jī)制研究——以微博為例[J];現(xiàn)代商貿(mào)工業(yè);2020年03期

5 王文妤;陰雪穎;;基于模糊評(píng)價(jià)法政府實(shí)時(shí)監(jiān)控網(wǎng)絡(luò)輿情熱度模型構(gòu)建[J];中國(guó)管理信息化;2019年23期

6 任凱;郭黎黎;張燕;;社交網(wǎng)絡(luò)輿情事件的生命周期模型研究[J];科技傳播;2019年23期

7 羅陽倩子;;大數(shù)據(jù)時(shí)代高校網(wǎng)絡(luò)輿情應(yīng)對(duì)策略的重新定位研討[J];科學(xué)咨詢(教育科研);2019年12期

8 王萍;;大數(shù)據(jù)視域下我國(guó)環(huán)境網(wǎng)絡(luò)輿情危機(jī)的應(yīng)對(duì)策略[J];山東行政學(xué)院學(xué)報(bào);2019年05期

9 陳昱杉;李鳳全;王天陽;朱麗東;葉瑋;;網(wǎng)絡(luò)輿情信息擴(kuò)散中距離的影響——以新浪微博“九寨溝地震”事件為例[J];浙江師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2020年01期

10 朱小宇;;突發(fā)事件不同網(wǎng)絡(luò)輿情峰值型原因探究[J];新聞研究導(dǎo)刊;2019年23期


相關(guān)博士學(xué)位論文 前10條

1 李詩悅;網(wǎng)絡(luò)輿情事件治理中的倫理問題研究[D];湖南師范大學(xué);2018年

2 張高唯;基于鏈路相似的虛擬空間與對(duì)應(yīng)交易空間融合度研究分析[D];上海大學(xué);2018年

3 何健;高校大學(xué)生網(wǎng)絡(luò)輿情特征與管理對(duì)策研究[D];西南大學(xué);2015年

4 王根生;面向群體極化的網(wǎng)絡(luò)輿情演化研究[D];江西財(cái)經(jīng)大學(xué);2011年

5 張玉強(qiáng);網(wǎng)絡(luò)輿情危機(jī)的政府適度反應(yīng)研究[D];中央民族大學(xué);2011年

6 高俊峰;網(wǎng)絡(luò)輿情場(chǎng)形成機(jī)理及信息受眾觀點(diǎn)測(cè)度研究[D];吉林大學(xué);2017年

7 萬源;基于語義統(tǒng)計(jì)分析的網(wǎng)絡(luò)輿情挖掘技術(shù)研究[D];武漢理工大學(xué);2012年

8 王蕾;網(wǎng)絡(luò)輿情信息與現(xiàn)實(shí)交易行為的映射關(guān)系研究與應(yīng)用[D];上海大學(xué);2016年

9 于淼;社交網(wǎng)絡(luò)輿情傳播與控制研究[D];哈爾濱工程大學(xué);2016年

10 劉泉;基于個(gè)體社會(huì)屬性的網(wǎng)絡(luò)輿情演化模型研究[D];大連理工大學(xué);2016年


相關(guān)碩士學(xué)位論文 前10條

1 王柳欣;河南省A縣網(wǎng)絡(luò)輿情應(yīng)對(duì)研究[D];廣西民族大學(xué);2019年

2 黃旭;網(wǎng)絡(luò)輿情監(jiān)控管理系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D];上海交通大學(xué);2016年

3 吳歡;群體性突發(fā)事件互聯(lián)網(wǎng)輿情傳播干預(yù)機(jī)制的研究[D];東北林業(yè)大學(xué);2019年

4 陳林;警媒?jīng)_突的破解路徑研究[D];華南理工大學(xué);2019年

5 鄭釗榮;新媒體時(shí)代涉警網(wǎng)絡(luò)輿情的應(yīng)對(duì)研究[D];華南理工大學(xué);2019年

6 羅峰;大數(shù)據(jù)時(shí)代公共危機(jī)事件網(wǎng)絡(luò)輿情的形成與演變[D];華南理工大學(xué);2019年

7 曹興云;基于汽車網(wǎng)絡(luò)輿情的數(shù)據(jù)分析系統(tǒng)研究與應(yīng)用[D];上海交通大學(xué);2018年

8 鄭靖雯;醫(yī)患事件的網(wǎng)絡(luò)輿情演變研究[D];長(zhǎng)春理工大學(xué);2019年

9 孫恬;公共衛(wèi)生事件的網(wǎng)絡(luò)輿情分析及應(yīng)對(duì)[D];華中師范大學(xué);2019年

10 任仕賢;旅游網(wǎng)絡(luò)輿情政府回應(yīng)效能對(duì)城市形象修復(fù)影響研究[D];電子科技大學(xué);2019年



本文編號(hào):2870805

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/guanlilunwen/ydhl/2870805.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶c7884***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com