基于消費者評論的汽車品牌輿情分析
發(fā)布時間:2021-09-05 05:57
隨著現(xiàn)代信息技術和互聯(lián)網(wǎng)的高速發(fā)展,產(chǎn)生了大量的輿情信息,通過輿情分析發(fā)掘有用的信息和價值越來越受到人們的重視。本文試圖將輿情分析的思想應用于汽車銷售這樣的商業(yè)領域,通過消費者對汽車品牌的評論發(fā)掘消費者對于汽車品牌的關注點并進一步分析不同汽車品牌的優(yōu)缺點。本文主要將研究分為兩個階段來進行,分別為數(shù)據(jù)、獲取整理階段和數(shù)據(jù)分析階段。在數(shù)據(jù)獲取、整理階段,本文首先探討了多種網(wǎng)絡爬蟲技術,然后通過這些技術手段將論壇、微博等輿情網(wǎng)站中的與汽車品牌相關的評論爬取下來,并將待分析文本通過采集詞比對,自動將不同類型的評論歸類到結構化的表格中,通過基于最大概率法和隱馬爾科夫模型的中文分詞技術將文本信息分詞,并統(tǒng)計出詞頻。通過基于情感詞典的情感分類算法將消費者的評論分為正面評價、負面評價和中性評價,并統(tǒng)計出各品牌三種評價的頻數(shù)。在數(shù)據(jù)分析階段。本文首先通過主成分分析法,依據(jù)各品牌各汽車維度正面評價比例,將各汽車品牌旗下的汽車分為三個方面來進行評價,并得出了與現(xiàn)實較一致的結論,并對結論進行了解釋說明,對于要買車的潛在消費者具有一定的參考意義。然后,本文探索了汽車維度正面評價數(shù)與汽車品牌銷量之間的重要性關系,...
【文章來源】:北京工業(yè)大學北京市 211工程院校
【文章頁數(shù)】:55 頁
【學位級別】:碩士
【部分圖文】:
通用爬蟲流程圖 通用爬蟲有以下的不足:(1)由于在一個較大范圍內(nèi)抓取目標,所以可能
圖 2-2 主題網(wǎng)絡爬蟲流程圖 2 種爬蟲技術,可以看出:通用網(wǎng)絡爬蟲起始于初始 UR個網(wǎng)頁內(nèi)容;主題網(wǎng)絡爬蟲在兼具抓取網(wǎng)頁內(nèi)容的同時,進行分析。用戶可以查詢主題網(wǎng)絡爬蟲提供的數(shù)據(jù)資源,容的目的。的文本數(shù)據(jù)是通過聯(lián)合以上 2 種網(wǎng)絡爬蟲技術得來的。用的分詞技術介紹 大概率分詞算法的中文分詞方法一串字分割成獨立的詞的過程,中文分詞就是將一串中文義的詞的過程。中文分詞技術應用已經(jīng)在我們生活中隨處有分詞技術,那么檢索時只會按照單個字的意思,很可能
圖 3-1 自變量和因變量關系示意圖 以第 1 個自變量為例:從右向左,第 1 個回歸方程描述原始自變量( )和正交變量( )的關系,可列方程: = + + 表示 關于 的回歸系數(shù)。第 2 個回歸方程描述正交變量( )和因變量( )之間的關系,可表示為: = + + 表 示關于 的回歸系數(shù)。因此, 的相對權重 可以表示為: = + + 3.2.2 相對權重的數(shù)學原理將 ×1列矩陣設為因變量 ,將滿秩的 × 階矩陣設為自變量( , , , ),變量均進行了標準化處理,那么自變量矩陣 的正交變換可用 = 來表示。
本文編號:3384812
【文章來源】:北京工業(yè)大學北京市 211工程院校
【文章頁數(shù)】:55 頁
【學位級別】:碩士
【部分圖文】:
通用爬蟲流程圖 通用爬蟲有以下的不足:(1)由于在一個較大范圍內(nèi)抓取目標,所以可能
圖 2-2 主題網(wǎng)絡爬蟲流程圖 2 種爬蟲技術,可以看出:通用網(wǎng)絡爬蟲起始于初始 UR個網(wǎng)頁內(nèi)容;主題網(wǎng)絡爬蟲在兼具抓取網(wǎng)頁內(nèi)容的同時,進行分析。用戶可以查詢主題網(wǎng)絡爬蟲提供的數(shù)據(jù)資源,容的目的。的文本數(shù)據(jù)是通過聯(lián)合以上 2 種網(wǎng)絡爬蟲技術得來的。用的分詞技術介紹 大概率分詞算法的中文分詞方法一串字分割成獨立的詞的過程,中文分詞就是將一串中文義的詞的過程。中文分詞技術應用已經(jīng)在我們生活中隨處有分詞技術,那么檢索時只會按照單個字的意思,很可能
圖 3-1 自變量和因變量關系示意圖 以第 1 個自變量為例:從右向左,第 1 個回歸方程描述原始自變量( )和正交變量( )的關系,可列方程: = + + 表示 關于 的回歸系數(shù)。第 2 個回歸方程描述正交變量( )和因變量( )之間的關系,可表示為: = + + 表 示關于 的回歸系數(shù)。因此, 的相對權重 可以表示為: = + + 3.2.2 相對權重的數(shù)學原理將 ×1列矩陣設為因變量 ,將滿秩的 × 階矩陣設為自變量( , , , ),變量均進行了標準化處理,那么自變量矩陣 的正交變換可用 = 來表示。
本文編號:3384812
本文鏈接:http://www.sikaile.net/guanlilunwen/shengchanguanlilunwen/3384812.html
最近更新
教材專著