基于隱性特征提取的產(chǎn)品評(píng)論挖掘
發(fā)布時(shí)間:2021-05-10 23:48
隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,網(wǎng)絡(luò)不可避免地成為了一個(gè)巨大的信息集合場所,儲(chǔ)存著大量有價(jià)值的信息,其中就包含了海量的非結(jié)構(gòu)化信息。信息資源的充分利用過程中,不可缺少的一部分就是將非結(jié)構(gòu)化信息轉(zhuǎn)化為結(jié)構(gòu)化信息,產(chǎn)品評(píng)論挖掘就是其中一種。然而目前的產(chǎn)品評(píng)論挖掘大部分是基于顯性特征的分析,對(duì)于隱性特征的分析還不是很成熟。因此本文在考慮隱性特征提取的基礎(chǔ)上完成產(chǎn)品評(píng)論挖掘任務(wù),從電商網(wǎng)絡(luò)平臺(tái)中爬取茶葉評(píng)論數(shù)據(jù),發(fā)掘其中隱藏的有價(jià)值的信息。本文首先通過對(duì)堆疊降噪自編碼器進(jìn)行無監(jiān)督的逐層預(yù)訓(xùn)練與有監(jiān)督的微調(diào)過程,構(gòu)建顯性特征提取模型,完成產(chǎn)品特征集合的構(gòu)建;隨后通過建立評(píng)論語料庫的CBOW模型,構(gòu)建隱性特征提取模型,將未包含顯性特征的評(píng)論充分利用;其次,在基于現(xiàn)有詞典的基礎(chǔ)上,利用雙向傳播法,對(duì)現(xiàn)有的情感詞典進(jìn)行擴(kuò)充;然后,以點(diǎn)互信息作為量化指標(biāo),完成對(duì)各特征-情感詞關(guān)聯(lián)對(duì)的量化,以及對(duì)產(chǎn)品特征的整體評(píng)價(jià);最后對(duì)計(jì)算的得分進(jìn)行分析,展現(xiàn)產(chǎn)品評(píng)論挖掘的實(shí)際價(jià)值。
【文章來源】:西南財(cái)經(jīng)大學(xué)四川省 211工程院校 教育部直屬院校
【文章頁數(shù)】:54 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
abstract
1 緒論
1.1 研究背景及意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 產(chǎn)品特征提取
1.2.2 特征-情感詞關(guān)聯(lián)對(duì)提取
1.2.3 情感分析
1.2.4 深度學(xué)習(xí)在產(chǎn)品評(píng)論挖掘中的應(yīng)用
1.3 本文主要研究內(nèi)容
1.4 論文組織結(jié)構(gòu)以及創(chuàng)新點(diǎn)
1.5 本章小結(jié)
2 相關(guān)技術(shù)與理論
2.1 相關(guān)概念定義
2.2 文本表示方法
2.2.1 One-Hot編碼
2.2.2 向量空間模型
2.2.3 Word2vec語言模型
2.3 堆疊降噪自編碼器
2.3.1 自動(dòng)編碼器
2.3.2 堆疊自動(dòng)編碼器
2.3.3 堆疊降噪自編碼器
2.4 點(diǎn)互信息
2.5 本章小結(jié)
3 模型構(gòu)建
3.1 特征提取
3.1.1 基于SdA構(gòu)建的顯性特征提取模型
3.1.2 基于CBOW構(gòu)建的隱性特征提取模型
3.2 情感詞典構(gòu)造
3.2.1 構(gòu)建基礎(chǔ)詞典
3.2.2 基于雙向循環(huán)的詞典更新
3.3 情感分析
3.3.1 特征-情感詞關(guān)聯(lián)對(duì)提取
3.3.2 情感得分計(jì)算
3.4 本章小結(jié)
4 實(shí)驗(yàn)及分析
4.1 實(shí)驗(yàn)準(zhǔn)備
4.1.1 數(shù)據(jù)來源及預(yù)處理
4.1.2 評(píng)價(jià)指標(biāo)
4.2 特征提取
4.2.1 人工特征提取
4.2.2 顯性特征提取
4.2.3 隱性特征提取
4.3 情感分析
4.3.1 情感詞典構(gòu)建
4.3.2 情感得分計(jì)算
4.4 本章小結(jié)
5 總結(jié)與展望
5.1 總結(jié)
5.2 展望
參考文獻(xiàn)
致謝
本文編號(hào):3180289
【文章來源】:西南財(cái)經(jīng)大學(xué)四川省 211工程院校 教育部直屬院校
【文章頁數(shù)】:54 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
abstract
1 緒論
1.1 研究背景及意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 產(chǎn)品特征提取
1.2.2 特征-情感詞關(guān)聯(lián)對(duì)提取
1.2.3 情感分析
1.2.4 深度學(xué)習(xí)在產(chǎn)品評(píng)論挖掘中的應(yīng)用
1.3 本文主要研究內(nèi)容
1.4 論文組織結(jié)構(gòu)以及創(chuàng)新點(diǎn)
1.5 本章小結(jié)
2 相關(guān)技術(shù)與理論
2.1 相關(guān)概念定義
2.2 文本表示方法
2.2.1 One-Hot編碼
2.2.2 向量空間模型
2.2.3 Word2vec語言模型
2.3 堆疊降噪自編碼器
2.3.1 自動(dòng)編碼器
2.3.2 堆疊自動(dòng)編碼器
2.3.3 堆疊降噪自編碼器
2.4 點(diǎn)互信息
2.5 本章小結(jié)
3 模型構(gòu)建
3.1 特征提取
3.1.1 基于SdA構(gòu)建的顯性特征提取模型
3.1.2 基于CBOW構(gòu)建的隱性特征提取模型
3.2 情感詞典構(gòu)造
3.2.1 構(gòu)建基礎(chǔ)詞典
3.2.2 基于雙向循環(huán)的詞典更新
3.3 情感分析
3.3.1 特征-情感詞關(guān)聯(lián)對(duì)提取
3.3.2 情感得分計(jì)算
3.4 本章小結(jié)
4 實(shí)驗(yàn)及分析
4.1 實(shí)驗(yàn)準(zhǔn)備
4.1.1 數(shù)據(jù)來源及預(yù)處理
4.1.2 評(píng)價(jià)指標(biāo)
4.2 特征提取
4.2.1 人工特征提取
4.2.2 顯性特征提取
4.2.3 隱性特征提取
4.3 情感分析
4.3.1 情感詞典構(gòu)建
4.3.2 情感得分計(jì)算
4.4 本章小結(jié)
5 總結(jié)與展望
5.1 總結(jié)
5.2 展望
參考文獻(xiàn)
致謝
本文編號(hào):3180289
本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/3180289.html
最近更新
教材專著