天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

電子商務中的中文評論挖掘技術及應用的研究

發(fā)布時間:2017-03-30 03:04

  本文關鍵詞:電子商務中的中文評論挖掘技術及應用的研究,由筆耕文化傳播整理發(fā)布。


【摘要】:中文商品評論作為網(wǎng)購消費者意見的重要載體,對于潛在的消費者的購買決策和產(chǎn)品生產(chǎn)廠家的產(chǎn)品改善,都起著重要的參考作用。因此,論文緊緊圍繞提高情感極性判別準確率,對中文產(chǎn)品評論挖掘技術展開分析和研究。論文先分別闡述屬性提取和情感分析的研究現(xiàn)狀。通過發(fā)展現(xiàn)狀總結(jié)出現(xiàn)有中文產(chǎn)品評論挖掘技術還存在沒有充分考慮屬性詞對用戶的不同重要程度、程度副詞不在基準程度副詞庫中無法賦值權重和基于分類器的評論挖掘算法提取特征不夠全面的問題。針對以上問題,論文設計一種結(jié)合屬性詞和程度副詞權重的中文產(chǎn)品評論挖掘方法,采取由細粒度到粗粒度的句子分析的思想,對評論的傾向性進行判定。該方法以基于消費者關注程度的屬性詞權重計算為基礎,充分考慮消費者對不同屬性的關注程度來設置不同屬性詞的權重,提高同一整句中正反極性同時存在情形下的極性判別準確率;設計一種基于基準程度副詞詞庫進行語義相似度計算求得程度副詞權重的方法,改善現(xiàn)有基于基準程度副詞表匹配的權重賦值方法無法對所有程度副詞賦值權重的缺點,降低了極性判別句的漏檢率。論文也進一步探索了該方法在評論多極性判定上的有效性。實驗結(jié)果表明,結(jié)合屬性詞和程度副詞權重的情感分析方法能夠降低極性判別句的漏檢率,提高了算法的極性判別準確率。為了進一步提高結(jié)合屬性詞和副詞權重的情感傾向分析方法的準確率,論文還設計了利用評論短句計算特征的中文評論挖掘方法。先利用基于屬性詞和副詞權重的情感分析方法得到評論短句計算特征,結(jié)合一般統(tǒng)計特征和基本統(tǒng)計特征作為分類器的輸入,對評論整句進行粗粒度的情感傾向分析。實驗結(jié)果表明結(jié)合評論短句計算特征的情感分析方法進一步改善了結(jié)合屬性詞和程度副詞權重方法的準確率。最后,對本文的研究內(nèi)容進行了總結(jié),并對以后的研究方向進行了展望?傊,論文以提高中文評論挖掘算法的極性判別準確率為最終目標,分別設計了基于屬性詞和程度副詞權重、利用評論短句特征的中文評論挖掘算法,并利用實驗對算法在不同數(shù)據(jù)集上的有效性進行驗證和分析,以提高算法的實際應用能力。
【關鍵詞】:情感分析 語義相似度 屬性詞提取 觀點挖掘 權重
【學位授予單位】:西南交通大學
【學位級別】:碩士
【學位授予年份】:2015
【分類號】:TP391.1
【目錄】:
  • 摘要6-7
  • Abstract7-11
  • 第1章 緒論11-18
  • 1.1 研究背景和意義11-12
  • 1.2 相關概念定義及解釋12
  • 1.3 國內(nèi)外研究現(xiàn)狀12-15
  • 1.3.1 屬性提取13-14
  • 1.3.2 情感傾向判別14-15
  • 1.3.3 產(chǎn)品評論挖掘的應用15
  • 1.4 本文的研究內(nèi)容和貢獻15-17
  • 1.5 論文的組織結(jié)構17-18
  • 第2章 相關技術介紹18-26
  • 2.1 詞匯語義相似度計算方法18-21
  • 2.1.1 知網(wǎng)(Hownet)簡介18
  • 2.1.2 利用知網(wǎng)計算詞匯的語義相似度18-21
  • 2.2 分類算法概述21-23
  • 2.2.1 樸素貝葉斯算法21-22
  • 2.2.2 決策樹算法22
  • 2.2.3 支持向量機SVM(Support Vector Machine)22-23
  • 2.2.4 分類算法的優(yōu)缺點比較23
  • 2.3 分類器的衡量指標23-25
  • 2.3.1 評估方法24
  • 2.3.2 評價指標24-25
  • 2.4 本章小結(jié)25-26
  • 第3章 Web產(chǎn)品評論挖掘框架設計及預處理26-36
  • 3.1 Web評論挖掘總體框架設計26
  • 3.2 構造商品評論數(shù)據(jù)集26-27
  • 3.3 商品評論數(shù)據(jù)預處理27-29
  • 3.3.1 評論內(nèi)容的初步去噪28
  • 3.3.2 中文分詞及詞性標注28-29
  • 3.4 屬性詞的提取29-31
  • 3.4.1 屬性詞的提取方法29-31
  • 3.4.2 屬性詞的提取結(jié)果示例31
  • 3.5 評論中的情感詞提取31-32
  • 3.6 評論短句的提取32-35
  • 3.6.1 評論短句fs(feature sentence)的概念32-33
  • 3.6.2 規(guī)則模板提取評論短句33-34
  • 3.6.3 提取過程實現(xiàn)及結(jié)果34-35
  • 3.7 本章小結(jié)35-36
  • 第4章 結(jié)合屬性詞及程度副詞權重的情感傾向分析36-58
  • 4.1 屬性詞的權重設置37-38
  • 4.1.1 常用權重設置方法37
  • 4.1.2 本文屬性詞權重設置方式37-38
  • 4.2 情感詞的極性計算38-43
  • 4.2.1 極性詞典的構建39
  • 4.2.2 基于極性詞典和語義相似度的情感極性計算39-41
  • 4.2.3 情感詞極性計算實現(xiàn)及結(jié)果41-43
  • 4.3 程度副詞的權重設置43-45
  • 4.4 評論短句及整句的情感傾向45-46
  • 4.5 屬性詞權重和副詞權重改進實驗結(jié)果分析46-52
  • 4.5.1 實驗使用的數(shù)據(jù)集46-47
  • 4.5.2 屬性詞權重改進結(jié)果分析47-50
  • 4.5.3 程度副詞權重改進結(jié)果對比50-52
  • 4.6 整句極性判定結(jié)果52-57
  • 4.6.1 不同權重設置時二極性判定結(jié)果對比52-54
  • 4.6.2 多極性判定的實驗54-57
  • 4.7 本章小結(jié)57-58
  • 第5章 利用評論短句計算特征的情感傾向分析58-65
  • 5.1 分類器特征分析58-59
  • 5.1.1 一般統(tǒng)計特征58-59
  • 5.1.2 基本統(tǒng)計特征59
  • 5.1.3 評論短句fs(feature sentence)計算特征59
  • 5.2 利用評論短句計算特征的情感分析實現(xiàn)59-60
  • 5.3 實驗設置60-62
  • 5.3.1 實驗使用的數(shù)據(jù)集60-61
  • 5.3.2 Dataset 2上的分類結(jié)果分析61
  • 5.3.3 Dataset 3上上的分類結(jié)果分析61-62
  • 5.4 論文兩種傾向性分析方法的對比62-63
  • 5.5 論文方法與其他文獻方法的對比63-64
  • 5.6 本章小結(jié)64-65
  • 第6章 總結(jié)與展望65-67
  • 6.1 總結(jié)65
  • 6.2 展望65-67
  • 致謝67-68
  • 參考文獻68-73
  • 攻讀碩士學位期間發(fā)表的論文73

【參考文獻】

中國期刊全文數(shù)據(jù)庫 前10條

1 楊靜;徐蔚然;譚松波;;COAE2014情感關鍵句評測任務和評測數(shù)據(jù)設計[J];山西大學學報(自然科學版);2015年01期

2 劉麗珍;劉昊;王函石;宋巍;趙新蕾;;Generating Domain-Specific Affective Ontology from Chinese Reviews for Sentiment Analysis[J];Journal of Shanghai Jiaotong University(Science);2015年01期

3 張林;錢冠群;樊衛(wèi)國;華琨;張莉;;輕型評論的情感分析研究[J];軟件學報;2014年12期

4 董麗麗;趙繁榮;張翔;;基于領域本體、情感詞典的商品評論傾向性分析[J];計算機應用與軟件;2014年12期

5 李澤魁;趙妍妍;秦兵;劉挺;;中文微博情感傾向性分析特征工程[J];山西大學學報(自然科學版);2014年04期

6 王祖輝;姜維;李一軍;;在線評論情感分析中固定搭配特征提取方法研究[J];管理工程學報;2014年04期

7 肖正;劉輝;李兵;;一種基于語義距離的Web評論SVM情感分類方法[J];計算機科學;2014年09期

8 鐘將;楊思源;孫啟干;;基于文本分類的商品評價情感分析[J];計算機應用;2014年08期

9 楊慧;劉紅巖;何軍;;中文產(chǎn)品評論結(jié)構化引擎[J];計算機與現(xiàn)代化;2014年07期

10 戴敏;王榮洋;李壽山;朱珠;周國棟;;基于句法特征的評價對象抽取方法研究[J];中文信息學報;2014年04期

中國重要會議論文全文數(shù)據(jù)庫 前1條

1 倪茂樹;林鴻飛;;基于關聯(lián)規(guī)則和極性分析的商品評論挖掘[A];第三屆全國信息檢索與內(nèi)容安全學術會議論文集[C];2007年


  本文關鍵詞:電子商務中的中文評論挖掘技術及應用的研究,,由筆耕文化傳播整理發(fā)布。



本文編號:276050

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/jingjilunwen/dianzishangwulunwen/276050.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶56e8c***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com