光熙論壇:文本傾向性分析中的情感詞典構建技術研究
本文關鍵詞:文本傾向性分析中的情感詞典構建技術研究,由筆耕文化傳播整理發(fā)布。
光熙論壇第391期
題目:文本傾向性分析中的情感詞典構建技術研究
時間:4月9日 11:00-12:00
地點:新技術樓901會議室
主講人:杜偉夫,男,哈工大系統(tǒng)結構專業(yè)博士生。
研究方向:文本分類與傾向性分析、統(tǒng)計機器學習
導師簡介:云曉春(X. Ch.Yun) 博士、教授、博導
研究方向:互聯(lián)網(wǎng)建模、大規(guī)模網(wǎng)絡惡意代碼預警與防治技術、分布式系統(tǒng)生存性技術安全性分析技術、計算機信息內(nèi)容安全技術等
內(nèi)容簡介:
互聯(lián)網(wǎng)上包含了海量的富含情感信息的文本。這些觀點性內(nèi)容對于網(wǎng)絡電子商務、網(wǎng)絡社區(qū)發(fā)現(xiàn)、網(wǎng)絡信息安全、網(wǎng)絡信息檢索等多方面都具有重要的意義和實用價值。因此,,人們亟待找到一種快速的自動分析方法對這些網(wǎng)絡文本進行處理。對網(wǎng)絡文本觀點性內(nèi)容的自動情感分析成為近期web信息處理的一個研究熱點,而其中的核心技術就是以詞語傾向性分析為基礎的文本傾向性分析技術。
目前的詞語傾向性分析技術主要存在三方面問題:1. 對基準詞依賴過大;2. 算法準確率仍有提升空間;3. 未能較好的處理情感詞典的領域移植問題。
針對這些問題,本研究以高質(zhì)量的情感詞典構建算法作為研究目標,著重解決了通用情感詞典構建以及領域情感詞典構建兩方面的內(nèi)容。本研究的創(chuàng)新點包括:
為了減少通用情感詞典構建算法對于基準詞的依賴,提出了基于函數(shù)優(yōu)化的通用詞典構建方法。
為了解決基于圖劃分方法易于陷入局部極值的問題,提出了基于詞語聚團性的通用詞典構建方法。
為了解決情感詞典的領域移植問題,提出了基于擴展信息瓶頸的領域詞典構建方法。
設計并實現(xiàn)了一個細粒度的產(chǎn)品屬性挖掘系統(tǒng)。
本文關鍵詞:文本傾向性分析中的情感詞典構建技術研究,由筆耕文化傳播整理發(fā)布。
本文編號:102637
本文鏈接:http://www.sikaile.net/kejilunwen/xinxigongchenglunwen/102637.html