基于多特征融合的中文微博評價對象抽取方法
發(fā)布時間:2017-06-16 10:09
本文關(guān)鍵詞:基于多特征融合的中文微博評價對象抽取方法,,由筆耕文化傳播整理發(fā)布。
【摘要】:中文微博的評價對象抽取作為中文微博情感分析的基礎(chǔ)任務(wù),受到研究者的廣泛關(guān)注,有著重要的研究價值。結(jié)合微博文本的特點,對微博文本進行預(yù)處理,利用句法分析構(gòu)建包括名詞、名詞短語、微博話題在內(nèi)的評價對象候選集,再分別利用SVM模型、加權(quán)模型實現(xiàn)多特征融合的篩選候選評價對象方法,所用特征包括語義角色信息、最小距離和詞頻。算法經(jīng)實驗證明有效,在對候選評價對象進行篩選后,采用SVM模型的F值達到0.357 3,加權(quán)模型的F值達到0.405 9。
【作者單位】: 北京信息科技大學(xué)智能信息處理研究所;
【關(guān)鍵詞】: 評價對象 評價對象候選集 句法分析 語義角色標注 支持向量機
【基金】:國家自然科學(xué)基金資助項目(61070119,61370139) 北京市屬高等學(xué)校創(chuàng)新團隊建設(shè)與教師職業(yè)發(fā)展計劃項目(IDHT20130519) 北京市教委專項項目(PXM2013_014224_000042,PXM2014_014224_000067);北京市教委科研計劃面上項目(KM201411232014) 北京信息科技大學(xué)2014年研究生科技創(chuàng)新項目
【分類號】:TP391.1
【正文快照】: 0引言隨著互聯(lián)網(wǎng)的廣泛普及,網(wǎng)絡(luò)已經(jīng)成為人們獲取信息、共享信息的主要途徑。微博作為一種新興的互動交流平臺,也逐漸走進人們的生活。據(jù)中國互聯(lián)網(wǎng)信息中心(CNNIC)發(fā)布《第33次中國互聯(lián)網(wǎng)絡(luò)發(fā)展狀況統(tǒng)計報告》顯示,截至2013年12月,我國微博用戶規(guī)模為2.81億[1]。越來越多的
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 郭飛飛;王小華;諶志群;王榮波;;基于回應(yīng)消息的中文微博情感分類方法[J];杭州電子科技大學(xué)學(xué)報;2013年06期
2 李赫元;俞曉明;劉悅;程學(xué)旗;程工;;中文微博客的垃圾用戶檢測[J];中文信息學(xué)報;2014年03期
3 文坤梅;徐帥;李瑞軒;辜希武;李玉華;;微博及中文微博信息處理研究綜述[J];中文信息學(xué)報;2012年06期
4 王銀;吳新玲;;中文微博情感分析方法研究[J];廣東技術(shù)師范學(xué)院學(xué)報;2014年03期
5 肖s
本文編號:455101
本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/455101.html
最近更新
教材專著