基于主觀強(qiáng)度Bootstrapping優(yōu)化的微博觀點(diǎn)句識別
發(fā)布時間:2017-11-05 10:15
本文關(guān)鍵詞:基于主觀強(qiáng)度Bootstrapping優(yōu)化的微博觀點(diǎn)句識別
更多相關(guān)文章: 觀點(diǎn)句識別 主觀性特征 主觀強(qiáng)度 Bootstrapping優(yōu)化
【摘要】:微博觀點(diǎn)句識別對于情感分類、輿情調(diào)查等具有重要的作用,為了盡量減少訓(xùn)練語料的標(biāo)注工作,文章提出一種主觀強(qiáng)度Bootstrapping優(yōu)化的方法來識別微博觀點(diǎn)句。首先,采用優(yōu)勢率和獨(dú)立主觀表達(dá)能力計算主觀性特征的主觀強(qiáng)度,再結(jié)合其在測試集微博句子中的權(quán)重信息計算微博句子的主觀強(qiáng)度并進(jìn)行排序;然后,進(jìn)行Bootstrapping優(yōu)化,以訓(xùn)練集中主客觀句子特征分布的相對熵作為閾值將排序序列中置信度高的主客觀句子分別加入到訓(xùn)練集中,重新訓(xùn)練主觀性特征的主觀強(qiáng)度,迭代進(jìn)行直至不再有新句子加入。實驗結(jié)果表明,本方法具有一定的可行性和有效性,Bootstrapping過程的引入可以極大優(yōu)化觀點(diǎn)句識別的結(jié)果。
【作者單位】: 山東師范大學(xué)信息科學(xué)與工程學(xué)院;山東省分布式計算機(jī)軟件新技術(shù)重點(diǎn)實驗室;山東交通學(xué)院信息科學(xué)與電氣工程學(xué)院;
【基金】:國家自然科學(xué)基金(61373148) 國家社科基金(12BXW040) 教育部人文社科基金(14YJC860042) 山東省自然科學(xué)基金(ZR2012FM038,ZR2014FL010) 山東省優(yōu)秀中青年科學(xué)家獎勵基金(BS2013DX033) 山東省高等學(xué)?萍加媱(J12LN21) 山東省社科規(guī)劃項目(12BXWJ01)
【分類號】:TP393.092;TP391.1
【正文快照】: 0引言由于微博具有消息發(fā)布迅速、發(fā)布手段多樣、內(nèi)容結(jié)構(gòu)自由、便捷交互等特點(diǎn),受到越來越多人的青睞,用戶每天更新并傳播的微博高達(dá)數(shù)千萬條,微博正日益成為信息傳播、意見共享、觀點(diǎn)交流的實時性平臺。微博平臺經(jīng)常占據(jù)信息發(fā)布的起源點(diǎn)和信息傳播的制高點(diǎn),許多備受人們關(guān),
本文編號:1143753
本文鏈接:http://www.sikaile.net/guanlilunwen/ydhl/1143753.html
最近更新
教材專著