蘊含地理事件微博客消息的自動識別方法
本文關(guān)鍵詞:蘊含地理事件微博客消息的自動識別方法
更多相關(guān)文章: 微博客 地理事件 事件文本識別 主題模型 詞向量
【摘要】:微博客文本蘊含類型豐富的地理事件信息,能夠彌補傳統(tǒng)定點監(jiān)測手段的不足,提高事件應(yīng)急響應(yīng)質(zhì)量。然而,由于大規(guī)模標注語料的普遍匱乏,無法利用監(jiān)督學(xué)習過程識別蘊含地理事件信息的微博客文本。為此,本文提出一種蘊含地理事件微博客消息的自動識別方法,通過快速獲取的語料資源增強識別效果。該方法利用主題模型具有提取文檔中主題集合的優(yōu)勢,通過主題過濾候選語料文本,實現(xiàn)地理事件語料的自動提取。同時,將分布式表達詞向量模型引入事件相關(guān)性計算過程,借助詞向量隱含的語義信息豐富微博客短文本的上下文內(nèi)容,進一步增強事件消息的識別效果。通過以新浪微博為數(shù)據(jù)源開展的實驗分析表明,本文提出的蘊含地理事件信息微博客消息識別方法,識別來自事件微博話題的消息文本的F-1值可達到71.41%,比經(jīng)典的基于SVM模型的監(jiān)督學(xué)習方法提高了10.79%。在模擬真實微博環(huán)境的500萬微博客數(shù)據(jù)集上的識別準確率達到60%。
【作者單位】: 中國科學(xué)院地理科學(xué)與資源研究所資源與環(huán)境信息系統(tǒng)國家重點實驗室;中國科學(xué)院大學(xué);
【關(guān)鍵詞】: 微博客 地理事件 事件文本識別 主題模型 詞向量
【基金】:國家“863”計劃課題(2013AA120305) 國家自然科學(xué)基金項目(41401460)
【分類號】:TP393.092;TP391.1
【正文快照】: 1引言文本[7]。對于內(nèi)容自由度更高的開放文本,監(jiān)督學(xué)習識別方法的效果更好,但監(jiān)督學(xué)習方法需要足夠近年來,隨著智能終端和移動互聯(lián)網(wǎng)的普及,的標注語料進行模型訓(xùn)練,大部分研究使用的語料位置服務(wù)應(yīng)用不斷增長,與空間位置密切相關(guān)的地主要來源于開放的測評語料[4,8]或人工標
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 溫艷玲;;食品追溯系統(tǒng)自動識別方法研究——以豬肉食品為例[J];信息與電腦(理論版);2011年12期
2 劉惠娟;周源華;;地圖中河流的自動識別方法[J];自動化學(xué)報;1993年04期
3 張仰森,徐波,曹元大,宗成慶;基于姓氏驅(qū)動的中國姓名自動識別方法[J];計算機工程與應(yīng)用;2003年04期
4 唐慧君,王建軍,羅秀娟,周泗忠;一種點陣碼的自動識別方法[J];應(yīng)用光學(xué);2004年05期
5 秦海勤;徐可君;江龍平;;分形理論應(yīng)用中無標度區(qū)自動識別方法[J];機械工程學(xué)報;2006年12期
6 游宏梁;張巍;沈鈞毅;劉挺;;一種基于加權(quán)投票的術(shù)語自動識別方法[J];中文信息學(xué)報;2011年03期
7 周激流,何其超;人臉正面模式自動識別方法研究[J];四川大學(xué)學(xué)報(自然科學(xué)版);1993年01期
8 陳京德,季明松;非接觸IC卡讀寫領(lǐng)域的一次技術(shù)創(chuàng)新——非接觸IC卡多功能讀寫器[J];金卡工程;2003年05期
9 曾維亮;梁春生;李冉;皮亦鳴;;基于邊緣最大匹配的印鑒自動識別方法[J];信息與電子工程;2006年05期
10 曾維亮;梁春生;李冉;;基于邊緣最大匹配的印鑒自動識別方法[J];實驗科學(xué)與技術(shù);2006年S1期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 鄭家恒;楊曉巖;;英文譯名自動識別方法研究[A];輝煌二十年——中國中文信息學(xué)會二十周年學(xué)術(shù)會議論文集[C];2001年
2 鐘茂生;;基于詞語形式標記的句際語義關(guān)系自動識別方法[A];第五屆全國信息檢索學(xué)術(shù)會議論文集[C];2009年
3 張巍;游宏梁;張吉才;;一種基于加權(quán)投票的術(shù)語自動識別方法[A];第六屆全國信息檢索學(xué)術(shù)會議論文集[C];2010年
4 黃行;江荻;;現(xiàn)代藏語判定動詞句主賓語的自動識別方法[A];語言計算與基于內(nèi)容的文本處理——全國第七屆計算語言學(xué)聯(lián)合學(xué)術(shù)會議論文集[C];2003年
5 杜小毅;于濂;;基于聯(lián)合特征的車標自動識別方法[A];第七屆中國智能交通年會優(yōu)秀論文集——智能交通技術(shù)[C];2012年
6 王寧;游志勝;潘薇;李貴俊;;一種護照編碼自動識別方法[A];信號與信息處理技術(shù)第三屆信號與信息處理全國聯(lián)合學(xué)術(shù)會議論文集[C];2004年
7 尚英;;動詞重疊形式的自動識別方法研究[A];第二屆全國學(xué)生計算語言學(xué)研討會論文集[C];2004年
8 劉旭花;孟祥增;劉俊曉;吳鵬飛;;一種基于知識庫的圖像對象自動識別方法[A];第十三屆全國圖象圖形學(xué)學(xué)術(shù)會議論文集[C];2006年
9 王昆翔;韓加;徐勇;;關(guān)于人臉圖象自動識別方法的研究[A];2001年中國智能自動化會議論文集(上冊)[C];2001年
10 楊志華;齊東旭;江力;楊力華;;一種基于EMD分解的睡眠腦電圖梭形波自動識別方法[A];第一屆中國情感計算及智能交互學(xué)術(shù)會議論文集[C];2003年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 陳U,
本文編號:920761
本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/920761.html