跨領(lǐng)域中文微博消費(fèi)意圖識(shí)別方法的研究
本文關(guān)鍵詞:跨領(lǐng)域中文微博消費(fèi)意圖識(shí)別方法的研究,,由筆耕文化傳播整理發(fā)布。
【摘要】:網(wǎng)絡(luò)和社交媒體在世界范圍內(nèi)的興起,人們?cè)诨ヂ?lián)網(wǎng)方面充當(dāng)?shù)慕巧饾u多樣化。以微博為代表的言論平臺(tái)逐漸成為人們?nèi)粘I畹闹匾M成部分,與此同時(shí),電商消費(fèi)平臺(tái)也借助著互聯(lián)網(wǎng)使之規(guī)模越來(lái)越大。微博用戶在網(wǎng)絡(luò)上關(guān)于商品的評(píng)論、意見(jiàn)對(duì)于電商的營(yíng)銷策略以及生產(chǎn)商的產(chǎn)品設(shè)計(jì)都有著非常巨大的價(jià)值。從微博中識(shí)別其消費(fèi)意圖也因此尤為重要。微博的言論來(lái)自各個(gè)領(lǐng)域,本文針對(duì)微博的這個(gè)特點(diǎn),提出了一種基于語(yǔ)義距離的遷移學(xué)習(xí)算法,用于對(duì)微博意圖的探測(cè)以及識(shí)別。語(yǔ)義距離是消費(fèi)方向相關(guān)的計(jì)算,遷移學(xué)習(xí)則是針對(duì)微博言論的跨領(lǐng)域,這種文本分類方法可以提高識(shí)別的準(zhǔn)確率。此外,本文利用依存句法結(jié)構(gòu)以及拼音特征來(lái)解析中文微博的表達(dá)以及存在的錯(cuò)別字情況,借此特征可以較好地學(xué)習(xí)到一些微博的信息。最后,本文進(jìn)行了相對(duì)比較全面的微博意圖識(shí)別的實(shí)驗(yàn),針對(duì)識(shí)別的結(jié)果做出分析,并與相關(guān)領(lǐng)域的研究結(jié)果作對(duì)比研究。結(jié)果表明了基于語(yǔ)義距離的遷移學(xué)習(xí)算法在中文微博消費(fèi)意圖的識(shí)別方面是可行的,效果是較為理想的。
【關(guān)鍵詞】:消費(fèi)意圖識(shí)別 語(yǔ)義距離 遷移學(xué)習(xí) 文本分類
【學(xué)位授予單位】:上海交通大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類號(hào)】:TP391.1
【目錄】:
- 摘要3-4
- ABSTRACT4-9
- 第一章 緒論9-13
- 1.1 研究背景9-10
- 1.2 研究Qg容10-11
- 1.3 論文貢獻(xiàn)11
- 1.4 論文結(jié)構(gòu)11-13
- 第二章 相關(guān)研究13-23
- 2.1 意圖的探測(cè)和識(shí)別13-15
- 2.1.1 搜索引擎下的意圖13-14
- 2.1.2 消費(fèi)意圖的探測(cè)以及識(shí)別14-15
- 2.2 遷移學(xué)習(xí)15-17
- 2.3 文本處理17-20
- 2.3.1 文本的基礎(chǔ)處理17-19
- 2.3.2 文本處理的應(yīng)用領(lǐng)域19-20
- 2.4 語(yǔ)義距離20-22
- 2.4.1 向量空間模型20-21
- 2.4.2 語(yǔ)義距離計(jì)算21-22
- 2.4.3 詞向量22
- 2.5 本章小結(jié)22-23
- 第三章 系統(tǒng)基礎(chǔ)架構(gòu)和基礎(chǔ)工具23-32
- 3.1 系統(tǒng)基礎(chǔ)架構(gòu)23-24
- 3.2 系統(tǒng)基礎(chǔ)性工作準(zhǔn)備24-31
- 3.2.1 微博的獲取與處理24-26
- 3.2.2 領(lǐng)域相關(guān)本體庫(kù)的建立26-31
- 3.3 工具介紹31
- 3.4 本章小結(jié)31-32
- 第四章 跨領(lǐng)域微博意圖識(shí)別的關(guān)鍵技術(shù)32-49
- 4.1 跨領(lǐng)域的遷移學(xué)習(xí)32
- 4.2 特征選擇32-37
- 4.2.1 特征選擇算法32-34
- 4.2.2 句法特征34-36
- 4.2.3 微博特有特征36-37
- 4.3 基于語(yǔ)義距離的遷移學(xué)習(xí)框架37-47
- 4.3.1 EM算法37-38
- 4.3.2 基于EM算法的遷移學(xué)習(xí)38-42
- 4.3.3 文本語(yǔ)義距離計(jì)算方法42-44
- 4.3.4 基于語(yǔ)義距離的遷移學(xué)習(xí)44-47
- 4.4 基于語(yǔ)義距離的原始資料分類47-48
- 4.5 本章小結(jié)48-49
- 第五章 實(shí)驗(yàn)方法與結(jié)果分析49-59
- 5.1 實(shí)驗(yàn)介紹49-50
- 5.1.1 實(shí)驗(yàn)語(yǔ)料49
- 5.1.2 分類的評(píng)價(jià)標(biāo)準(zhǔn)49-50
- 5.2 微博文本特征50-51
- 5.3 消費(fèi)意圖識(shí)別的實(shí)驗(yàn)51-57
- 5.4 基于語(yǔ)義距離刪選無(wú)關(guān)微博的實(shí)驗(yàn)57-58
- 5.5 本章小結(jié)58-59
- 第六章 總結(jié)與展望59-61
- 6.1 本文總結(jié)59
- 6.2 討論與展望59-61
- 參考文獻(xiàn)61-65
- 致謝65-67
- 攻讀碩士學(xué)位期間已發(fā)表或錄用的論文67-69
【參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前7條
1 賴清楠;馬皓;宋維佳;李婷婷;蔣廣學(xué);張蓓;;高校BBS與微博的用戶社交行為特征分析[J];通信學(xué)報(bào);2013年S2期
2 謝麗星;周明;孫茂松;;基于層次結(jié)構(gòu)的多策略中文微博情感分析和特征抽取[J];中文信息學(xué)報(bào);2012年01期
3 廉捷;周欣;曹偉;劉云;;新浪微博數(shù)據(jù)挖掘方案[J];清華大學(xué)學(xué)報(bào)(自然科學(xué)版);2011年10期
4 李林容;黎薇;;微博的文化特性及傳播價(jià)值[J];當(dāng)代傳播;2011年01期
5 楊惠棟;;大學(xué)生錯(cuò)別字探析[J];安徽文學(xué)(下半月);2010年03期
6 蘇金樹(shù);張博鋒;徐昕;;基于機(jī)器學(xué)習(xí)的文本分類技術(shù)研究進(jìn)展[J];軟件學(xué)報(bào);2006年09期
7 陳正,李開(kāi)復(fù);拼寫(xiě)糾正在拼音輸入法中的應(yīng)用[J];計(jì)算機(jī)學(xué)報(bào);2001年07期
本文關(guān)鍵詞:跨領(lǐng)域中文微博消費(fèi)意圖識(shí)別方法的研究,由筆耕文化傳播整理發(fā)布。
本文編號(hào):287130
本文鏈接:http://www.sikaile.net/shoufeilunwen/xixikjs/287130.html