天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 軟件論文 >

面向遷移學(xué)習(xí)的文本特征對齊算法

發(fā)布時間:2018-07-31 14:47
【摘要】:源領(lǐng)域和目標(biāo)領(lǐng)域特征空間的不一致導(dǎo)致遷移學(xué)習(xí)準(zhǔn)確率下降。為此,提出一種基于Word2Vec的不同領(lǐng)域特征對齊算法。只選取形容詞、副詞、名詞、動詞作為特征,針對每種詞性,選擇源領(lǐng)域和目標(biāo)領(lǐng)域的樞紐特征,分別在源領(lǐng)域和目標(biāo)領(lǐng)域為該樞紐特征計算出與之語義相似度最大的非樞紐特征,將其作為相似樞紐特征,從而為每個樞紐特征構(gòu)成一個相似樞紐特征對。將出現(xiàn)在這些領(lǐng)域中的每一個相似樞紐特征按照樞紐特征對進(jìn)行特征替換,從而將不同領(lǐng)域語義相似的特征進(jìn)行對齊,并在特征替換后的源領(lǐng)域和目標(biāo)領(lǐng)域數(shù)據(jù)上進(jìn)行機(jī)器學(xué)習(xí)。實驗結(jié)果表明,該算法的平均分類精度達(dá)到88.2%,高于Baseline算法。
[Abstract]:The inconsistency of feature space between source domain and target domain leads to the reduction of migration learning accuracy. For this reason, a new feature alignment algorithm for different domains based on Word2Vec is proposed. Only adjectives, adverbs, nouns and verbs are selected as the characteristics, and for each part of speech, the pivotal features of the source and target fields are selected. The non-hub features with the greatest semantic similarity are calculated in the source domain and the target domain, respectively, which are regarded as similar hub features, so as to form a similar hub feature pair for each hub feature. Each similar hub feature that appears in these domains is replaced by a feature pair of hub features to align the semantic similarity features of different domains, Machine learning is carried out on the source and target domain data after feature replacement. The experimental results show that the average classification accuracy of this algorithm is 88. 2%, which is higher than that of Baseline algorithm.
【作者單位】: 大連理工大學(xué)計算機(jī)科學(xué)與技術(shù)學(xué)院;大連外國語大學(xué)軟件學(xué)院;
【基金】:國家自然科學(xué)基金(61572102,61562080) 大連外國語大學(xué)科研基金(2014XJQN14)
【分類號】:TP391.1

【相似文獻(xiàn)】

相關(guān)期刊論文 前4條

1 賴清楠;馬皓;宋維佳;李婷婷;蔣廣學(xué);張蓓;;高校BBS與微博的用戶社交行為特征分析[J];通信學(xué)報;2013年S2期

2 衣麗霞;王輝;籍曉紅;;情感分析中極性副詞的自動擴(kuò)展[J];計算機(jī)應(yīng)用研究;2013年07期

3 鄭誠;楊希;張吉賡;;結(jié)合情感詞典與規(guī)則的微博情感極性分類方法[J];電腦知識與技術(shù);2014年13期

4 ;[J];;年期

相關(guān)碩士學(xué)位論文 前1條

1 梁東旭;基于產(chǎn)品評論的垃圾評論者檢測方法[D];大連理工大學(xué);2014年

,

本文編號:2155922

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/2155922.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶f4995***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com