天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 軟件論文 >

基于注意力和殘差連接的BiLSTM-CNN文本分類

發(fā)布時(shí)間:2024-06-29 00:09
  互聯(lián)網(wǎng)和移動(dòng)互聯(lián)網(wǎng)應(yīng)用的快速發(fā)展帶來(lái)了文本數(shù)據(jù)的爆炸式增長(zhǎng),使用人工方式分類和整理文本已經(jīng)成為了不可能。如何在海量的文本數(shù)據(jù)中實(shí)現(xiàn)對(duì)文本的快速分類并應(yīng)用于后續(xù)的文章推薦、語(yǔ)義分析、信息檢索、信息抽取和機(jī)器翻譯一直是業(yè)界研究的熱點(diǎn)。隨著深度學(xué)習(xí)技術(shù)的不斷發(fā)展,越來(lái)越多的學(xué)者將深度學(xué)習(xí)技術(shù)應(yīng)用到自然語(yǔ)言領(lǐng)域中,也取得了非常不錯(cuò)的效果。但是,現(xiàn)有的算法往往無(wú)法準(zhǔn)確的表達(dá)文本信息以及在深層網(wǎng)絡(luò)時(shí)會(huì)出現(xiàn)網(wǎng)絡(luò)退化問(wèn)題。本文在分析已有文本分類算法基礎(chǔ)上,主要研究工作如下:本文針對(duì)在文本分類中使用高維度的文本詞向量在訓(xùn)練中難以收斂。對(duì)預(yù)處理后的文本語(yǔ)料使用word2vec算法進(jìn)行預(yù)訓(xùn)練。將得到的向量化文本數(shù)據(jù)作為整個(gè)分類模型的輸入,避免了出現(xiàn)維度災(zāi)難,也加快了模型的收斂。本文針對(duì)基于深度學(xué)習(xí)技術(shù)的文本分類算法中卷積神經(jīng)網(wǎng)絡(luò)(CNN)無(wú)法獲取文本全局特征、雙向循環(huán)神經(jīng)網(wǎng)絡(luò)(BiLSTM)無(wú)法聚焦文本局部特征的問(wèn)題,本文將CNN與BiLSTM進(jìn)行結(jié)合,在提取文本特征信息時(shí),既可以通過(guò)CNN網(wǎng)絡(luò)提取文本局部特征,又可以通過(guò)BiLSTM網(wǎng)絡(luò)提取文本全局特征,解決了文本分類中特征提取問(wèn)題。本文針對(duì)文本中不同單詞...

【文章頁(yè)數(shù)】:68 頁(yè)

【學(xué)位級(jí)別】:碩士

【部分圖文】:

圖2-1文本分類一般流程

圖2-1文本分類一般流程

圖2-1文本分類一般流程-1Textclassificationgeneralp用中,由于文本信息的非包括非法字符去除、特殊處理后的文本信息轉(zhuǎn)換成向量化后的文本矩陣和文續(xù)訓(xùn)練和學(xué)習(xí)。型在測(cè)試文本數(shù)據(jù)集的表化,需要對(duì)用于實(shí)驗(yàn)的語(yǔ)預(yù)處理方法,主要包括非


圖2-2決策樹(shù)實(shí)例Fig.2-2Decisiontreeinstance

圖2-2決策樹(shù)實(shí)例Fig.2-2Decisiontreeinstance

第二章預(yù)處理和相關(guān)理論基礎(chǔ)算法等。然后,將該樣本對(duì)所用的樣本進(jìn)行相似度計(jì)算,找到計(jì)算結(jié)果最。最后,這K個(gè)文本數(shù)據(jù)通過(guò)等權(quán)投票的方法來(lái)決定該文本的類別。由上述可知,使用KNN算法對(duì)文本分類的核心是計(jì)算文本之間的相似度和設(shè)置。因此,KNN算法不適合樣本量過(guò)大的情形,并且在....


圖2-3支持向量機(jī)Fig.2-3SupportVectorMachines

圖2-3支持向量機(jī)Fig.2-3SupportVectorMachines

1()1()ikiginiDD1212(,)()()DDginiDAginiDginiDDD向量機(jī)算法理二分類問(wèn)題的支持向量機(jī)(SVM)算法[48],在分類問(wèn)題上是在樣本空間中找到一個(gè)分隔最大的分類超平面,通過(guò)分類。后來(lái)的學(xué)者在....


圖2-4非監(jiān)督的深度學(xué)習(xí)模型結(jié)構(gòu)

圖2-4非監(jiān)督的深度學(xué)習(xí)模型結(jié)構(gòu)

訓(xùn)練的樣本數(shù)據(jù)是沒(méi)有進(jìn)行標(biāo)注的。其結(jié)構(gòu)如圖2-4所示,常見(jiàn)的如,自編碼機(jī)和玻爾茲曼機(jī)等。圖2-4非監(jiān)督的深度學(xué)習(xí)模型結(jié)構(gòu)Fig.2-4Unsuperviseddeeplearningmodelstructure在監(jiān)督的深度學(xué)習(xí)模型中,使用低層次的網(wǎng)絡(luò)來(lái)構(gòu)造更高層次....



本文編號(hào):3996868

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/3996868.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶50100***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com