基于深度特征提取的句子分類模型研究
發(fā)布時間:2021-09-19 04:05
隨著互聯網的蓬勃發(fā)展,海量的文本信息正在不斷涌現,這些信息在新聞資訊、電子商務、輿情監(jiān)測等場景具有重要的價值。分類是對文本信息有效利用并解決上述實際場景需求的重要技術手段,而這些文本信息作為分類對象往往以單個語句或若干個詞語拼接成的短句的形式出現,因此構建一個具有良好性能的句子分類模型是尤為關鍵的。句子分類的研究具有重要的應用價值。由于句子普遍具有長度短、新詞多、重復成分少等特點,基于統(tǒng)計學習思想的句子分類方法往往需要耗費大量精力針對具體分類任務中句子的特點進行特征提取和選擇,同時對于新的分類場景,需要重新構建特征,普適性較差。這些缺點在一定程度上限制了此類方法在句子分類問題中的應用。深度學習在自然語言處理領域的應用推動了句子分類問題的研究,近年來的研究表明,卷積神經網絡能夠通過詞向量有效地應用在句子分類問題中。用于句子分類的卷積神經網絡雖然能夠提取句子中的局部特征,但忽視了在具體分類任務下,句子中不同的詞語對分類結果的重要性有所不同,同時不同部分的詞語間往往存在關聯信息,此外,每個詞對應的詞向量表示受限于單一詞向量訓練方法,以上方面均影響最終提取的用于分類的句子特征。本文針對上述存在...
【文章來源】:吉林大學吉林省 211工程院校 985工程院校 教育部直屬院校
【文章頁數】:72 頁
【學位級別】:碩士
【部分圖文】:
神經網絡語言模型整體結構
圖 2.2 word2vec 兩種模型基本結構ontext(w)中的 2c 個詞對應的詞向量,令詞向量的維數為 m,則每個詞向量可為( ( ) ) ,1 2mtv Context w R t c。第二層是投影層,將輸入層中的詞向量進行累加得到:
圖 2.3 基于層次 Softmax 的 CBOW 模型整體結構,..., {0,1}wwld 表示詞 w 的 1wl 位哈夫曼編碼,其中wjd 為路的編碼(根節(jié)點不對應編碼)。,...,w m R 表示路徑wp 中非葉節(jié)點對應的向量,其中w 為
本文編號:3400977
【文章來源】:吉林大學吉林省 211工程院校 985工程院校 教育部直屬院校
【文章頁數】:72 頁
【學位級別】:碩士
【部分圖文】:
神經網絡語言模型整體結構
圖 2.2 word2vec 兩種模型基本結構ontext(w)中的 2c 個詞對應的詞向量,令詞向量的維數為 m,則每個詞向量可為( ( ) ) ,1 2mtv Context w R t c。第二層是投影層,將輸入層中的詞向量進行累加得到:
圖 2.3 基于層次 Softmax 的 CBOW 模型整體結構,..., {0,1}wwld 表示詞 w 的 1wl 位哈夫曼編碼,其中wjd 為路的編碼(根節(jié)點不對應編碼)。,...,w m R 表示路徑wp 中非葉節(jié)點對應的向量,其中w 為
本文編號:3400977
本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/3400977.html
最近更新
教材專著