面向高考志愿的問答技術研究
發(fā)布時間:2024-03-09 09:35
高考作為步入高等教育的最后一道關口,是進行人生規(guī)劃的重要轉折,因此高考志愿的選取至關重要。在考生填報高考志愿前,應該對各個學校及專業(yè)等信息有一定的了解,避免盲目選擇,給未來大學學習和生活帶來困擾。在信息爆炸性增長的今天,如何快速、準確地在海量信息中獲取有用的學校、專業(yè)等信息逐漸演變成一個更加重要的課題。近年來,人工智能飛速發(fā)展,取得了突破性的成就,愈加引起了人們的關注與重視。人工智能的一個重要分支是問答系統(tǒng)。問答系統(tǒng)集自然語言處理技術于一體,是一種更人性、更高效的信息檢索技術,具有很大的發(fā)展空間。本文是面向高考志愿的問答技術研究,由于較少人在該領域做問答技術相關研究,所以本論文的研究對以后該領域問答系統(tǒng)構建有一定的現(xiàn)實價值及意義。本文是基于信息檢索的面向高考志愿的問答系統(tǒng)技術研究,主要針對問題分析和答案抽取兩個部分內容進行研究。論文首先通過爬蟲技術從各大高考網(wǎng)絡平臺、高考應用APP平臺和百度知道等收集高考志愿相關問答對數(shù)據(jù),并利用MySQL數(shù)據(jù)庫進行數(shù)據(jù)儲存。其次,針對爬蟲獲得的問答對數(shù)據(jù)集進行預處理、人工分類,為之后的問答技術研究實驗所需數(shù)據(jù)做準備。本文研究時,主要應用了深度學習以及...
【文章頁數(shù)】:68 頁
【學位級別】:碩士
【部分圖文】:
本文編號:3923228
【文章頁數(shù)】:68 頁
【學位級別】:碩士
【部分圖文】:
圖2.2Word2Vec神經(jīng)網(wǎng)絡架構
圖2.2Word2Vec神經(jīng)網(wǎng)絡架構設輸入語料為C,詞向量為m,從中逐個遍歷每個詞w,設n為的上下文長度,則Contex(t)就取前面的n1個詞,這樣一個二元對(Contex(t),)就構成了一個訓練樣本。語料,給定詞向量為m,則輸出層有....
圖2.5CNN模型結構圖
Skip-Gram的目標函數(shù)如下所示:(,)max(log(|ontext()))SkipGramwCwcDLpwCw(2-13)本文采用Word2Vec中的CBOW模型來訓練詞向量。二、CNN模型介紹卷積神經(jīng)網(wǎng)絡剛開始時就....
圖2.6卷積神經(jīng)網(wǎng)絡基本流程圖
面向高考志愿問題分類層處理后得到很多個一維向量。假設有m個filter,那么在一層卷積、一層池化后可以得到一個長度mzR:12[,,...,]mzccc全連接層:圖2.5中最后部分為全連接層,全連接層通過使用Softma到各個分類的概率。....
圖2.7Dropout工作示意圖
面向高考志愿問題分類四、正則化方法Dropout方法[39](Hinton,2012年)是一種防止神經(jīng)網(wǎng)絡模型出現(xiàn)過擬合的正則化技術。為了防止過擬合,訓練過程中在倒數(shù)第二層使用dropout技術,它將隨機丟棄隱含層的某些節(jié)點使其不工作。Dropout的工作原理,如圖....
本文編號:3923228
本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/3923228.html
最近更新
教材專著