融入Attention機(jī)制改進(jìn)Word2vec技術(shù)的水利水電工程專(zhuān)業(yè)詞智能提取與分析方法
發(fā)布時(shí)間:2021-04-06 13:00
水利水電工程專(zhuān)業(yè)文本信息處理與分析以往主要依賴(lài)于人工交互,存在過(guò)程繁瑣、效率低且易出錯(cuò)等問(wèn)題。本文基于自然語(yǔ)言處理技術(shù),引入Attention機(jī)制對(duì)Word2vec技術(shù)加以改進(jìn),提出了一種智能高效的水利水電工程專(zhuān)業(yè)詞識(shí)別提取與分析方法。該方法通過(guò)組合Attention機(jī)制,改進(jìn)Word2vec技術(shù)建立了專(zhuān)業(yè)詞向量計(jì)算模型;根據(jù)所求詞向量,計(jì)算詞語(yǔ)間相似度,以詞語(yǔ)間相似度為組合標(biāo)準(zhǔn),組合提取水利水電工程專(zhuān)業(yè)詞;進(jìn)而結(jié)合已有的水利水電工程專(zhuān)業(yè)文本,驗(yàn)證所提取專(zhuān)業(yè)詞的可信度,實(shí)現(xiàn)了水利水電工程專(zhuān)業(yè)詞的自動(dòng)提煉,構(gòu)建了一套水利水電工程專(zhuān)業(yè)詞智能識(shí)別提取與分析體系。該方法應(yīng)用于實(shí)際某混凝土大壩長(zhǎng)達(dá)229周的施工監(jiān)理周報(bào)文本分析中,經(jīng)過(guò)3輪識(shí)別計(jì)算與分析,獲得了9034個(gè)水利水電工程專(zhuān)業(yè)詞,準(zhǔn)確率為87.58%,有效提升了水利水電工程專(zhuān)業(yè)文本信息提取分析的效率、準(zhǔn)確率與智能化水平。
【文章來(lái)源】:水利學(xué)報(bào). 2020,51(07)北大核心EICSCD
【文章頁(yè)數(shù)】:11 頁(yè)
【部分圖文】:
Word2vec神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
經(jīng)過(guò)Attention機(jī)制處理后的Word2vec輸入可表示為:式中:V′k為Attention機(jī)制處理后第k個(gè)詞的Word2vec輸入;Vj為第j個(gè)詞的one-hot向量,onehot向量是文本單詞量化的一種形式,以0-1表示詞語(yǔ)在文本中是否出現(xiàn),進(jìn)而將每個(gè)詞表征為一個(gè)多維向量,以便于文本計(jì)算;ωjk為計(jì)算第k個(gè)詞向量時(shí)第j個(gè)詞的權(quán)重,計(jì)算式如下:
專(zhuān)業(yè)詞識(shí)別驗(yàn)證流程
【參考文獻(xiàn)】:
期刊論文
[1]基于文獻(xiàn)計(jì)量學(xué)的國(guó)內(nèi)水生態(tài)環(huán)境研究知識(shí)圖譜構(gòu)建與應(yīng)用[J]. 毛文山,趙紅莉,蔣云鐘,段浩,郝震. 水利學(xué)報(bào). 2019(11)
[2]水文水資源學(xué)家陳守煜先生學(xué)術(shù)研究的知識(shí)圖譜分析[J]. 金菊良,陳鵬飛,陳夢(mèng)璐,寧少尉,周戎星,張浩宇. 水利學(xué)報(bào). 2019(10)
[3]基于CNN模型的施工現(xiàn)場(chǎng)典型安全隱患數(shù)據(jù)學(xué)習(xí)[J]. 林鵬,魏鵬程,樊啟祥,陳聞起. 清華大學(xué)學(xué)報(bào)(自然科學(xué)版). 2019(08)
[4]大壩智能建設(shè)研究進(jìn)展[J]. 鐘登華,時(shí)夢(mèng)楠,崔博,王佳俊,關(guān)濤. 水利學(xué)報(bào). 2019(01)
[5]水工建筑物防滲墻技術(shù)60年Ⅱ:創(chuàng)新技術(shù)和工程應(yīng)用[J]. 宗敦峰,劉建發(fā),肖恩尚,陳祖煜. 水利學(xué)報(bào). 2016(04)
碩士論文
[1]基于深度學(xué)習(xí)的專(zhuān)業(yè)領(lǐng)域術(shù)語(yǔ)識(shí)別系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D]. 陳睿.北京郵電大學(xué) 2019
[2]基于自然語(yǔ)言處理的隱患分析系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D]. 付文幸.華中科技大學(xué) 2018
[3]融合深度學(xué)習(xí)和句義結(jié)構(gòu)模型的微博摘要方法研究[D]. 原玉嬌.北京理工大學(xué) 2016
本文編號(hào):3121478
【文章來(lái)源】:水利學(xué)報(bào). 2020,51(07)北大核心EICSCD
【文章頁(yè)數(shù)】:11 頁(yè)
【部分圖文】:
Word2vec神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
經(jīng)過(guò)Attention機(jī)制處理后的Word2vec輸入可表示為:式中:V′k為Attention機(jī)制處理后第k個(gè)詞的Word2vec輸入;Vj為第j個(gè)詞的one-hot向量,onehot向量是文本單詞量化的一種形式,以0-1表示詞語(yǔ)在文本中是否出現(xiàn),進(jìn)而將每個(gè)詞表征為一個(gè)多維向量,以便于文本計(jì)算;ωjk為計(jì)算第k個(gè)詞向量時(shí)第j個(gè)詞的權(quán)重,計(jì)算式如下:
專(zhuān)業(yè)詞識(shí)別驗(yàn)證流程
【參考文獻(xiàn)】:
期刊論文
[1]基于文獻(xiàn)計(jì)量學(xué)的國(guó)內(nèi)水生態(tài)環(huán)境研究知識(shí)圖譜構(gòu)建與應(yīng)用[J]. 毛文山,趙紅莉,蔣云鐘,段浩,郝震. 水利學(xué)報(bào). 2019(11)
[2]水文水資源學(xué)家陳守煜先生學(xué)術(shù)研究的知識(shí)圖譜分析[J]. 金菊良,陳鵬飛,陳夢(mèng)璐,寧少尉,周戎星,張浩宇. 水利學(xué)報(bào). 2019(10)
[3]基于CNN模型的施工現(xiàn)場(chǎng)典型安全隱患數(shù)據(jù)學(xué)習(xí)[J]. 林鵬,魏鵬程,樊啟祥,陳聞起. 清華大學(xué)學(xué)報(bào)(自然科學(xué)版). 2019(08)
[4]大壩智能建設(shè)研究進(jìn)展[J]. 鐘登華,時(shí)夢(mèng)楠,崔博,王佳俊,關(guān)濤. 水利學(xué)報(bào). 2019(01)
[5]水工建筑物防滲墻技術(shù)60年Ⅱ:創(chuàng)新技術(shù)和工程應(yīng)用[J]. 宗敦峰,劉建發(fā),肖恩尚,陳祖煜. 水利學(xué)報(bào). 2016(04)
碩士論文
[1]基于深度學(xué)習(xí)的專(zhuān)業(yè)領(lǐng)域術(shù)語(yǔ)識(shí)別系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D]. 陳睿.北京郵電大學(xué) 2019
[2]基于自然語(yǔ)言處理的隱患分析系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D]. 付文幸.華中科技大學(xué) 2018
[3]融合深度學(xué)習(xí)和句義結(jié)構(gòu)模型的微博摘要方法研究[D]. 原玉嬌.北京理工大學(xué) 2016
本文編號(hào):3121478
本文鏈接:http://www.sikaile.net/kejilunwen/shuiwenshuili/3121478.html
最近更新
教材專(zhuān)著