天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 自動化論文 >

基于深度遷移學習的數(shù)控系統(tǒng)領域技術術語識別

發(fā)布時間:2020-10-13 19:38
   近年來,隨著工業(yè)4.0、互聯(lián)網(wǎng)+等科技產(chǎn)業(yè)變革范式的提出,科技創(chuàng)新發(fā)展迅速,數(shù)控系統(tǒng)技術作為一種戰(zhàn)略性技術無疑屬于國家重大技術領域,大力發(fā)展數(shù)控加工技術是由制造大國走向制造強國的重要條件。在此背景下,研究識別數(shù)控系統(tǒng)領域新興技術術語,預測領域發(fā)展趨勢,對于國家和企業(yè)制定戰(zhàn)略性發(fā)展規(guī)劃具有重大意義。專利文獻是技術情報的最新來源,被廣泛的用于新興技術預見,專利文獻易于使用,但術語難以挖掘、抽取難度大,存在缺乏術語標簽的問題,因此如何針對專利文獻抽取技術術語是本文研究的重點。針對現(xiàn)有研究的不足,本文首先引入深度遷移學習的思想,基于命名實體識別技術,構建了數(shù)控系統(tǒng)領域新興術語識別、技術類別劃分和專利趨勢分析的整體方案;然后,本文基于語言模型和基于命名實體識別模型的遷移學習技術術語識別方案,利用成熟的公共領域源數(shù)據(jù),運用Bi-LSTM(雙向長短時記憶)模型實現(xiàn)跨領域遷移,有效識別技術術語并過濾高頻非術語詞串;最后,本文通過構建術語詞向量,選用WMD(詞移距離)技術計算文檔相似度,通過K-means對文檔和技術術語劃分技術類別,聚類結果以術語形式呈現(xiàn),更為準確易懂,可解釋性更強;谏鲜霾襟E,本文收集了2013年~2018年數(shù)控系統(tǒng)(CNC)領域?qū)@墨I,通過將新聞領域源數(shù)據(jù)已有知識遷移到數(shù)控系統(tǒng)領域目標數(shù)據(jù),解決了專利文獻缺少標注的問題,通過構建術語詞向量和文檔聚類,將數(shù)控系統(tǒng)領域分為硬件化、軟件化、工藝化、網(wǎng)絡化、智能化五大類。本文結合專利分析的方法,整合劃分的技術類別,對2013年~2018年數(shù)控系統(tǒng)領域發(fā)展動向進行綜合分析。
【學位單位】:華中科技大學
【學位級別】:碩士
【學位年份】:2019
【中圖分類】:TG659;TP391.1;TP18
【部分圖文】:

流程圖,術語,流程,專利文獻


圖 2-1 基于深度遷移學習的技術術語識別流程2.3 方案設計2.3.1 基于深度遷移學習的技術術語識別方案基于專利文獻的術語識別方案設計如圖一藍色箭頭所示:第一,調(diào)研數(shù)控系統(tǒng)領域科技文獻,查閱維基百科對數(shù)控機床種類的說明,檢索領域相關技術清單,翻閱數(shù)控機床教科書,聯(lián)合專家輔助制定檢索式,以機床和數(shù)控系統(tǒng)共現(xiàn)的關鍵詞為主結合 IPC 分類號,在 Thomson Innovation 專利數(shù)據(jù)庫中檢索專利文獻;第二,提取專利文獻數(shù)據(jù)集中摘要字段,通過抽取摘要關鍵短語并結合提取相關論文關鍵詞字段的方式構建候選標簽庫,經(jīng)過與專家研討得到基礎術語標簽庫,編寫代碼實現(xiàn)專利摘要字段的自動標注,相比人工全部標注大大減少了專家資源的浪費,

框架圖,語言模型,框架,領域


華 中 科 技 大 學 碩 士 學 位 論 文體識別技術通過捕捉語言風格進行任務的學習,而遷移學習通領域或者源任務和目標任務的相似性進行知識的學習,因此當似性較低時,通過 NER 技術捕捉句法特征,基于深度學習模型映射關系明確的相似或相同任務可以實現(xiàn)跨領域遷移學習。同領域有其獨特語言特點,描述方式和知識結構都有領域特色很好的模型可能并不適用于另一領域?珙I域 NER 任務遷移的知識從源領域數(shù)據(jù)遷移到目標領域數(shù)據(jù),因此目標數(shù)據(jù)必須有數(shù)據(jù)和目標數(shù)據(jù)的標簽存在映射關系,則共享模型的全部參數(shù)簽數(shù)量和映射關系不一致,則只遷移 Bi-LSTM 結構的參數(shù),解共享,每個任務單獨學習 CRF[23]。

框架圖,框架,標簽,樣本


圖 3-2 基于 NER 模型的遷移學習框架分析和模型介紹分析體識別任務在條件隨機場層時預測標簽的行為實際上可以理研究去除了傳統(tǒng)命名實體的抽取,只針對技術術語實體進行識二分類問題。在機器學習分類案例中,通常使用混淆矩陣標來評價模型的泛化性能。如表 3-1 所示,混淆矩陣分為 TP、本數(shù)量,TP 表示將正類樣本標簽預測為正類(即正正,正類表示將負類樣本標簽預測為負類(即負負,負類樣本預測正確標簽預測為負類(即正負,正類樣本預測錯誤),F(xiàn)P 表示將負(即負正,負類樣本預測錯誤)。其中,TP、TN 均表示預測
【參考文獻】

相關期刊論文 前4條

1 祝捷頻;趙蘊華;;基于美國對華技術管制清單的專利分析——以數(shù)控系統(tǒng)領域為例[J];情報雜志;2014年11期

2 黃曉莉;鄭佳;王瑩;董濤;;基于專利情報分析的中國數(shù)控機床產(chǎn)業(yè)研究[J];情報雜志;2012年09期

3 劉立;王博;;基于專利情報分析的數(shù)控機床產(chǎn)業(yè)研究[J];科技管理研究;2010年15期

4 高蓓;;數(shù)控機床全球?qū)@暾垹顩r分析[J];電子知識產(chǎn)權;2009年11期



本文編號:2839620

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/2839620.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶897cc***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com