天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 教育論文 > 課堂教學論文 >

學術文本結構功能深度學習識別方法的多學科對比分析

發(fā)布時間:2021-07-19 08:40
  [目的/意義]學術文本的結構功能識別可視為多類別文本自動分類問題,借助深度學習技術能夠獲得良好的自動識別性能,然而目前缺少其在不同學科適用性的對比研究。[方法/過程]選擇醫(yī)學、圖情、數(shù)據、出版、經濟5個學科方向5種期刊的6 452篇結構式摘要為基礎語料,設計并實現(xiàn)了基于Magpie深度學習組件的學術文本結構功能識別實驗,通過對比分析同一分類模型在不同學科領域實驗語料上的性能表現(xiàn)及其影響因素,揭示機器學習方法的學科適用性規(guī)律。[結果/結論]實驗結果顯示,學科差異性對于機器學習效果有顯著的影響,其中醫(yī)學領域學術文本的結構功能識別效率明顯高于其他學科,常見的學術文本功能結構框架中"方法"和"結果"的機器學習識別效果更佳。 

【文章來源】:現(xiàn)代情報. 2019,39(12)CSSCI

【文章頁數(shù)】:10 頁

【部分圖文】:

學術文本結構功能深度學習識別方法的多學科對比分析


實驗語料樣例

原理圖,學習分類,原理圖


類別分類問題(Multi-classClassification)。Magpie最初用于實現(xiàn)高等物理領域文獻摘要的主題分類標引,后被改進并封裝后成為一種實現(xiàn)大規(guī)模訓練語料基礎上的文本分類通用工具。目前,Magpie采用的基礎模型參考了先后由KimY[18]和BergerMJ[19]提出的基于CNN的文本分類模型。封裝后的Magpie在Word2Vec實現(xiàn)的詞向量化基礎上,通過SciKitLearn進行數(shù)據集的標準化處理,然后利用Keras神經網絡API實現(xiàn)深度學習完成分類任務,基本原理如圖2所示。圖2Magpie深度學習分類原理圖為科學全面地評估機器學習方法的適用性,實驗根據5種期刊所屬的中圖分類(見2.1節(jié)表2)將樣本語料分為5組,下文簡稱“醫(yī)學”、“圖情”、“數(shù)據”、“出版”、“經濟”,從學科差別、功能結構、樣本規(guī)模等多種角度,觀察5組數(shù)據的分類性能差異,分析機器學習的影響因素及變化規(guī)律。具體步驟如下:首先,將實驗數(shù)據通過分詞處理后利用Word2Vec算法構建各獨立語句文本的詞向量(Word_Vector);然后,在對數(shù)據進行標準化處理(Scaler)后調用Mapgie組件開展機器學習;最后,生成相應的機器學習模型(Model.h5),并應用于測試語料的自動分類。部分示例代碼如下:magpie=Magpie(keras_model='../magpie_result/20_0.1_li/mod-el.h5',word2vec_model='../magpie_result/20_0.1_li/embeddings',scaler='../magpie_result/20_0.1_li/scaler',labels=['purpose','method','result','limita-tion','application','valuation'])#調用Magpie機器學習模型及

【參考文獻】:
期刊論文
[1]多層次融合的學術文本結構功能識別研究[J]. 王佳敏,陸偉,劉家偉,程齊凱.  圖書情報工作. 2019(13)
[2]面向循證醫(yī)學的科技文獻摘要結構化表示研究[J]. 杜圣梅,朱禮軍,徐碩.  中國科技資源導刊. 2018(06)
[3]面向摘要結構功能劃分的模型性能比較研究[J]. 王東波,陸昊翔,周鑫,朱丹浩.  圖書情報工作. 2018(12)
[4]英語學術論文摘要語步結構自動識別模型的構建[J]. 王立非,劉霞.  外語電化教學. 2017(02)
[5]學術文本的結構功能識別——基于段落的識別[J]. 黃永,陸偉,程齊凱,桂思思.  情報學報. 2016 (05)
[6]學術文本的結構功能識別——基于章節(jié)內容的識別[J]. 黃永,陸偉,程齊凱.  情報學報. 2016 (03)
[7]中外科技期刊英文摘要文體格式的變化及建議[J]. 黃河清,韓健,張鯨驚,韓鳳,蔣奎,單愛蓮.  中國科技期刊研究. 2015(02)
[8]生物醫(yī)學期刊應用結構式摘要的現(xiàn)狀和建議[J]. 劉雪立,劉國偉,喬漢臣,潘伯榮.  中國科技期刊研究. 1994(02)



本文編號:3290383

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/jiaoyulunwen/ktjx/3290383.html


Copyright(c)文論論文網All Rights Reserved | 網站地圖 |

版權申明:資料由用戶d58a1***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com