天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 社科論文 > 圖書檔案論文 >

基于特征融合的引文失范數(shù)據(jù)自動處理策略研究

發(fā)布時間:2020-12-17 00:26
  【目的】將同一篇引文文獻的不同表達形式進行歸一,實現(xiàn)期刊引文數(shù)據(jù)規(guī)范控制與管理,減輕引文失范造成的數(shù)據(jù)質(zhì)量問題!痉椒ā恳云诳臄(shù)據(jù)庫建設(shè)為目標場景,根據(jù)參考文獻著錄標準分析期刊引文數(shù)據(jù)的核心特征,基于決策樹方法和準確率指標獲取有效特征子集并指定決策規(guī)則執(zhí)行優(yōu)先順序,生成多特征融合的自動數(shù)據(jù)處理策略。【結(jié)果】選取CBMCI的10 000條期刊引文樣本數(shù)據(jù)集和10 000條驗證數(shù)據(jù)集進行驗證,本文方法進行期刊引文歸一規(guī)范的準確率分別達99.72%、98.70%。【局限】僅探討了中文期刊引文失范數(shù)據(jù)的處理,尚未考慮其他語種和類型的引文!窘Y(jié)論】該處理策略能夠高效自動化地開展大規(guī)模期刊引文數(shù)據(jù)的歸一規(guī)范,減少人工干預(yù),特征融合的思路也適用于建立其他類型引文歸一規(guī)范時的自動處理策略。 

【文章來源】:數(shù)據(jù)分析與知識發(fā)現(xiàn). 2020年05期 北大核心CSSCI

【文章頁數(shù)】:8 頁

【部分圖文】:

基于特征融合的引文失范數(shù)據(jù)自動處理策略研究


基于特征融合的引文失范數(shù)據(jù)自動處理思路

有效特征,決策樹,子集,引文


圖1 基于特征融合的引文失范數(shù)據(jù)自動處理思路AC{T1,T2,T3,…,Tn}表示條件{T1,T2,T3,…,Tn}下全部引文規(guī)范的準確率,如公式(2)所示。

【參考文獻】:
期刊論文
[1]NSTL國際科學引文數(shù)據(jù)庫醫(yī)學外文期刊引文數(shù)據(jù)加工流程和加工技術(shù)研究[J]. 任慧玲,楊濱,黃利輝,徐海濤,李海,王坤.  醫(yī)學信息學雜志. 2009(03)
[2]影響CSTPC數(shù)據(jù)庫檢索效率的原因及對策[J]. 趙萍,徐平.  現(xiàn)代圖書情報技術(shù). 1999(04)
[3]NSTL外文期刊引文數(shù)據(jù)自動化拆分的研究與實踐[J]. 鮮國建,趙瑞雪,金晨.  數(shù)字圖書館論壇. 2010 (10)



本文編號:2921068

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/tushudanganlunwen/2921068.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶7b483***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com