天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 社科論文 > 圖書檔案論文 >

從人工密集型到計(jì)算密集型:NSTL數(shù)據(jù)庫(kù)建設(shè)模式轉(zhuǎn)型之路

發(fā)布時(shí)間:2021-09-23 05:38
  近年來(lái),在國(guó)家科技圖書文獻(xiàn)中心(National Science and Technology Library,NSTL)業(yè)務(wù)流程再造總體規(guī)劃指導(dǎo)下,NSTL數(shù)據(jù)庫(kù)建設(shè)模式發(fā)生了深刻變化與全面轉(zhuǎn)型。本文總結(jié)梳理了由"全自主加工"到"自主加工+第三方數(shù)據(jù)利用",再到當(dāng)前"多源異構(gòu)文摘數(shù)據(jù)深度融合利用"的發(fā)展脈絡(luò),展現(xiàn)了NSTL數(shù)據(jù)庫(kù)建設(shè)模式正從人工密集型向計(jì)算密集型轉(zhuǎn)型的特點(diǎn),而近十年來(lái)文摘數(shù)據(jù)加工與第三方數(shù)據(jù)利用情況印證了這一發(fā)展歷程。在此基礎(chǔ)上,本文以期刊文摘數(shù)據(jù)加工為例,重點(diǎn)探討多源異構(gòu)文摘數(shù)據(jù)深度融合利用模式,包括基本原則、總體框架、規(guī)則設(shè)計(jì)與算法實(shí)現(xiàn)、融合系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)。最后指出,NSTL數(shù)據(jù)庫(kù)建設(shè)最終將實(shí)現(xiàn)從人工密集型到計(jì)算密集型、從加工流程驅(qū)動(dòng)向多源大數(shù)據(jù)驅(qū)動(dòng)的全面轉(zhuǎn)型發(fā)展,也將為NSTL構(gòu)建下一代新型、智能化的知識(shí)發(fā)現(xiàn)服務(wù)體系,提供堅(jiān)實(shí)的數(shù)字科技文獻(xiàn)大數(shù)據(jù)支撐。 

【文章來(lái)源】:數(shù)字圖書館論壇. 2020,(07)CSSCI

【文章頁(yè)數(shù)】:8 頁(yè)

【部分圖文】:

從人工密集型到計(jì)算密集型:NSTL數(shù)據(jù)庫(kù)建設(shè)模式轉(zhuǎn)型之路


匹配融合加工模式總體框架

流程圖,異構(gòu)數(shù)據(jù),流程圖,字段


在精準(zhǔn)匹配基礎(chǔ)上,針對(duì)NSTL元數(shù)據(jù)30多個(gè)字段/組內(nèi)容進(jìn)行了數(shù)據(jù)字段級(jí)內(nèi)容融合規(guī)則和優(yōu)化級(jí)的設(shè)計(jì)確定,字段級(jí)融合規(guī)則的總體思路是先以NSTL字段為融合基準(zhǔn),再為WoS等其他優(yōu)質(zhì)來(lái)源數(shù)據(jù)依次選用,融合過(guò)程通過(guò)日志可回溯可修改。2.3.2 核心算法實(shí)現(xiàn)

流程圖,匹配算法,流程圖,字段


在融合算法實(shí)現(xiàn)方面,對(duì)匹配上的數(shù)據(jù)進(jìn)行分組,再根據(jù)數(shù)據(jù)融合規(guī)則選取相應(yīng)字段的具體信息,生成一條新的數(shù)據(jù)并同時(shí)記錄該數(shù)據(jù)所有字段來(lái)源信息(見圖4)。目前,在單線程下每分鐘能融合1 000條,據(jù)初步統(tǒng)計(jì)分析,基于融合算法將精確匹配的7 900萬(wàn)余條數(shù)據(jù)融合為2 990萬(wàn)余條。圖4 字段級(jí)融合算法流程圖

【參考文獻(xiàn)】:
期刊論文
[1]數(shù)據(jù)治理技術(shù)[J]. 吳信東,董丙冰,堵新政,楊威.  軟件學(xué)報(bào). 2019(09)
[2]大數(shù)據(jù)時(shí)代下數(shù)據(jù)管理理念的變革:從結(jié)果派到過(guò)程派[J]. 童楠楠,朝樂(lè)門.  情報(bào)理論與實(shí)踐. 2017(02)
[3]國(guó)家科技圖書文獻(xiàn)中心“十三五”發(fā)展規(guī)劃[J]. 彭以祺,吳波爾,沈仲祺.  數(shù)字圖書館論壇. 2016(11)
[4]NSTL集成利用第三方來(lái)源元數(shù)據(jù)的實(shí)踐與探索[J]. 于倩倩,張建勇.  現(xiàn)代圖書情報(bào)技術(shù). 2016(01)
[5]高校圖書館數(shù)據(jù)治理及其框架[J]. 包冬梅,范穎捷,李鳴.  圖書情報(bào)工作. 2015(18)
[6]NSTL聯(lián)合數(shù)據(jù)加工系統(tǒng)的功能框架設(shè)計(jì)[J]. 張建勇,孟連生,劉筱敏,曾燕,劉小兵,董智鵬.  圖書情報(bào)工作. 2011(03)
[7]NSTL文獻(xiàn)信息加工10年概述[J]. 孟連生,張建勇,劉筱敏.  數(shù)字圖書館論壇. 2010 (10)



本文編號(hào):3405144

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/tushudanganlunwen/3405144.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶09c13***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com