數(shù)字人文人工智能平臺的設(shè)計與實現(xiàn)——以ECNU-DHAI平臺為例
發(fā)布時間:2021-07-21 19:46
當前的數(shù)字人文實踐,主要由各組織和機構(gòu)單獨實施,以專題專項為主要建設(shè)模式,存在著難以應(yīng)對海量多源異構(gòu)資源數(shù)字化需求、重復(fù)建設(shè)、標準缺位制約數(shù)據(jù)關(guān)聯(lián)和共享等問題。為此,本研究構(gòu)建了實現(xiàn)機器自動化流程閉環(huán)和實踐成果共享的數(shù)字人文人工智能平臺,并對其基礎(chǔ)層、平臺層、服務(wù)層和應(yīng)用層分別進行了系統(tǒng)的介紹。最后,以華東師范大學(xué)DHAI平臺實踐為例,對其架構(gòu)設(shè)計、計算資源規(guī)劃和演進、古籍文獻自動識別和眾包校對、深度著錄應(yīng)用進行了詳細介?紹。
【文章來源】:圖書館雜志. 2021,40(03)北大核心CSSCI
【文章頁數(shù)】:8 頁
【文章目錄】:
0 引言
1 數(shù)字人文研究現(xiàn)狀和困境
(1)專題專項的建設(shè)模式,難以應(yīng)對海量、多源異構(gòu)資源的數(shù)字化。
(2)建設(shè)成果和經(jīng)驗未高度共享,重復(fù)實踐難度高。
(3)機器自動化流程未閉環(huán),人力資源投入巨大。
(4)標準缺位,制約數(shù)據(jù)關(guān)聯(lián)和共享。
(5)人工智能技術(shù)學(xué)習(xí)成本高,掌握和應(yīng)用難度大。
2 數(shù)字人文人工智能平臺賦能數(shù)字人文研究
3 數(shù)字人文人工智能平臺設(shè)計
3.1 架構(gòu)設(shè)計
3.2 基礎(chǔ)層
(1)計算。
(2)數(shù)據(jù)庫。
(3)存儲。
3.3 平臺層
(1)減少通用服務(wù)的重復(fù)建設(shè)。
(2)引入最佳實踐。
3.4 服務(wù)層
3.5 應(yīng)用層
4 ECNU-DHAI平臺實踐
4.1 架構(gòu)框架
4.2 基礎(chǔ)計算資源和演進
4.3 融合機器學(xué)習(xí)的OCR識別
(1)字符切分
(2)字符識別
4.4 基于眾包協(xié)作的任務(wù)機制
5 結(jié)論與展望
【參考文獻】:
期刊論文
[1]基于CIDOC-CRM的數(shù)字人文史料資源語義化知識組織研究——以張學(xué)良史料資源為例[J]. 姚天泓,陳艷梅,劉革,魯超. 圖書館學(xué)刊. 2019(07)
[2]知識圖譜在數(shù)字人文中的應(yīng)用研究[J]. 陳濤,劉煒,單蓉蓉,朱慶華. 中國圖書館學(xué)報. 2019(06)
[3]數(shù)字人文研究領(lǐng)域的知識網(wǎng)絡(luò)演化——基于題錄信息和引文上下文的關(guān)鍵詞共詞分析[J]. 許鑫,陳路遙,楊佳穎. 情報學(xué)報. 2019(03)
[4]從“人文計算”到“數(shù)字人文”——概念與研究方式的變遷[J]. 林施望. 圖書館論壇. 2019(08)
[5]“數(shù)字人文”與現(xiàn)代文學(xué)研究中的計量方法[J]. 趙薇. 現(xiàn)代中文學(xué)刊. 2019(01)
[6]“普羅米修斯之火”還是“達摩克利斯之劍”:數(shù)字人文與圖書情報學(xué)的理性思考[J]. 謝歡. 圖書情報知識. 2019(01)
[7]數(shù)字人文視覺資源語義知識層次化聚合服務(wù)研究[J]. 周知,曾子明. 情報資料工作. 2018(06)
[8]基于深度哈希的數(shù)字人文移動視覺搜索方法[J]. 秦思琪,曾子明. 情報資料工作. 2018(06)
[9]董其昌數(shù)字人文項目的探索與實踐[J]. 童茵,張彬. 中國博物館. 2018(04)
[10]國外數(shù)字人文領(lǐng)域公眾科學(xué)項目的案例分析及經(jīng)驗啟示[J]. 練靖雯,張軒慧,趙宇翔. 情報資料工作. 2018(05)
本文編號:3295655
【文章來源】:圖書館雜志. 2021,40(03)北大核心CSSCI
【文章頁數(shù)】:8 頁
【文章目錄】:
0 引言
1 數(shù)字人文研究現(xiàn)狀和困境
(1)專題專項的建設(shè)模式,難以應(yīng)對海量、多源異構(gòu)資源的數(shù)字化。
(2)建設(shè)成果和經(jīng)驗未高度共享,重復(fù)實踐難度高。
(3)機器自動化流程未閉環(huán),人力資源投入巨大。
(4)標準缺位,制約數(shù)據(jù)關(guān)聯(lián)和共享。
(5)人工智能技術(shù)學(xué)習(xí)成本高,掌握和應(yīng)用難度大。
2 數(shù)字人文人工智能平臺賦能數(shù)字人文研究
3 數(shù)字人文人工智能平臺設(shè)計
3.1 架構(gòu)設(shè)計
3.2 基礎(chǔ)層
(1)計算。
(2)數(shù)據(jù)庫。
(3)存儲。
3.3 平臺層
(1)減少通用服務(wù)的重復(fù)建設(shè)。
(2)引入最佳實踐。
3.4 服務(wù)層
3.5 應(yīng)用層
4 ECNU-DHAI平臺實踐
4.1 架構(gòu)框架
4.2 基礎(chǔ)計算資源和演進
4.3 融合機器學(xué)習(xí)的OCR識別
(1)字符切分
(2)字符識別
4.4 基于眾包協(xié)作的任務(wù)機制
5 結(jié)論與展望
【參考文獻】:
期刊論文
[1]基于CIDOC-CRM的數(shù)字人文史料資源語義化知識組織研究——以張學(xué)良史料資源為例[J]. 姚天泓,陳艷梅,劉革,魯超. 圖書館學(xué)刊. 2019(07)
[2]知識圖譜在數(shù)字人文中的應(yīng)用研究[J]. 陳濤,劉煒,單蓉蓉,朱慶華. 中國圖書館學(xué)報. 2019(06)
[3]數(shù)字人文研究領(lǐng)域的知識網(wǎng)絡(luò)演化——基于題錄信息和引文上下文的關(guān)鍵詞共詞分析[J]. 許鑫,陳路遙,楊佳穎. 情報學(xué)報. 2019(03)
[4]從“人文計算”到“數(shù)字人文”——概念與研究方式的變遷[J]. 林施望. 圖書館論壇. 2019(08)
[5]“數(shù)字人文”與現(xiàn)代文學(xué)研究中的計量方法[J]. 趙薇. 現(xiàn)代中文學(xué)刊. 2019(01)
[6]“普羅米修斯之火”還是“達摩克利斯之劍”:數(shù)字人文與圖書情報學(xué)的理性思考[J]. 謝歡. 圖書情報知識. 2019(01)
[7]數(shù)字人文視覺資源語義知識層次化聚合服務(wù)研究[J]. 周知,曾子明. 情報資料工作. 2018(06)
[8]基于深度哈希的數(shù)字人文移動視覺搜索方法[J]. 秦思琪,曾子明. 情報資料工作. 2018(06)
[9]董其昌數(shù)字人文項目的探索與實踐[J]. 童茵,張彬. 中國博物館. 2018(04)
[10]國外數(shù)字人文領(lǐng)域公眾科學(xué)項目的案例分析及經(jīng)驗啟示[J]. 練靖雯,張軒慧,趙宇翔. 情報資料工作. 2018(05)
本文編號:3295655
本文鏈接:http://www.sikaile.net/kejilunwen/rengongzhinen/3295655.html
最近更新
教材專著