數(shù)字人文人工智能平臺(tái)的設(shè)計(jì)與實(shí)現(xiàn)——以ECNU-DHAI平臺(tái)為例
發(fā)布時(shí)間:2021-07-21 19:46
當(dāng)前的數(shù)字人文實(shí)踐,主要由各組織和機(jī)構(gòu)單獨(dú)實(shí)施,以專題專項(xiàng)為主要建設(shè)模式,存在著難以應(yīng)對(duì)海量多源異構(gòu)資源數(shù)字化需求、重復(fù)建設(shè)、標(biāo)準(zhǔn)缺位制約數(shù)據(jù)關(guān)聯(lián)和共享等問(wèn)題。為此,本研究構(gòu)建了實(shí)現(xiàn)機(jī)器自動(dòng)化流程閉環(huán)和實(shí)踐成果共享的數(shù)字人文人工智能平臺(tái),并對(duì)其基礎(chǔ)層、平臺(tái)層、服務(wù)層和應(yīng)用層分別進(jìn)行了系統(tǒng)的介紹。最后,以華東師范大學(xué)DHAI平臺(tái)實(shí)踐為例,對(duì)其架構(gòu)設(shè)計(jì)、計(jì)算資源規(guī)劃和演進(jìn)、古籍文獻(xiàn)自動(dòng)識(shí)別和眾包校對(duì)、深度著錄應(yīng)用進(jìn)行了詳細(xì)介?紹。
【文章來(lái)源】:圖書(shū)館雜志. 2021,40(03)北大核心CSSCI
【文章頁(yè)數(shù)】:8 頁(yè)
【文章目錄】:
0 引言
1 數(shù)字人文研究現(xiàn)狀和困境
(1)專題專項(xiàng)的建設(shè)模式,難以應(yīng)對(duì)海量、多源異構(gòu)資源的數(shù)字化。
(2)建設(shè)成果和經(jīng)驗(yàn)未高度共享,重復(fù)實(shí)踐難度高。
(3)機(jī)器自動(dòng)化流程未閉環(huán),人力資源投入巨大。
(4)標(biāo)準(zhǔn)缺位,制約數(shù)據(jù)關(guān)聯(lián)和共享。
(5)人工智能技術(shù)學(xué)習(xí)成本高,掌握和應(yīng)用難度大。
2 數(shù)字人文人工智能平臺(tái)賦能數(shù)字人文研究
3 數(shù)字人文人工智能平臺(tái)設(shè)計(jì)
3.1 架構(gòu)設(shè)計(jì)
3.2 基礎(chǔ)層
(1)計(jì)算。
(2)數(shù)據(jù)庫(kù)。
(3)存儲(chǔ)。
3.3 平臺(tái)層
(1)減少通用服務(wù)的重復(fù)建設(shè)。
(2)引入最佳實(shí)踐。
3.4 服務(wù)層
3.5 應(yīng)用層
4 ECNU-DHAI平臺(tái)實(shí)踐
4.1 架構(gòu)框架
4.2 基礎(chǔ)計(jì)算資源和演進(jìn)
4.3 融合機(jī)器學(xué)習(xí)的OCR識(shí)別
(1)字符切分
(2)字符識(shí)別
4.4 基于眾包協(xié)作的任務(wù)機(jī)制
5 結(jié)論與展望
【參考文獻(xiàn)】:
期刊論文
[1]基于CIDOC-CRM的數(shù)字人文史料資源語(yǔ)義化知識(shí)組織研究——以張學(xué)良史料資源為例[J]. 姚天泓,陳艷梅,劉革,魯超. 圖書(shū)館學(xué)刊. 2019(07)
[2]知識(shí)圖譜在數(shù)字人文中的應(yīng)用研究[J]. 陳濤,劉煒,單蓉蓉,朱慶華. 中國(guó)圖書(shū)館學(xué)報(bào). 2019(06)
[3]數(shù)字人文研究領(lǐng)域的知識(shí)網(wǎng)絡(luò)演化——基于題錄信息和引文上下文的關(guān)鍵詞共詞分析[J]. 許鑫,陳路遙,楊佳穎. 情報(bào)學(xué)報(bào). 2019(03)
[4]從“人文計(jì)算”到“數(shù)字人文”——概念與研究方式的變遷[J]. 林施望. 圖書(shū)館論壇. 2019(08)
[5]“數(shù)字人文”與現(xiàn)代文學(xué)研究中的計(jì)量方法[J]. 趙薇. 現(xiàn)代中文學(xué)刊. 2019(01)
[6]“普羅米修斯之火”還是“達(dá)摩克利斯之劍”:數(shù)字人文與圖書(shū)情報(bào)學(xué)的理性思考[J]. 謝歡. 圖書(shū)情報(bào)知識(shí). 2019(01)
[7]數(shù)字人文視覺(jué)資源語(yǔ)義知識(shí)層次化聚合服務(wù)研究[J]. 周知,曾子明. 情報(bào)資料工作. 2018(06)
[8]基于深度哈希的數(shù)字人文移動(dòng)視覺(jué)搜索方法[J]. 秦思琪,曾子明. 情報(bào)資料工作. 2018(06)
[9]董其昌數(shù)字人文項(xiàng)目的探索與實(shí)踐[J]. 童茵,張彬. 中國(guó)博物館. 2018(04)
[10]國(guó)外數(shù)字人文領(lǐng)域公眾科學(xué)項(xiàng)目的案例分析及經(jīng)驗(yàn)啟示[J]. 練靖雯,張軒慧,趙宇翔. 情報(bào)資料工作. 2018(05)
本文編號(hào):3295655
【文章來(lái)源】:圖書(shū)館雜志. 2021,40(03)北大核心CSSCI
【文章頁(yè)數(shù)】:8 頁(yè)
【文章目錄】:
0 引言
1 數(shù)字人文研究現(xiàn)狀和困境
(1)專題專項(xiàng)的建設(shè)模式,難以應(yīng)對(duì)海量、多源異構(gòu)資源的數(shù)字化。
(2)建設(shè)成果和經(jīng)驗(yàn)未高度共享,重復(fù)實(shí)踐難度高。
(3)機(jī)器自動(dòng)化流程未閉環(huán),人力資源投入巨大。
(4)標(biāo)準(zhǔn)缺位,制約數(shù)據(jù)關(guān)聯(lián)和共享。
(5)人工智能技術(shù)學(xué)習(xí)成本高,掌握和應(yīng)用難度大。
2 數(shù)字人文人工智能平臺(tái)賦能數(shù)字人文研究
3 數(shù)字人文人工智能平臺(tái)設(shè)計(jì)
3.1 架構(gòu)設(shè)計(jì)
3.2 基礎(chǔ)層
(1)計(jì)算。
(2)數(shù)據(jù)庫(kù)。
(3)存儲(chǔ)。
3.3 平臺(tái)層
(1)減少通用服務(wù)的重復(fù)建設(shè)。
(2)引入最佳實(shí)踐。
3.4 服務(wù)層
3.5 應(yīng)用層
4 ECNU-DHAI平臺(tái)實(shí)踐
4.1 架構(gòu)框架
4.2 基礎(chǔ)計(jì)算資源和演進(jìn)
4.3 融合機(jī)器學(xué)習(xí)的OCR識(shí)別
(1)字符切分
(2)字符識(shí)別
4.4 基于眾包協(xié)作的任務(wù)機(jī)制
5 結(jié)論與展望
【參考文獻(xiàn)】:
期刊論文
[1]基于CIDOC-CRM的數(shù)字人文史料資源語(yǔ)義化知識(shí)組織研究——以張學(xué)良史料資源為例[J]. 姚天泓,陳艷梅,劉革,魯超. 圖書(shū)館學(xué)刊. 2019(07)
[2]知識(shí)圖譜在數(shù)字人文中的應(yīng)用研究[J]. 陳濤,劉煒,單蓉蓉,朱慶華. 中國(guó)圖書(shū)館學(xué)報(bào). 2019(06)
[3]數(shù)字人文研究領(lǐng)域的知識(shí)網(wǎng)絡(luò)演化——基于題錄信息和引文上下文的關(guān)鍵詞共詞分析[J]. 許鑫,陳路遙,楊佳穎. 情報(bào)學(xué)報(bào). 2019(03)
[4]從“人文計(jì)算”到“數(shù)字人文”——概念與研究方式的變遷[J]. 林施望. 圖書(shū)館論壇. 2019(08)
[5]“數(shù)字人文”與現(xiàn)代文學(xué)研究中的計(jì)量方法[J]. 趙薇. 現(xiàn)代中文學(xué)刊. 2019(01)
[6]“普羅米修斯之火”還是“達(dá)摩克利斯之劍”:數(shù)字人文與圖書(shū)情報(bào)學(xué)的理性思考[J]. 謝歡. 圖書(shū)情報(bào)知識(shí). 2019(01)
[7]數(shù)字人文視覺(jué)資源語(yǔ)義知識(shí)層次化聚合服務(wù)研究[J]. 周知,曾子明. 情報(bào)資料工作. 2018(06)
[8]基于深度哈希的數(shù)字人文移動(dòng)視覺(jué)搜索方法[J]. 秦思琪,曾子明. 情報(bào)資料工作. 2018(06)
[9]董其昌數(shù)字人文項(xiàng)目的探索與實(shí)踐[J]. 童茵,張彬. 中國(guó)博物館. 2018(04)
[10]國(guó)外數(shù)字人文領(lǐng)域公眾科學(xué)項(xiàng)目的案例分析及經(jīng)驗(yàn)啟示[J]. 練靖雯,張軒慧,趙宇翔. 情報(bào)資料工作. 2018(05)
本文編號(hào):3295655
本文鏈接:http://sikaile.net/kejilunwen/rengongzhinen/3295655.html
最近更新
教材專著