從人文計算到可視化——數(shù)字人文的發(fā)展脈絡(luò)梳理
發(fā)布時間:2021-09-22 09:22
<正>作為一個新興的熱門研究領(lǐng)域,數(shù)字人文所涉及的內(nèi)容是豐富而龐雜的。為了探測數(shù)字人文領(lǐng)域的研究熱點,我們收集了數(shù)字人文領(lǐng)域規(guī)模最大的國際會議"國際數(shù)字人文大會"1 2016-18三年間所收錄的各種形式的會議論文約1700篇。我們統(tǒng)計了這1700篇論文的標(biāo)題和文摘中出現(xiàn)的關(guān)鍵詞的詞頻,排在第一位的是可視化(visualization)。2為什么可視化在數(shù)字人文的研究中如此重要?要回答這一問題,我們首先需要了解數(shù)字人文是如何產(chǎn)生的。一、數(shù)字人文是如何產(chǎn)生的
【文章來源】:文藝?yán)碚撆c批評. 2020,(02)北大核心CSSCI
【文章頁數(shù)】:6 頁
【部分圖文】:
1600-1810年間西班牙王國科學(xué)家的交流情況
圖1來自斯坦福大學(xué)的書信共和國(Republic of Letters)項目。該圖展現(xiàn)了西班牙王國1600-1810年間360個科學(xué)家相互之間以及與外界書信往來的情況。在圖中選擇一個節(jié)點,便可以觀察該節(jié)點對應(yīng)的科學(xué)家和他人的通信情況;選擇一個邊,便可以了解兩地之間在歷史上曾經(jīng)發(fā)生過的交往;選擇一個區(qū)域,便圈定了相應(yīng)的考察范圍。圖2是北京大學(xué)數(shù)字人文中心根據(jù)《宋元學(xué)案》所作的宋代理學(xué)衍化脈絡(luò)可視化成果。圖中的每一條溪流代表一個學(xué)術(shù)門派(對應(yīng)一個學(xué)案),它在某個時間點的垂直高度反映了對應(yīng)時段該學(xué)派在世學(xué)者的數(shù)量,縱覽全圖我們可以觀察宋代理學(xué)各門派各學(xué)說消長流衍的總體情況。點擊其中的一個溪流,就跳轉(zhuǎn)到該學(xué)術(shù)門派的詳細(xì)介紹頁面。
盡管不同案例的可視化方式各不相同,但歸納來說,數(shù)字人文的可視化,為人文語料提供了一個全局圖景。這個圖景,在本質(zhì)上是一個更多特征維度、更細(xì)知識粒度的目錄和索引。在中國的學(xué)術(shù)傳統(tǒng)中,目錄學(xué)是入學(xué)之門徑。清代王鳴盛在《十七史商榷》中說“目錄之學(xué),學(xué)中第一緊要事”,“必從此問途,方能得其門而入”。唐代目錄學(xué)家毋煚在《古今書錄序》中說“覽錄而知旨,觀目而悉詞,經(jīng)墳之精術(shù)盡探,賢哲之銳思咸識”,“將使書千帙于掌眸,披萬函于年祀”,其重要性可想而知。在紙質(zhì)文獻時代,目錄和索引,實際上就是紙本圖書的遠(yuǎn)讀系統(tǒng)。相應(yīng)地,遠(yuǎn)讀也可以看作是數(shù)字文本的可視化目錄。它描述了文檔集合的全局特征,讓研究人員對超大數(shù)據(jù)集有了整體認(rèn)知。它揭示了文本內(nèi)部或文本之間的多維度聯(lián)系,方便研究人員從地理、時間、頻度、聯(lián)系、主題等角度選擇他所關(guān)注的研究對象去深入細(xì)讀。同時,計算機遠(yuǎn)讀得到的對文本的抽象化結(jié)果,為研究者理解文本提供了文字之外的材料?梢哉f,遠(yuǎn)讀的價值,在于幫助我們在海量的數(shù)字媒體環(huán)境下篩選我們應(yīng)當(dāng)去關(guān)注的學(xué)術(shù)問題和有必要去細(xì)讀的文本。最終,我們還是要老老實實地坐下來細(xì)讀值得去讀的那一部分內(nèi)容。四、總結(jié)
本文編號:3403523
【文章來源】:文藝?yán)碚撆c批評. 2020,(02)北大核心CSSCI
【文章頁數(shù)】:6 頁
【部分圖文】:
1600-1810年間西班牙王國科學(xué)家的交流情況
圖1來自斯坦福大學(xué)的書信共和國(Republic of Letters)項目。該圖展現(xiàn)了西班牙王國1600-1810年間360個科學(xué)家相互之間以及與外界書信往來的情況。在圖中選擇一個節(jié)點,便可以觀察該節(jié)點對應(yīng)的科學(xué)家和他人的通信情況;選擇一個邊,便可以了解兩地之間在歷史上曾經(jīng)發(fā)生過的交往;選擇一個區(qū)域,便圈定了相應(yīng)的考察范圍。圖2是北京大學(xué)數(shù)字人文中心根據(jù)《宋元學(xué)案》所作的宋代理學(xué)衍化脈絡(luò)可視化成果。圖中的每一條溪流代表一個學(xué)術(shù)門派(對應(yīng)一個學(xué)案),它在某個時間點的垂直高度反映了對應(yīng)時段該學(xué)派在世學(xué)者的數(shù)量,縱覽全圖我們可以觀察宋代理學(xué)各門派各學(xué)說消長流衍的總體情況。點擊其中的一個溪流,就跳轉(zhuǎn)到該學(xué)術(shù)門派的詳細(xì)介紹頁面。
盡管不同案例的可視化方式各不相同,但歸納來說,數(shù)字人文的可視化,為人文語料提供了一個全局圖景。這個圖景,在本質(zhì)上是一個更多特征維度、更細(xì)知識粒度的目錄和索引。在中國的學(xué)術(shù)傳統(tǒng)中,目錄學(xué)是入學(xué)之門徑。清代王鳴盛在《十七史商榷》中說“目錄之學(xué),學(xué)中第一緊要事”,“必從此問途,方能得其門而入”。唐代目錄學(xué)家毋煚在《古今書錄序》中說“覽錄而知旨,觀目而悉詞,經(jīng)墳之精術(shù)盡探,賢哲之銳思咸識”,“將使書千帙于掌眸,披萬函于年祀”,其重要性可想而知。在紙質(zhì)文獻時代,目錄和索引,實際上就是紙本圖書的遠(yuǎn)讀系統(tǒng)。相應(yīng)地,遠(yuǎn)讀也可以看作是數(shù)字文本的可視化目錄。它描述了文檔集合的全局特征,讓研究人員對超大數(shù)據(jù)集有了整體認(rèn)知。它揭示了文本內(nèi)部或文本之間的多維度聯(lián)系,方便研究人員從地理、時間、頻度、聯(lián)系、主題等角度選擇他所關(guān)注的研究對象去深入細(xì)讀。同時,計算機遠(yuǎn)讀得到的對文本的抽象化結(jié)果,為研究者理解文本提供了文字之外的材料?梢哉f,遠(yuǎn)讀的價值,在于幫助我們在海量的數(shù)字媒體環(huán)境下篩選我們應(yīng)當(dāng)去關(guān)注的學(xué)術(shù)問題和有必要去細(xì)讀的文本。最終,我們還是要老老實實地坐下來細(xì)讀值得去讀的那一部分內(nèi)容。四、總結(jié)
本文編號:3403523
本文鏈接:http://sikaile.net/wenyilunwen/wenxuepinglunlunwen/3403523.html