論數(shù)字人文研究中可視化數(shù)據(jù)的意義與價(jià)值——以數(shù)字概念史研究為例
發(fā)布時(shí)間:2021-11-29 09:47
<正>目前人文學(xué)界對數(shù)據(jù)可視化(data visualization)抱持兩種態(tài)度:一種認(rèn)為是炫技,亦即認(rèn)為通過計(jì)算機(jī)技術(shù),雖可將復(fù)雜數(shù)據(jù)轉(zhuǎn)化為多種色彩繽紛、形式多樣的視覺印象(visual impression),但可視化的結(jié)果往往只是如《老子》所言"五色令人目盲",并未給人文學(xué)界帶來任何實(shí)質(zhì)上的助益;另一種則主張利器說,認(rèn)為通過數(shù)據(jù)可視化技術(shù)(visualization techniques),能將原本靜態(tài)的復(fù)雜數(shù)據(jù),以動(dòng)態(tài)的方式加以呈現(xiàn),在色彩、
【文章來源】:文藝?yán)碚撆c批評. 2020,(02)北大核心CSSCI
【文章頁數(shù)】:7 頁
【部分圖文】:
“萬國”、“世界”和“國際”的使用次數(shù)(1860-1915)
當(dāng)然,如果概念史研究只是將數(shù)據(jù)可視化運(yùn)用在概念詞頻的時(shí)間序列分布上的話,那還不足以證明數(shù)據(jù)可視化技術(shù)對概念史研究的重要性,因?yàn)楦拍钤~頻的年代數(shù)據(jù)還是勉強(qiáng)可以用文字列表的方式呈現(xiàn)的,讀者能夠在閱讀文字表格數(shù)據(jù)后依靠想像掌握概念群的發(fā)展圖像。然而數(shù)據(jù)可視化技術(shù),絕不僅限于概念詞頻的時(shí)間序列描繪,還有共現(xiàn)概念群可視化、詞綴概念群可視化以及網(wǎng)絡(luò)概念群可視化等技術(shù)。一旦涉及這些更為復(fù)雜的概念群的分合關(guān)系研究,若沒有可視化技術(shù)協(xié)助,呈現(xiàn)與描述研究結(jié)果就變得非常困難了。數(shù)據(jù)可視化技術(shù)究竟對于概念史研究還有哪些助益,可從以下三個(gè)案例進(jìn)一步考察。首先,共現(xiàn)概念群研究法能夠通過可視化技術(shù)擷取、呈現(xiàn)與代表核心概念的關(guān)鍵詞共同出現(xiàn)的高頻關(guān)鍵詞,而后還可同時(shí)觀察這一概念群在長時(shí)段中的新陳代謝現(xiàn)象。如圖2,即是通過數(shù)據(jù)可視化技術(shù),快速地計(jì)算并描繪出多達(dá)一億兩千萬字的“中國近現(xiàn)代思想史專業(yè)數(shù)據(jù)庫(1830-1930)”中,1895-1900年、1901-1914年、1915-1924年三個(gè)重要時(shí)期史料文獻(xiàn)中,與“平等”概念高頻共現(xiàn)的概念群的數(shù)據(jù)可視化圖像。
其次,詞綴概念群研究法通過可視化技術(shù)可揭示中國近代知識分子是如何以及在哪些時(shí)間節(jié)點(diǎn)制造出新詞匯,用以描述、表達(dá)與傳統(tǒng)中國截然不同的新世界的發(fā)展歷程的。在古代中國,由于社會發(fā)展相對緩慢,新事物不多,因此可用較少的詞匯概念去理解與描述世界,但在近代開眼看世界后,人們面對著與過去千年完全不同的新世界,就需要更多的詞匯概念去加以描繪。因此,近代中國知識分子配合時(shí)代需要,生產(chǎn)了一批新詞匯,其中可見諸多原有概念從傳統(tǒng)到現(xiàn)代朝著細(xì)化與專業(yè)化方向前進(jìn),為的就是能夠指稱與描述西方世界中的各種新事物。例如“美”的概念,就在近代中國受到西學(xué)與日本化的“東學(xué)”7知識影響,開啟了現(xiàn)代轉(zhuǎn)向,從傳統(tǒng)中國“美”的概念中分化出了“美術(shù)”、“美學(xué)”、“美感”、“美育”等過去沒有的新概念,用以描述現(xiàn)代新世界。因此研究者可嘗試通過考察中國重要的傳統(tǒng)單音節(jié)詞轉(zhuǎn)向多音節(jié)詞的發(fā)展軌跡,去揭示中國傳統(tǒng)概念的現(xiàn)代轉(zhuǎn)化歷程。然而,要用線性的文字形式去描述單音節(jié)詞轉(zhuǎn)向多音節(jié)詞的發(fā)展過程是很難的,可視化技術(shù)則能很好地捕捉、呈現(xiàn)出所有由單音節(jié)詞衍生的多音節(jié)詞以及其時(shí)間序列變化。如圖4所示,研究者可以快速完整地掌握近現(xiàn)代中國由“美”字衍生出的所有多音節(jié)詞,而可視化圖像中的箭頭粗細(xì),則表示對應(yīng)的多音節(jié)詞的使用頻率,從而揭示該詞的重要性。而后,還可利用剛才提到過的概念群的可視化技術(shù),將“美”的概念詞族進(jìn)行時(shí)間序列的描繪,以概念的時(shí)間群聚現(xiàn)象為標(biāo)準(zhǔn),可將“美”的相關(guān)概念群進(jìn)行分期,研究者可全面地掌握“美”的概念群的分期出現(xiàn)與發(fā)展過程,從而揭示出“美”的概念在近代是如何隨著時(shí)空語境的變化而流動(dòng)與位移的。8其三,概念群網(wǎng)絡(luò)研究法通過可視化方法可掌握概念群間的系統(tǒng)結(jié)構(gòu),可以考察一個(gè)話語論述所包含的概念群中所有概念的關(guān)系與連帶現(xiàn)象。哪些概念與概念間為強(qiáng)連帶(strong ties)或弱連帶(weak ties)?哪個(gè)概念為連接不同概念群的概念橋梁(bridge)?哪個(gè)概念是不屬于任何概念群但擔(dān)負(fù)起連結(jié)概念群作用的聯(lián)絡(luò)概念(liaison)?哪個(gè)概念是很少或不參加任何概念群的孤獨(dú)概念(isolate)?哪個(gè)概念是概念網(wǎng)絡(luò)中有著最多關(guān)系連結(jié)的明星概念(star)?從上述這些角度,概念史研究者可深入考察概念的結(jié)構(gòu)洞(structural hole)以及概念群中的派系(clique),進(jìn)行概念群的網(wǎng)絡(luò)位置分析(positional analysis)。9通過運(yùn)用概念群網(wǎng)絡(luò)分析的可視化技術(shù),研究者將能分辨出在話語中不同概念的重要性差異。例如圖510顯示出《新青年》第一卷所有文章論述中分支度(degree)最高的概念,即“政治”概念,與另外9個(gè)重要概念連帶,這意味著“政治”是《新青年》第一卷所有文本中作為核心的明星概念,是第一卷所有文章論述中都難以繞過的重要概念,若沒有數(shù)字人文方法與可視化技術(shù)的協(xié)助,一般概念史方法是難以捕捉到“政治”概念在《新青年》第一卷中作為明星概念的重要性的。在未使用可視化技術(shù)前,研究者只能將史料文本進(jìn)行平面與線性的閱讀、分析與討論,但通過運(yùn)用可視化技術(shù),研究者就能以動(dòng)態(tài)且立體的形式去理解、分析與呈現(xiàn)研究結(jié)果,看出概念間的動(dòng)態(tài)連帶發(fā)展過程,就此與一般概念史方法有所區(qū)隔,得以更為細(xì)致地與動(dòng)態(tài)地揭示不同概念在概念群網(wǎng)絡(luò)位置中的特殊性與重要性。
【參考文獻(xiàn)】:
期刊論文
[1]中國近代平等觀念形成之?dāng)?shù)字人文研究:以報(bào)刊為中心[J]. 邱偉云,金觀濤,劉青峰,劉昭麟. 清華大學(xué)學(xué)報(bào)(哲學(xué)社會科學(xué)版). 2018(06)
[2]概念史研究的中國轉(zhuǎn)向[J]. 孫江. 學(xué)術(shù)月刊. 2018(10)
[3]18世紀(jì)德語歷史文獻(xiàn)的數(shù)據(jù)挖掘:以主題模型為例[J]. 王濤. 學(xué)海. 2017(01)
[4]詞匯語義變化與社會變遷定量觀測與分析[J]. 劉知遠(yuǎn),劉揚(yáng),涂存超,孫茂松. 語言戰(zhàn)略研究. 2016(06)
[5]“選精”、“集粹”與“宋代江南農(nóng)業(yè)革命”——對傳統(tǒng)經(jīng)濟(jì)史研究方法的檢討[J]. 李伯重. 中國社會科學(xué). 2000(01)
本文編號:3526288
【文章來源】:文藝?yán)碚撆c批評. 2020,(02)北大核心CSSCI
【文章頁數(shù)】:7 頁
【部分圖文】:
“萬國”、“世界”和“國際”的使用次數(shù)(1860-1915)
當(dāng)然,如果概念史研究只是將數(shù)據(jù)可視化運(yùn)用在概念詞頻的時(shí)間序列分布上的話,那還不足以證明數(shù)據(jù)可視化技術(shù)對概念史研究的重要性,因?yàn)楦拍钤~頻的年代數(shù)據(jù)還是勉強(qiáng)可以用文字列表的方式呈現(xiàn)的,讀者能夠在閱讀文字表格數(shù)據(jù)后依靠想像掌握概念群的發(fā)展圖像。然而數(shù)據(jù)可視化技術(shù),絕不僅限于概念詞頻的時(shí)間序列描繪,還有共現(xiàn)概念群可視化、詞綴概念群可視化以及網(wǎng)絡(luò)概念群可視化等技術(shù)。一旦涉及這些更為復(fù)雜的概念群的分合關(guān)系研究,若沒有可視化技術(shù)協(xié)助,呈現(xiàn)與描述研究結(jié)果就變得非常困難了。數(shù)據(jù)可視化技術(shù)究竟對于概念史研究還有哪些助益,可從以下三個(gè)案例進(jìn)一步考察。首先,共現(xiàn)概念群研究法能夠通過可視化技術(shù)擷取、呈現(xiàn)與代表核心概念的關(guān)鍵詞共同出現(xiàn)的高頻關(guān)鍵詞,而后還可同時(shí)觀察這一概念群在長時(shí)段中的新陳代謝現(xiàn)象。如圖2,即是通過數(shù)據(jù)可視化技術(shù),快速地計(jì)算并描繪出多達(dá)一億兩千萬字的“中國近現(xiàn)代思想史專業(yè)數(shù)據(jù)庫(1830-1930)”中,1895-1900年、1901-1914年、1915-1924年三個(gè)重要時(shí)期史料文獻(xiàn)中,與“平等”概念高頻共現(xiàn)的概念群的數(shù)據(jù)可視化圖像。
其次,詞綴概念群研究法通過可視化技術(shù)可揭示中國近代知識分子是如何以及在哪些時(shí)間節(jié)點(diǎn)制造出新詞匯,用以描述、表達(dá)與傳統(tǒng)中國截然不同的新世界的發(fā)展歷程的。在古代中國,由于社會發(fā)展相對緩慢,新事物不多,因此可用較少的詞匯概念去理解與描述世界,但在近代開眼看世界后,人們面對著與過去千年完全不同的新世界,就需要更多的詞匯概念去加以描繪。因此,近代中國知識分子配合時(shí)代需要,生產(chǎn)了一批新詞匯,其中可見諸多原有概念從傳統(tǒng)到現(xiàn)代朝著細(xì)化與專業(yè)化方向前進(jìn),為的就是能夠指稱與描述西方世界中的各種新事物。例如“美”的概念,就在近代中國受到西學(xué)與日本化的“東學(xué)”7知識影響,開啟了現(xiàn)代轉(zhuǎn)向,從傳統(tǒng)中國“美”的概念中分化出了“美術(shù)”、“美學(xué)”、“美感”、“美育”等過去沒有的新概念,用以描述現(xiàn)代新世界。因此研究者可嘗試通過考察中國重要的傳統(tǒng)單音節(jié)詞轉(zhuǎn)向多音節(jié)詞的發(fā)展軌跡,去揭示中國傳統(tǒng)概念的現(xiàn)代轉(zhuǎn)化歷程。然而,要用線性的文字形式去描述單音節(jié)詞轉(zhuǎn)向多音節(jié)詞的發(fā)展過程是很難的,可視化技術(shù)則能很好地捕捉、呈現(xiàn)出所有由單音節(jié)詞衍生的多音節(jié)詞以及其時(shí)間序列變化。如圖4所示,研究者可以快速完整地掌握近現(xiàn)代中國由“美”字衍生出的所有多音節(jié)詞,而可視化圖像中的箭頭粗細(xì),則表示對應(yīng)的多音節(jié)詞的使用頻率,從而揭示該詞的重要性。而后,還可利用剛才提到過的概念群的可視化技術(shù),將“美”的概念詞族進(jìn)行時(shí)間序列的描繪,以概念的時(shí)間群聚現(xiàn)象為標(biāo)準(zhǔn),可將“美”的相關(guān)概念群進(jìn)行分期,研究者可全面地掌握“美”的概念群的分期出現(xiàn)與發(fā)展過程,從而揭示出“美”的概念在近代是如何隨著時(shí)空語境的變化而流動(dòng)與位移的。8其三,概念群網(wǎng)絡(luò)研究法通過可視化方法可掌握概念群間的系統(tǒng)結(jié)構(gòu),可以考察一個(gè)話語論述所包含的概念群中所有概念的關(guān)系與連帶現(xiàn)象。哪些概念與概念間為強(qiáng)連帶(strong ties)或弱連帶(weak ties)?哪個(gè)概念為連接不同概念群的概念橋梁(bridge)?哪個(gè)概念是不屬于任何概念群但擔(dān)負(fù)起連結(jié)概念群作用的聯(lián)絡(luò)概念(liaison)?哪個(gè)概念是很少或不參加任何概念群的孤獨(dú)概念(isolate)?哪個(gè)概念是概念網(wǎng)絡(luò)中有著最多關(guān)系連結(jié)的明星概念(star)?從上述這些角度,概念史研究者可深入考察概念的結(jié)構(gòu)洞(structural hole)以及概念群中的派系(clique),進(jìn)行概念群的網(wǎng)絡(luò)位置分析(positional analysis)。9通過運(yùn)用概念群網(wǎng)絡(luò)分析的可視化技術(shù),研究者將能分辨出在話語中不同概念的重要性差異。例如圖510顯示出《新青年》第一卷所有文章論述中分支度(degree)最高的概念,即“政治”概念,與另外9個(gè)重要概念連帶,這意味著“政治”是《新青年》第一卷所有文本中作為核心的明星概念,是第一卷所有文章論述中都難以繞過的重要概念,若沒有數(shù)字人文方法與可視化技術(shù)的協(xié)助,一般概念史方法是難以捕捉到“政治”概念在《新青年》第一卷中作為明星概念的重要性的。在未使用可視化技術(shù)前,研究者只能將史料文本進(jìn)行平面與線性的閱讀、分析與討論,但通過運(yùn)用可視化技術(shù),研究者就能以動(dòng)態(tài)且立體的形式去理解、分析與呈現(xiàn)研究結(jié)果,看出概念間的動(dòng)態(tài)連帶發(fā)展過程,就此與一般概念史方法有所區(qū)隔,得以更為細(xì)致地與動(dòng)態(tài)地揭示不同概念在概念群網(wǎng)絡(luò)位置中的特殊性與重要性。
【參考文獻(xiàn)】:
期刊論文
[1]中國近代平等觀念形成之?dāng)?shù)字人文研究:以報(bào)刊為中心[J]. 邱偉云,金觀濤,劉青峰,劉昭麟. 清華大學(xué)學(xué)報(bào)(哲學(xué)社會科學(xué)版). 2018(06)
[2]概念史研究的中國轉(zhuǎn)向[J]. 孫江. 學(xué)術(shù)月刊. 2018(10)
[3]18世紀(jì)德語歷史文獻(xiàn)的數(shù)據(jù)挖掘:以主題模型為例[J]. 王濤. 學(xué)海. 2017(01)
[4]詞匯語義變化與社會變遷定量觀測與分析[J]. 劉知遠(yuǎn),劉揚(yáng),涂存超,孫茂松. 語言戰(zhàn)略研究. 2016(06)
[5]“選精”、“集粹”與“宋代江南農(nóng)業(yè)革命”——對傳統(tǒng)經(jīng)濟(jì)史研究方法的檢討[J]. 李伯重. 中國社會科學(xué). 2000(01)
本文編號:3526288
本文鏈接:http://sikaile.net/wenyilunwen/wenxuepinglunlunwen/3526288.html
教材專著