數(shù)據(jù)科學(xué)視角下的評(píng)價(jià)話語分析——以沖突話語中會(huì)話者評(píng)價(jià)風(fēng)格識(shí)別為例
發(fā)布時(shí)間:2021-02-16 08:29
評(píng)價(jià)意義是語篇語義層的人際意義資源,評(píng)價(jià)話語分析是以評(píng)價(jià)理論為分析框架對(duì)文本中的評(píng)價(jià)意義模式進(jìn)行研究。由于評(píng)價(jià)意義與詞匯語法形式之間沒有一對(duì)一的體現(xiàn)關(guān)系,現(xiàn)有的評(píng)價(jià)話語分析一般需要在標(biāo)注精密度和文本規(guī)模之間進(jìn)行取舍。數(shù)據(jù)科學(xué)的介入有助于解決該困境;跀(shù)據(jù)科學(xué)的基本原則闡釋了話語分析中的數(shù)據(jù)處理流程,提出在人工精密語義標(biāo)注的基礎(chǔ)上使用數(shù)據(jù)處理語言輔助進(jìn)行模式識(shí)別,從而提高研究的系統(tǒng)性和可重復(fù)性。以使用R語言輔助沖突話語中會(huì)話者評(píng)價(jià)風(fēng)格識(shí)別為例,探討數(shù)據(jù)科學(xué)在話語分析研究中的應(yīng)用價(jià)值。該方法不僅可用于評(píng)價(jià)話語分析,也可應(yīng)用于其他理論的話語分析,是后定性研究在話語分析領(lǐng)域的一次嘗試。
【文章來源】:天津外國語大學(xué)學(xué)報(bào). 2020,27(06)
【文章頁數(shù)】:17 頁
【部分圖文】:
變量類型及其在評(píng)價(jià)話語分析中的實(shí)例
語料準(zhǔn)備完成后需進(jìn)行基于評(píng)價(jià)理論的文本標(biāo)注和數(shù)據(jù)整理。Halliday(1994)明確指出,功能語法是朝向語義的語法。當(dāng)把評(píng)價(jià)作為人際意義的資源來討論時(shí),我們需要注重的是語義而非語法本身(胡壯麟等,2008:316)。由于評(píng)價(jià)意義在本質(zhì)上與價(jià)值觀密切相關(guān),對(duì)于評(píng)價(jià)的研究不應(yīng)該也無法僅限于體現(xiàn)顯性評(píng)價(jià)意義的詞匯或語法結(jié)構(gòu),而需要研究者代入某種閱讀定位,對(duì)語料中的評(píng)價(jià)資源進(jìn)行挖掘和解讀。因此,本案例采用從語篇語義層出發(fā)的人工標(biāo)注策略,以評(píng)價(jià)理論為基礎(chǔ),建立自定義分析框架。如圖3所示,該框架在維度上涉及評(píng)價(jià)者、受話人、評(píng)價(jià)對(duì)象、態(tài)度類別、效價(jià)、顯度、該態(tài)度例示是否有介入資源或級(jí)差資源修飾,同時(shí)在語義特征的精密度上也可以由左至右逐階追蹤。本案例采用文外電子表單標(biāo)注方法(1),將非結(jié)構(gòu)化數(shù)據(jù)的文本轉(zhuǎn)化為可機(jī)讀的結(jié)構(gòu)化數(shù)據(jù),即評(píng)價(jià)語義標(biāo)注。如表2所示,標(biāo)注表單以語步為行,以各種會(huì)話現(xiàn)象和評(píng)價(jià)意義資源為列,包括每個(gè)語步的話輪、會(huì)話者和受話人等會(huì)話分析資源以及評(píng)價(jià)對(duì)象、態(tài)度、顯度、效價(jià)、介入、級(jí)差等評(píng)價(jià)意義資源。數(shù)據(jù)整理包括刪除標(biāo)注沒有評(píng)價(jià)資源例示的語步行,添加其他相關(guān)信息或變量列,合并不同數(shù)據(jù)框,如會(huì)話者的社會(huì)角色信息等。
基于評(píng)價(jià)話語分析困境和數(shù)據(jù)科學(xué)的基本原則本文提出數(shù)據(jù)科學(xué)視角下的評(píng)價(jià)話語分析模型。該模型(見圖2)采用從語篇語義層標(biāo)注方式,將評(píng)價(jià)話語分析分為六個(gè)環(huán)節(jié),分別是語料準(zhǔn)備、文本標(biāo)注、數(shù)據(jù)整理、模式識(shí)別、模式解讀和匯報(bào)成果,其中文本標(biāo)注、數(shù)據(jù)整理和模式識(shí)別屬于數(shù)據(jù)科學(xué)的數(shù)據(jù)分析模塊。在模式識(shí)別過程中可能發(fā)現(xiàn)預(yù)料之外的語言現(xiàn)象,驅(qū)動(dòng)研究者修正研究問題,甚至更新分析框架,對(duì)文本進(jìn)行重新標(biāo)注。因此,數(shù)據(jù)分析模塊中的三個(gè)環(huán)節(jié)是一個(gè)問題驅(qū)動(dòng)的過程,需循環(huán)進(jìn)行。數(shù)據(jù)整理和模式識(shí)別可以使用數(shù)據(jù)處理語言輔助實(shí)現(xiàn),編寫的程序可在本研究中無限次運(yùn)行,也可共享給其他研究者。該模型在本質(zhì)上是基于評(píng)價(jià)理論的語言學(xué)分析,通過數(shù)據(jù)科學(xué)工具輔助提高評(píng)價(jià)話語分析的系統(tǒng)性和可重復(fù)性。下文將以沖突話語中評(píng)價(jià)風(fēng)格識(shí)別為案例展示如何應(yīng)用該模型。本案例在數(shù)據(jù)分析環(huán)節(jié)采用R語言作為實(shí)現(xiàn)手段。R語言擁有眾多集成各類函數(shù)的包,在擴(kuò)展性和靈活性方面有其他商業(yè)軟件(如Matlab,SPSS)無法比擬的優(yōu)勢(shì)。R語言在基于文本數(shù)據(jù)的語料庫語言學(xué)研究中也有一定應(yīng)用(Desagulier,2017;Gries,2017;Jockers,2014;雷蕾、潘璠,2012)。目前使用R語言輔助進(jìn)行以語義為關(guān)注點(diǎn)的話語分析,特別是評(píng)價(jià)話語分析的研究尚屬罕見。本案例使用R語言輔助進(jìn)行基于語義標(biāo)注數(shù)據(jù)的話語分析對(duì)于數(shù)據(jù)科學(xué)和話語分析研究都是一次有益的嘗試。
【參考文獻(xiàn)】:
期刊論文
[1]《定量語料庫語言學(xué)與R編程:實(shí)用導(dǎo)論》述評(píng)[J]. 雷蕾,潘璠. 外語教學(xué)理論與實(shí)踐. 2012(04)
[2]基于語料庫的情感評(píng)價(jià)意義構(gòu)型研究[J]. 劉世鑄. 外語教學(xué). 2009(02)
本文編號(hào):3036497
【文章來源】:天津外國語大學(xué)學(xué)報(bào). 2020,27(06)
【文章頁數(shù)】:17 頁
【部分圖文】:
變量類型及其在評(píng)價(jià)話語分析中的實(shí)例
語料準(zhǔn)備完成后需進(jìn)行基于評(píng)價(jià)理論的文本標(biāo)注和數(shù)據(jù)整理。Halliday(1994)明確指出,功能語法是朝向語義的語法。當(dāng)把評(píng)價(jià)作為人際意義的資源來討論時(shí),我們需要注重的是語義而非語法本身(胡壯麟等,2008:316)。由于評(píng)價(jià)意義在本質(zhì)上與價(jià)值觀密切相關(guān),對(duì)于評(píng)價(jià)的研究不應(yīng)該也無法僅限于體現(xiàn)顯性評(píng)價(jià)意義的詞匯或語法結(jié)構(gòu),而需要研究者代入某種閱讀定位,對(duì)語料中的評(píng)價(jià)資源進(jìn)行挖掘和解讀。因此,本案例采用從語篇語義層出發(fā)的人工標(biāo)注策略,以評(píng)價(jià)理論為基礎(chǔ),建立自定義分析框架。如圖3所示,該框架在維度上涉及評(píng)價(jià)者、受話人、評(píng)價(jià)對(duì)象、態(tài)度類別、效價(jià)、顯度、該態(tài)度例示是否有介入資源或級(jí)差資源修飾,同時(shí)在語義特征的精密度上也可以由左至右逐階追蹤。本案例采用文外電子表單標(biāo)注方法(1),將非結(jié)構(gòu)化數(shù)據(jù)的文本轉(zhuǎn)化為可機(jī)讀的結(jié)構(gòu)化數(shù)據(jù),即評(píng)價(jià)語義標(biāo)注。如表2所示,標(biāo)注表單以語步為行,以各種會(huì)話現(xiàn)象和評(píng)價(jià)意義資源為列,包括每個(gè)語步的話輪、會(huì)話者和受話人等會(huì)話分析資源以及評(píng)價(jià)對(duì)象、態(tài)度、顯度、效價(jià)、介入、級(jí)差等評(píng)價(jià)意義資源。數(shù)據(jù)整理包括刪除標(biāo)注沒有評(píng)價(jià)資源例示的語步行,添加其他相關(guān)信息或變量列,合并不同數(shù)據(jù)框,如會(huì)話者的社會(huì)角色信息等。
基于評(píng)價(jià)話語分析困境和數(shù)據(jù)科學(xué)的基本原則本文提出數(shù)據(jù)科學(xué)視角下的評(píng)價(jià)話語分析模型。該模型(見圖2)采用從語篇語義層標(biāo)注方式,將評(píng)價(jià)話語分析分為六個(gè)環(huán)節(jié),分別是語料準(zhǔn)備、文本標(biāo)注、數(shù)據(jù)整理、模式識(shí)別、模式解讀和匯報(bào)成果,其中文本標(biāo)注、數(shù)據(jù)整理和模式識(shí)別屬于數(shù)據(jù)科學(xué)的數(shù)據(jù)分析模塊。在模式識(shí)別過程中可能發(fā)現(xiàn)預(yù)料之外的語言現(xiàn)象,驅(qū)動(dòng)研究者修正研究問題,甚至更新分析框架,對(duì)文本進(jìn)行重新標(biāo)注。因此,數(shù)據(jù)分析模塊中的三個(gè)環(huán)節(jié)是一個(gè)問題驅(qū)動(dòng)的過程,需循環(huán)進(jìn)行。數(shù)據(jù)整理和模式識(shí)別可以使用數(shù)據(jù)處理語言輔助實(shí)現(xiàn),編寫的程序可在本研究中無限次運(yùn)行,也可共享給其他研究者。該模型在本質(zhì)上是基于評(píng)價(jià)理論的語言學(xué)分析,通過數(shù)據(jù)科學(xué)工具輔助提高評(píng)價(jià)話語分析的系統(tǒng)性和可重復(fù)性。下文將以沖突話語中評(píng)價(jià)風(fēng)格識(shí)別為案例展示如何應(yīng)用該模型。本案例在數(shù)據(jù)分析環(huán)節(jié)采用R語言作為實(shí)現(xiàn)手段。R語言擁有眾多集成各類函數(shù)的包,在擴(kuò)展性和靈活性方面有其他商業(yè)軟件(如Matlab,SPSS)無法比擬的優(yōu)勢(shì)。R語言在基于文本數(shù)據(jù)的語料庫語言學(xué)研究中也有一定應(yīng)用(Desagulier,2017;Gries,2017;Jockers,2014;雷蕾、潘璠,2012)。目前使用R語言輔助進(jìn)行以語義為關(guān)注點(diǎn)的話語分析,特別是評(píng)價(jià)話語分析的研究尚屬罕見。本案例使用R語言輔助進(jìn)行基于語義標(biāo)注數(shù)據(jù)的話語分析對(duì)于數(shù)據(jù)科學(xué)和話語分析研究都是一次有益的嘗試。
【參考文獻(xiàn)】:
期刊論文
[1]《定量語料庫語言學(xué)與R編程:實(shí)用導(dǎo)論》述評(píng)[J]. 雷蕾,潘璠. 外語教學(xué)理論與實(shí)踐. 2012(04)
[2]基于語料庫的情感評(píng)價(jià)意義構(gòu)型研究[J]. 劉世鑄. 外語教學(xué). 2009(02)
本文編號(hào):3036497
本文鏈接:http://sikaile.net/wenyilunwen/hanyulw/3036497.html
最近更新
教材專著