天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

語(yǔ)料庫(kù)與社會(huì)語(yǔ)言學(xué)研究方法

發(fā)布時(shí)間:2016-12-01 14:55

  本文關(guān)鍵詞:語(yǔ)料庫(kù)與社會(huì)語(yǔ)言學(xué)研究方法,由筆耕文化傳播整理發(fā)布。


語(yǔ)料庫(kù)與社會(huì)語(yǔ)言學(xué)研究方法 投稿:賴(lài)涾涿

 

 

社會(huì)語(yǔ)言學(xué)研究之所以成為一門(mén)獨(dú)立的學(xué)科,不僅在語(yǔ)言觀方面與傳統(tǒng)結(jié)構(gòu)語(yǔ)言學(xué),尤其是轉(zhuǎn)換生成語(yǔ)法學(xué)派不同,在研究方法上也有較大的差別。關(guān)于語(yǔ)言觀上的不同,本文不加以討論,本文重點(diǎn)討論方法上的差別,尤其是語(yǔ)料庫(kù)方法對(duì)社會(huì)語(yǔ)言學(xué)研究的促進(jìn)作用。《語(yǔ)言學(xué)方法論…

中國(guó)現(xiàn)代化的進(jìn)程起步于清晚期。在走向現(xiàn)代化的風(fēng)雨歷程中,中國(guó)語(yǔ)文現(xiàn)代化思潮疊浪而興,語(yǔ)文現(xiàn)代化運(yùn)動(dòng)接踵而起,形成了不同時(shí)期的語(yǔ)言規(guī)劃,促進(jìn)語(yǔ)言生活逐漸現(xiàn)代化。政府的職責(zé)之一就是管理語(yǔ)言生活。管理好語(yǔ)言生活,必須全面、深入了解語(yǔ)言生活的狀況,準(zhǔn)確把握語(yǔ)…

詞(語(yǔ)素)的結(jié)構(gòu)義,是指詞(語(yǔ)素)在特定的組合結(jié)構(gòu)(包括語(yǔ)義結(jié)構(gòu)與語(yǔ)法結(jié)構(gòu)、復(fù)合詞結(jié)構(gòu)與句法結(jié)構(gòu))中所顯示的意義。漢語(yǔ)詞的組合結(jié)構(gòu)(這里主要指復(fù)合詞結(jié)構(gòu))不僅可以保存詞(語(yǔ)素)的古(舊)義,還可以促成新義的衍生。人類(lèi)的語(yǔ)言,特別是語(yǔ)言的詞匯,隨著社會(huì)…

 

作者:蘇金智肖航

浙江大學(xué)學(xué)報(bào):人文社會(huì)科學(xué)版 2012年11期

  社會(huì)語(yǔ)言學(xué)研究之所以成為一門(mén)獨(dú)立的學(xué)科,不僅在語(yǔ)言觀方面與傳統(tǒng)結(jié)構(gòu)語(yǔ)言學(xué),尤其是轉(zhuǎn)換生成語(yǔ)法學(xué)派不同,在研究方法上也有較大的差別。關(guān)于語(yǔ)言觀上的不同,本文不加以討論,本文重點(diǎn)討論方法上的差別,尤其是語(yǔ)料庫(kù)方法對(duì)社會(huì)語(yǔ)言學(xué)研究的促進(jìn)作用!墩Z(yǔ)言學(xué)方法論》一書(shū)把語(yǔ)言學(xué)的研究方法分為上中下三篇,上篇為“理論方法篇”,中篇為“描寫(xiě)方法篇”,下篇為“實(shí)驗(yàn)方法篇”。社會(huì)語(yǔ)言學(xué)研究方法部分放在中篇“描寫(xiě)方法篇”,主要涉及社會(huì)語(yǔ)言學(xué)的抽樣方法、數(shù)據(jù)的收集、描寫(xiě)與分析[1]。社會(huì)語(yǔ)言學(xué)的研究方法主要是描寫(xiě)的還是解釋的,我們這里也暫且不加以討論。我們認(rèn)為從社會(huì)語(yǔ)言學(xué)角度對(duì)數(shù)據(jù)進(jìn)行分析描寫(xiě)是有必要的,但僅僅是分析描寫(xiě)遠(yuǎn)遠(yuǎn)不夠!渡鐣(huì)語(yǔ)言學(xué)研究方法的理論與實(shí)踐》一書(shū)把社會(huì)語(yǔ)言學(xué)研究方法的特征概括為三個(gè):定性與定量研究結(jié)合、解釋性、實(shí)證性。該書(shū)的這一概括還是比較全面的,但在解釋“語(yǔ)料或數(shù)據(jù)”時(shí),認(rèn)為定性研究所收集的數(shù)據(jù)主要是詞語(yǔ)而不是數(shù)字,定量研究所收集的數(shù)據(jù)主要是數(shù)字[2]。這種解釋似乎不夠全面,利用語(yǔ)料庫(kù)進(jìn)行社會(huì)語(yǔ)言學(xué)研究,收集的數(shù)據(jù)既需要詞語(yǔ),也需要數(shù)字。該書(shū)還沒(méi)有把語(yǔ)料庫(kù)方法作為社會(huì)語(yǔ)言學(xué)的一種重要方法,沒(méi)有看到語(yǔ)料庫(kù)對(duì)社會(huì)語(yǔ)言學(xué)研究的重要作用。《社會(huì)語(yǔ)言學(xué)教程》第六章設(shè)專(zhuān)章討論語(yǔ)料庫(kù)與社會(huì)語(yǔ)言學(xué)研究,認(rèn)為語(yǔ)料庫(kù)語(yǔ)言學(xué)為社會(huì)語(yǔ)言學(xué)帶來(lái)嶄新的研究工具[3]131。我們認(rèn)為,隨著現(xiàn)代信息技術(shù)的不斷發(fā)展,利用語(yǔ)料庫(kù)方法研究社會(huì)語(yǔ)言學(xué)將會(huì)是一種定量研究與定性研究完美結(jié)合的社會(huì)語(yǔ)言學(xué)研究的重要方法。

 

  二、基于語(yǔ)料庫(kù)方法的社會(huì)語(yǔ)言學(xué)研究現(xiàn)狀

 

  社會(huì)語(yǔ)言學(xué)研究在方法上的最大特點(diǎn)是在對(duì)言語(yǔ)社區(qū)語(yǔ)言使用進(jìn)行定量和定性分析的基礎(chǔ)上,揭示語(yǔ)言變量與社會(huì)變量之間的關(guān)系。早期的社會(huì)語(yǔ)言學(xué)研究更多的是注重口語(yǔ)的研究,因?yàn)榭谡Z(yǔ)的研究比較容易同言語(yǔ)社區(qū)結(jié)合起來(lái),從而探討語(yǔ)言變異與民族、年齡、社會(huì)階層、性別等社會(huì)變量之間的關(guān)系。而這類(lèi)研究一般要進(jìn)行社會(huì)調(diào)查,調(diào)查一般采用的是抽樣的方法,主要是判斷抽樣的方法。早期書(shū)面語(yǔ)的研究一般采用文獻(xiàn)調(diào)查的方法,因?yàn)槿狈ο冗M(jìn)的手段,在語(yǔ)言變異研究方面很難有較大的突破并取得重大的成果。語(yǔ)料庫(kù)語(yǔ)言學(xué)的出現(xiàn)不但給社會(huì)語(yǔ)言學(xué)研究書(shū)面語(yǔ)帶來(lái)了生機(jī),同時(shí)也大大推動(dòng)了這一領(lǐng)域的定性與定量有機(jī)結(jié)合的分析研究。

 

  McEnery和Wilson的《語(yǔ)料庫(kù)語(yǔ)言學(xué)》(Corpus Linguistics)一書(shū)第4章第7小節(jié)“語(yǔ)料庫(kù)在語(yǔ)言研究中的應(yīng)用”專(zhuān)門(mén)介紹了語(yǔ)料庫(kù)對(duì)社會(huì)語(yǔ)言學(xué)研究方法的影響。作者在探討一般意義上的社會(huì)語(yǔ)言研究所收集的語(yǔ)料與語(yǔ)料庫(kù)的語(yǔ)料之間的區(qū)別時(shí)指出,社會(huì)語(yǔ)言學(xué)研究所收集的是專(zhuān)門(mén)性的語(yǔ)料,而不是一般的來(lái)自自然語(yǔ)言的語(yǔ)料,這些語(yǔ)料不一定是用來(lái)作定量分析用的,因此不一定經(jīng)過(guò)嚴(yán)格的抽樣;而語(yǔ)料庫(kù)卻可以提供來(lái)自自然語(yǔ)言的具有代表性的樣本,且可以用來(lái)作定量分析。當(dāng)然該書(shū)作者也指出,利用語(yǔ)料庫(kù)方法進(jìn)行社會(huì)語(yǔ)言學(xué)研究還只停留在相對(duì)比較簡(jiǎn)單的詞匯層面上的語(yǔ)言與性別方面的研究[4]。

 

  到目前為止,利用語(yǔ)料庫(kù)方法進(jìn)行社會(huì)語(yǔ)言學(xué)研究取得重要成果并值得關(guān)注的主要有四個(gè)方面:一是語(yǔ)言與性別的研究,二是漢語(yǔ)社區(qū)詞的研究,三是語(yǔ)域研究,四是話(huà)語(yǔ)分析方面的研究。

 

  Kjellmer[5]和Holmes[6]利用語(yǔ)料庫(kù)方法進(jìn)行語(yǔ)言與性別研究取得了一些重要成果。Kjellmer利用Brown語(yǔ)料庫(kù)和LOB語(yǔ)料庫(kù)檢驗(yàn)美國(guó)英語(yǔ)和英國(guó)英語(yǔ)中的男性偏愛(ài)。他專(zhuān)門(mén)檢索了男性代詞與女性代詞(he和she)的出現(xiàn)情況以及詞項(xiàng)man/men與woman/women的出現(xiàn)情況,結(jié)果發(fā)現(xiàn)在兩個(gè)語(yǔ)料庫(kù)中女性詞項(xiàng)出現(xiàn)頻率均大大低于男性詞項(xiàng)的出現(xiàn)頻率,但英國(guó)英語(yǔ)的女性詞項(xiàng)出現(xiàn)頻率高于美國(guó)英語(yǔ)。他還發(fā)現(xiàn)這種差異的比率是由體裁決定的,總的來(lái)說(shuō),女性更富于想象,愛(ài)情小說(shuō)中女性出現(xiàn)的頻率最高。Kjellmer還發(fā)現(xiàn),女性相對(duì)缺少主動(dòng)性,但經(jīng)常出現(xiàn)客觀動(dòng)詞而不是主觀動(dòng)詞的假定是沒(méi)有根據(jù)的,實(shí)際上男女都有類(lèi)似的主客觀比率。Holmes對(duì)比了Ms與Miss/Mrs的出現(xiàn)頻率,分析了帶有男權(quán)主義色彩的后綴和作為普通類(lèi)別詞語(yǔ)man的用法。Holmes在方法上有兩個(gè)重要看法值得注意:一是要注意語(yǔ)境和是否有合適的替代成分,如policeman或policewomen可以用police officer代替,但在Duchess of York(約克的公爵夫人)中后綴-ess沒(méi)有合適的替代成分,因此這類(lèi)后綴在計(jì)算男權(quán)主義的后綴時(shí)不應(yīng)該算進(jìn)去。二是指出語(yǔ)義形式的分類(lèi)很難。例如man什么時(shí)候指男性,什么時(shí)候作為普通的類(lèi)(不分性別),判別起來(lái)并不容易。

 

  鄒嘉彥等利用香港城市大學(xué)語(yǔ)言科學(xué)資訊研究中心在20世紀(jì)90年代建立起來(lái)的共時(shí)語(yǔ)料庫(kù)(Linguistic Variety in Chinese Communities,LIVAC)的基礎(chǔ)上,進(jìn)行了中文五地(香港、澳門(mén)、上海、臺(tái)灣和新加坡)社區(qū)詞的研究,取得了一批令人矚目的成果。該語(yǔ)料庫(kù)不僅可以從共時(shí)平面進(jìn)行語(yǔ)言變異的研究,也可以從歷時(shí)的角度進(jìn)行語(yǔ)言變化的研究。《社會(huì)語(yǔ)言學(xué)教程》第六章“基于語(yǔ)料庫(kù)的社會(huì)語(yǔ)言學(xué)研究”專(zhuān)門(mén)討論如何利用語(yǔ)料庫(kù)進(jìn)行社會(huì)語(yǔ)言學(xué)研究。該章利用這一共時(shí)語(yǔ)料庫(kù)從共時(shí)角度比較了各地中文詞匯使用的不同情況,分析了新詞的發(fā)展變化,并從港澳報(bào)刊地名詞的演變觀察社會(huì)的變化,開(kāi)拓了我國(guó)社會(huì)語(yǔ)言學(xué)變異研究的新路子[3]。

 

  黃昌寧等認(rèn)為,語(yǔ)料庫(kù)方法是解決不同語(yǔ)域的語(yǔ)言特性描寫(xiě)問(wèn)題的最好方法,并且介紹了Biber進(jìn)行口語(yǔ)和書(shū)面語(yǔ)兩種不同語(yǔ)域變體的研究[7]。語(yǔ)域(register)是社會(huì)語(yǔ)言學(xué)的一個(gè)重要概念,陳瑞端把這個(gè)英文詞翻譯成“語(yǔ)體”,并對(duì)大陸、香港和臺(tái)灣三地的科學(xué)語(yǔ)體、事務(wù)語(yǔ)體和報(bào)道語(yǔ)體的許多語(yǔ)言成分進(jìn)行了定量分析①。這些研究是社會(huì)語(yǔ)言學(xué)利用語(yǔ)料庫(kù)方法在語(yǔ)域研究方面的開(kāi)拓性研究,為我們積累了經(jīng)驗(yàn)。

 

  桂詩(shī)春等介紹了話(huà)語(yǔ)分析研究中的語(yǔ)料庫(kù)方法[1]。Hope把語(yǔ)料庫(kù)方法與社會(huì)語(yǔ)言學(xué)的研究結(jié)合起來(lái)研究一些莎士比亞有爭(zhēng)議的劇作者的歸屬問(wèn)題。Hope通過(guò)第二人稱(chēng)代詞和助動(dòng)詞的使用,觀察作家的出生年份和使用規(guī)則化句子的關(guān)系來(lái)判定作品的歸屬[8]。Sotillo和Wang-Gempp的《運(yùn)用語(yǔ)料庫(kù)語(yǔ)言學(xué)的方法探討網(wǎng)絡(luò)政治話(huà)題討論中的階級(jí)、意識(shí)形態(tài)、說(shuō)話(huà)跑題》,對(duì)一個(gè)有46300個(gè)詞的語(yǔ)料庫(kù)的稱(chēng)呼語(yǔ)、夸張用法、詞匯選擇、詞語(yǔ)搭配、認(rèn)知?jiǎng)釉~和人稱(chēng)代詞的使用情況進(jìn)行了分析,其語(yǔ)料來(lái)自美國(guó)北新澤西五個(gè)城鎮(zhèn)居民有關(guān)政治話(huà)題的在線討論。該研究發(fā)現(xiàn),詞匯選擇(lexical choices)和負(fù)面的語(yǔ)義韻律(negative semantic prosody)可用于破壞候選人的形象,第一人稱(chēng)和第二人稱(chēng)單數(shù)代詞比第一人稱(chēng)和第三人稱(chēng)復(fù)數(shù)代詞出現(xiàn)的頻率高。參與者用第二人稱(chēng)代詞完成以下四個(gè)語(yǔ)用功能:勸說(shuō)有可能投票的人;告誡某一候選人不要出現(xiàn);排除不同政見(jiàn);在更廣泛的意義上與網(wǎng)民交流[9]。我國(guó)學(xué)者也重視利用語(yǔ)料庫(kù)的方法進(jìn)行話(huà)語(yǔ)分析研究,馬博森在《當(dāng)代中國(guó)話(huà)語(yǔ)語(yǔ)料庫(kù)的建構(gòu)問(wèn)題》一文中認(rèn)為運(yùn)用語(yǔ)料庫(kù)語(yǔ)料及語(yǔ)料庫(kù)分析方法研究不同類(lèi)型的話(huà)語(yǔ),可以幫助人們進(jìn)一步認(rèn)識(shí)語(yǔ)言與社會(huì)之間的關(guān)系。他還提出了建構(gòu)當(dāng)代話(huà)語(yǔ)語(yǔ)料庫(kù)的基本設(shè)想及總體框架。其總體框架是分別建書(shū)面語(yǔ)語(yǔ)料庫(kù)和口語(yǔ)語(yǔ)料庫(kù)。書(shū)面語(yǔ)又根據(jù)語(yǔ)域和體裁建子語(yǔ)料庫(kù),口語(yǔ)分社會(huì)話(huà)語(yǔ)和家庭話(huà)語(yǔ)兩大類(lèi)建庫(kù)[10]。

 

  回顧過(guò)去的研究,其重點(diǎn)主要集中在詞匯層面上,語(yǔ)法方面和話(huà)語(yǔ)方面雖然也出現(xiàn)了一些成果,但從總體上看還不能與詞匯研究相比,這與語(yǔ)料庫(kù)的設(shè)計(jì)和建設(shè)有直接關(guān)系,因此,利用語(yǔ)料庫(kù)方法進(jìn)行社會(huì)語(yǔ)言學(xué)研究還有許多開(kāi)拓空間。

 

  三、利用語(yǔ)料庫(kù)檢驗(yàn)漢語(yǔ)外來(lái)詞變化的例子

 

  蘇金智對(duì)劉正埮等編的《漢語(yǔ)外來(lái)詞詞典》[11]中漢語(yǔ)外來(lái)詞的消長(zhǎng)進(jìn)行了研究,判斷其中約占詞典1%的134個(gè)音譯詞基本上被漢語(yǔ)固有詞語(yǔ)所取代[12]。這篇文章立論時(shí)只是將是否收入《現(xiàn)代漢語(yǔ)詞典》作為標(biāo)準(zhǔn),沒(méi)有語(yǔ)料庫(kù)的支持,F(xiàn)在我們通過(guò)國(guó)家語(yǔ)委現(xiàn)代漢語(yǔ)語(yǔ)料庫(kù)的查詢(xún)系統(tǒng)②對(duì)134個(gè)音譯詞逐個(gè)進(jìn)行查詢(xún),看看這些詞語(yǔ)的出現(xiàn)情況,以證明這一判斷是否正確。國(guó)家語(yǔ)委現(xiàn)代漢語(yǔ)語(yǔ)料庫(kù)是一個(gè)大型的國(guó)家級(jí)的平衡語(yǔ)料庫(kù),包含1億字生語(yǔ)料庫(kù)、5500萬(wàn)字標(biāo)注語(yǔ)料庫(kù)、100萬(wàn)字句法樹(shù)庫(kù)、語(yǔ)料庫(kù)建設(shè)加工系列軟件和語(yǔ)料庫(kù)查詢(xún)檢索系統(tǒng)[13]。語(yǔ)料庫(kù)選材時(shí)間跨度為1919至2003年,1997年以前約7000萬(wàn)字,1997年以后約3000萬(wàn)字。

 

  通過(guò)該檢索系統(tǒng)對(duì)這134個(gè)漢語(yǔ)音譯詞的出現(xiàn)情況逐一進(jìn)行搜索,其中只有15個(gè)詞能統(tǒng)計(jì)到詞頻,如表1所示,其余119個(gè)詞未統(tǒng)計(jì)到詞頻。

 

  

語(yǔ)料庫(kù)與社會(huì)語(yǔ)言學(xué)研究方法 投稿:賴(lài)涾涿 www.wenku1.com

 

  經(jīng)原文核對(duì),上面15個(gè)音譯詞中只有12個(gè)完全對(duì)應(yīng)于外語(yǔ)原形詞在語(yǔ)料庫(kù)中出現(xiàn),它們是:“安那其(琪)”、“安琪兒”、“白脫(油)”、“德律(利)風(fēng)”、“德謨克拉西”、“費(fèi)厄潑賴(lài)”、“回絲”、“膠姆糖”、“萊塞”、“密斯”、“賽因斯”、“水門(mén)汀”。其他3個(gè)詞雖然出現(xiàn),但 語(yǔ)料庫(kù)中的例子顯示與《漢語(yǔ)外來(lái)詞詞典》所對(duì)應(yīng)的原形詞無(wú)關(guān),而是對(duì)應(yīng)于其他外語(yǔ)原形詞。如“喀斯特”出現(xiàn)17次,全部是地質(zhì)用語(yǔ)(這個(gè)用法已經(jīng)收入中國(guó)社會(huì)科學(xué)院語(yǔ)言研究所編的《現(xiàn)代漢語(yǔ)詞典》),即Karst的音譯,與《漢語(yǔ)外來(lái)詞詞典》所列的義項(xiàng)“種姓制度”無(wú)關(guān);“摩托”一詞出現(xiàn)18次,是摩托車(chē)的意思,與發(fā)動(dòng)機(jī)無(wú)關(guān);“馬克”出現(xiàn)54次,44次作為貨幣名稱(chēng)出現(xiàn),10次作為人名出現(xiàn),與“邊界”和“邊境”無(wú)關(guān)。

 

  為了方便討論,我們把這12個(gè)音譯詞的出現(xiàn)情況在表2中列出。

 

  

語(yǔ)料庫(kù)與社會(huì)語(yǔ)言學(xué)研究方法 投稿:賴(lài)涾涿 www.wenku1.com

 

  從表2可以看出,“安那其(琪)”、“水門(mén)汀”兩詞都只出現(xiàn)在20世紀(jì)30年代;“德律(利)風(fēng)”、“萊塞”、“德謨克拉西”、“賽因斯”等4個(gè)詞作為歷史詞提及;“費(fèi)厄潑賴(lài)”出現(xiàn)7例,6例實(shí)際上也是作為歷史詞提及,只有1例是在實(shí)際的語(yǔ)言環(huán)境中使用。另外,1980年以后實(shí)際語(yǔ)言環(huán)境中使用的外來(lái)詞是“安琪兒”、“白脫(油)”、“回絲”、“膠姆糖”和“密斯”等5個(gè)詞。從下面表3中5個(gè)詞相對(duì)應(yīng)的漢語(yǔ)固有詞與音譯詞出現(xiàn)的頻率的對(duì)比中可以發(fā)現(xiàn),固有詞出現(xiàn)的頻率均大大多于音譯詞。這里需要說(shuō)明的是,膠姆糖本來(lái)是英文chewing gum的半音譯詞,漢語(yǔ)固有詞是口香糖,但實(shí)際使用中這個(gè)詞也包括了泡泡糖,所以?xún)烧叨加?jì)算在內(nèi)。

 

  

語(yǔ)料庫(kù)與社會(huì)語(yǔ)言學(xué)研究方法 投稿:賴(lài)涾涿 www.wenku1.com

 

  在134個(gè)音譯詞中,除了上面分析的15詞外,還有119個(gè)沒(méi)有統(tǒng)計(jì)到詞頻,沒(méi)有統(tǒng)計(jì)到詞頻的詞占絕大多數(shù)。由此可以證明,《語(yǔ)言接觸與語(yǔ)言借用——漢語(yǔ)借詞消長(zhǎng)研究》一文中所分析的134個(gè)音譯詞被漢語(yǔ)固有詞代替的結(jié)論基本上符合現(xiàn)代漢語(yǔ)的語(yǔ)料實(shí)際。

 

  通過(guò)利用語(yǔ)料庫(kù)檢驗(yàn)漢語(yǔ)外來(lái)詞變化的例子可以看到,語(yǔ)料庫(kù)能夠在社會(huì)語(yǔ)言學(xué)研究中起到重要作用,但同時(shí)我們也看到了上述語(yǔ)料庫(kù)所存在的局限。這個(gè)局限主要體現(xiàn)在兩個(gè)方面,一是語(yǔ)料庫(kù)歷時(shí)分布的均衡性不足,二是音譯詞沒(méi)有得到有效的標(biāo)注。下文將進(jìn)行比較詳細(xì)的討論。

 

  四、社會(huì)語(yǔ)言學(xué)研究需要什么樣的語(yǔ)料庫(kù)?

 

  利用語(yǔ)料庫(kù)和語(yǔ)料庫(kù)方法進(jìn)行社會(huì)語(yǔ)言學(xué)研究需要注意兩方面的問(wèn)題:一是語(yǔ)料庫(kù)的作用是什么,如何建設(shè)一個(gè)好的語(yǔ)料庫(kù);二是社會(huì)語(yǔ)言學(xué)研究需要什么樣的語(yǔ)料庫(kù)。

 

  語(yǔ)料庫(kù)的通常定義是語(yǔ)言研究收集的、用電子形式保存的語(yǔ)言材料,由自然出現(xiàn)的書(shū)面語(yǔ)或口語(yǔ)的樣本匯集而成,用來(lái)代表特定的語(yǔ)言或語(yǔ)言變體。經(jīng)過(guò)科學(xué)選材和標(biāo)注、具有適當(dāng)規(guī)模的語(yǔ)料庫(kù)能夠反映和記錄語(yǔ)言的實(shí)際使用情況。人們可以通過(guò)語(yǔ)料庫(kù)觀察和把握語(yǔ)言事實(shí),分析和研究語(yǔ)言系統(tǒng)的規(guī)律。語(yǔ)料庫(kù)語(yǔ)言學(xué)通常被認(rèn)為不屬于語(yǔ)言本身某個(gè)側(cè)面的研究,而是一種以現(xiàn)實(shí)生活中人們運(yùn)用語(yǔ)言的實(shí)例為基礎(chǔ)進(jìn)行語(yǔ)言研究的方法,以語(yǔ)料庫(kù)為語(yǔ)言描述的起點(diǎn),用語(yǔ)料來(lái)驗(yàn)證有關(guān)語(yǔ)言假說(shuō)。它為語(yǔ)言研究提供了一種方法論基礎(chǔ),同時(shí)又給語(yǔ)言學(xué)研究提供了新的思路,所以它是介于理論和方法論之間的一種研究[14]。語(yǔ)料庫(kù)語(yǔ)言學(xué)是語(yǔ)言研究與相應(yīng)的計(jì)算機(jī)技術(shù)相伴相生的產(chǎn)物,是語(yǔ)言研究中定量和定性方法相結(jié)合的典范。相對(duì)傳統(tǒng)語(yǔ)言學(xué),語(yǔ)料庫(kù)語(yǔ)言學(xué)不僅研究哪些詞語(yǔ)、結(jié)構(gòu)和使用是可能出現(xiàn)的,而且還要統(tǒng)計(jì)其出現(xiàn)的概率和方式。

 

  語(yǔ)料庫(kù)設(shè)計(jì)和開(kāi)發(fā)最主要的出發(fā)點(diǎn)是使在其基礎(chǔ)上開(kāi)展的語(yǔ)言調(diào)查是合理、可靠的。Kennedy指出,語(yǔ)料庫(kù)設(shè)計(jì)所面臨的最基本的問(wèn)題是語(yǔ)料庫(kù)所采集的語(yǔ)言數(shù)據(jù)是否能真正代表某種期望的語(yǔ)言或語(yǔ)體[15]。McEnery和Wilson認(rèn)為,語(yǔ)料庫(kù)并不是語(yǔ)篇的簡(jiǎn)單堆砌,它應(yīng)具有樣本廣泛、規(guī)模有限、機(jī)器可讀等基本特征[4]。

 

  語(yǔ)料庫(kù)的代表性和平衡性是語(yǔ)料庫(kù)建設(shè)的基本要求。作為對(duì)語(yǔ)言的抽樣,語(yǔ)料的代表性是語(yǔ)料庫(kù)數(shù)據(jù)合理性和可靠性的保證。Leech認(rèn)為,一個(gè)語(yǔ)料庫(kù)具有代表性是指從該語(yǔ)料庫(kù)獲得的分析結(jié)果可以概括成為這種語(yǔ)言整體或其指定部分的特性[16]。所有語(yǔ)料庫(kù)建設(shè)者都力圖使其創(chuàng)建的語(yǔ)料庫(kù)足以代表或反映其所要研究的目標(biāo)語(yǔ)域或整個(gè)語(yǔ)言的語(yǔ)言事實(shí),因此在創(chuàng)建初期都會(huì)對(duì)語(yǔ)料庫(kù)的設(shè)計(jì)、取樣進(jìn)行科學(xué)的分析[17]。但有一點(diǎn)我們必須認(rèn)識(shí)到,無(wú)論如何也無(wú)法窮盡“某種語(yǔ)言的全體使用者說(shuō)出來(lái)(或?qū)懴聛?lái))的和尚未說(shuō)出來(lái)(或?qū)懴聛?lái))的所有話(huà)語(yǔ)”,因?yàn)樗且粋(gè)開(kāi)放集,理論上是無(wú)法真正捕獲到這些語(yǔ)言全貌的。因而為了盡可能地(至少在統(tǒng)計(jì)上)反映語(yǔ)言的實(shí)際狀況,對(duì)語(yǔ)言進(jìn)行抽樣的方法在一定程度上可以滿(mǎn)足研究的需要,與“抽樣”緊密關(guān)聯(lián)的一個(gè)重要概念就是“代表性”問(wèn)題,也即所收集的語(yǔ)料是否可以在統(tǒng)計(jì)上代表各種類(lèi)型的真實(shí)話(huà)語(yǔ)。語(yǔ)料平衡性不能簡(jiǎn)單理解為文本的不同來(lái)源。實(shí)際上,不同來(lái)源語(yǔ)料的使用、發(fā)行和讀者數(shù)都不一樣。Sinclair提出,至少應(yīng)該區(qū)分小說(shuō)/非小說(shuō)、圖書(shū)/期刊/報(bào)紙、正式/非正式出版物、作者屬性等[18]。然而,由于語(yǔ)言自身的高度復(fù)雜性,關(guān)于語(yǔ)料的代表性和平衡性還沒(méi)有找到能為大家普遍接受的答案。

 

  語(yǔ)料庫(kù)規(guī)模也是建設(shè)語(yǔ)料庫(kù)需要考慮的一個(gè)重要問(wèn)題。多大的語(yǔ)料庫(kù)才夠用是伴隨語(yǔ)料庫(kù)作為一種研究方法產(chǎn)生的,也是最難回答的問(wèn)題。一般就語(yǔ)言研究而言,例如研究詞匯和詞典編撰,或者比較各種文本的語(yǔ)言結(jié)構(gòu),語(yǔ)料庫(kù)越大越好。但鑒于語(yǔ)句的無(wú)限性及語(yǔ)言的不斷變化,語(yǔ)料是不能窮盡的,代表性也是相對(duì)而言的。因此,從量化研究的需要出發(fā),語(yǔ)料的規(guī)模應(yīng)是有限的。

 

  語(yǔ)料庫(kù)的標(biāo)注加工是語(yǔ)料庫(kù)能否發(fā)揮作用最重要的一環(huán)。一個(gè)語(yǔ)料庫(kù)的功能主要與三個(gè)因素有關(guān):一是語(yǔ)料庫(kù)的規(guī)模,二是語(yǔ)料的分布,三是語(yǔ)料的加工程度。規(guī)模的大小關(guān)系到統(tǒng)計(jì)數(shù)據(jù)是否可靠,語(yǔ)料的分布涉及統(tǒng)計(jì)結(jié)果的適用范圍,語(yǔ)料加工的深度則決定這個(gè)語(yǔ)料庫(kù)能為使用者提供什么樣的語(yǔ)言學(xué)信息。為了從語(yǔ)料庫(kù)中抽取信息,必須首先從多個(gè)層面對(duì)語(yǔ)料庫(kù)進(jìn)行分析,并且將分析結(jié)果標(biāo)注到語(yǔ)料庫(kù)上去,這個(gè)過(guò)程就是語(yǔ)料庫(kù)標(biāo)注。語(yǔ)料庫(kù)標(biāo)注是指給口語(yǔ)或書(shū)面語(yǔ)語(yǔ)料庫(kù)增添解釋的(interpretative)和語(yǔ)言的(linguistic)信息的實(shí)踐[16]。“標(biāo)注”也可以視為這個(gè)過(guò)程的最終產(chǎn)品,即附加、關(guān)聯(lián)或分散在語(yǔ)料中的語(yǔ)言標(biāo)記。語(yǔ)料庫(kù)標(biāo)注給語(yǔ)料庫(kù)帶來(lái)巨大的附加價(jià)值,是語(yǔ)料庫(kù)建設(shè)中最為關(guān)鍵的一環(huán)。Leech提出了英語(yǔ)語(yǔ)料庫(kù)已經(jīng)達(dá)到或可以達(dá)到的七個(gè)語(yǔ)言學(xué)標(biāo)注層級(jí),分別為拼寫(xiě)(orthographic)、語(yǔ)音(phonetic)、韻律(prosodic)、語(yǔ)法(grammatical)、句法(syntactic)、語(yǔ)義(semantic)和語(yǔ)用(pragmatics/discourse)[16]。

 

  大型語(yǔ)料庫(kù)的建立為各類(lèi)語(yǔ)言研究提供了大量的真實(shí)語(yǔ)料,也為各種語(yǔ)言成分的定量分析提供了條件。但由于語(yǔ)料庫(kù)的規(guī)模、分布和標(biāo)注等方面存在局限,數(shù)據(jù)稀疏的問(wèn)題還普遍存在。比如上文我們?cè)谟懻撘糇g詞時(shí),提到134個(gè)音譯詞中有119個(gè)詞查不到頻次,即查詢(xún)結(jié)果為0。這很可能主要是語(yǔ)料時(shí)間分布上不平衡出現(xiàn)的問(wèn)題。

 

  社會(huì)語(yǔ)言學(xué)研究對(duì)語(yǔ)料的代表性和平衡性有嚴(yán)格的要求,具有良好代表性、類(lèi)別多樣、時(shí)間分布平衡的語(yǔ)料庫(kù)對(duì)于社會(huì)語(yǔ)言學(xué)的語(yǔ)言變異的研究意義更大。目前語(yǔ)料庫(kù)的標(biāo)注還遠(yuǎn)遠(yuǎn)不能適應(yīng)社會(huì)語(yǔ)言學(xué)研究的要求,上面所說(shuō)的七個(gè)語(yǔ)言學(xué)標(biāo)注層級(jí)中,語(yǔ)用標(biāo)注對(duì)社會(huì)語(yǔ)言學(xué)研究的幫助最大,但已標(biāo)注語(yǔ)用信息的語(yǔ)料庫(kù)一般都是用于專(zhuān)題研究性質(zhì)的小型語(yǔ)料庫(kù),目前國(guó)內(nèi)外的大型語(yǔ)料庫(kù)大都缺少語(yǔ)用方面的標(biāo)注。社會(huì)語(yǔ)言研究需要的語(yǔ)料庫(kù)大致可從以下幾個(gè)方面考慮:

 

 。1)語(yǔ)料樣本具有廣泛性、代表性和平衡性;樣本分布既有共時(shí)意義也有歷時(shí)意義。所謂廣泛性,指語(yǔ)料庫(kù)收集的語(yǔ)料應(yīng)該涉及各種文體,涵蓋不同行業(yè)和不同地區(qū)的語(yǔ)言使用者。代表性、平衡性則是一般語(yǔ)料庫(kù)共有的要求。樣本分布具有共時(shí)意義可以用于共時(shí)的語(yǔ)言變異研究,具有歷時(shí)意義則可以用于歷時(shí)的語(yǔ)言變化研究。

 

 。2)語(yǔ)料樣本信息豐富完整,包含作者的民族、性別、年齡、出生地、母語(yǔ)等更多背景信息,其中部分信息需要通過(guò)標(biāo)注獲得。這些信息是社會(huì)語(yǔ)言學(xué)研究中重要的社會(huì)因素,是研究語(yǔ)言與社會(huì)共變的重要資料。

 

  (3)語(yǔ)料庫(kù)具有多層次、多方位的標(biāo)注。例如,在詞語(yǔ)標(biāo)注方面,不僅有詞性標(biāo)注,有些具有地域特點(diǎn)的詞語(yǔ)還應(yīng)該有地區(qū)來(lái)源的標(biāo)注。漢語(yǔ)里至少有四類(lèi)詞可以標(biāo)注來(lái)源:第一類(lèi)是方言詞,可以標(biāo)注出來(lái)自何地何種方言;第二類(lèi)是社區(qū)詞,可以標(biāo)注出來(lái)自大陸、臺(tái)灣、香港、澳門(mén)或其他華語(yǔ)社區(qū);第三類(lèi)是少數(shù)民族語(yǔ)言的借詞,可以標(biāo)注出來(lái)自何地何種少數(shù)民族語(yǔ)言;第四類(lèi)是外來(lái)詞,可以標(biāo)注出來(lái)自哪個(gè)國(guó)家哪種語(yǔ)言,最好還能夠標(biāo)注出外來(lái)詞的次類(lèi),如原形詞、字母詞、音譯詞、半音譯半意譯詞、意譯詞等等,外來(lái)詞如果有這樣的標(biāo)注,上面提到的沒(méi)有頻次的119個(gè)音譯詞的數(shù)量一定會(huì)大大減少。

 

  五、期待與希望

 

  近年來(lái),語(yǔ)料庫(kù)研究不斷取得新的進(jìn)展,相信在計(jì)算語(yǔ)言學(xué)界和社會(huì)語(yǔ)言學(xué)界的共同努力下,語(yǔ)料庫(kù)的建設(shè)會(huì)進(jìn)一步適應(yīng)社會(huì)語(yǔ)言學(xué)研究的需求,推動(dòng)社會(huì)語(yǔ)言學(xué)向定性研究和定量研究完美結(jié)合的方向發(fā)展。

 

  社會(huì)語(yǔ)言學(xué)研究方法不僅是描寫(xiě)性的,更重要的是解釋性的,解釋語(yǔ)言在社會(huì)中發(fā)生的變化。語(yǔ)料庫(kù)方法能夠?yàn)檎Z(yǔ)言變化的研究提供現(xiàn)代化的手段,可使這一領(lǐng)域的研究發(fā)生質(zhì)的變化。我們期待計(jì)算語(yǔ)言學(xué)家更多關(guān)注語(yǔ)言變化研究,關(guān)注社會(huì)語(yǔ)言學(xué)研究,為社會(huì)語(yǔ)言學(xué)研究提供更多的理論方法和技術(shù)支持。從漢語(yǔ)語(yǔ)料庫(kù)的建設(shè)和中國(guó)社會(huì)語(yǔ)言學(xué)研究的角度出發(fā),我們認(rèn)為以下三個(gè)問(wèn)題值得重視:

 

  一是現(xiàn)有的古代漢語(yǔ)語(yǔ)料庫(kù)和現(xiàn)代漢語(yǔ)語(yǔ)料庫(kù)應(yīng)該進(jìn)一步整合,建設(shè)成為可以進(jìn)行連續(xù)檢索、分析漢語(yǔ)歷時(shí)變化的重要語(yǔ)料庫(kù),使語(yǔ)料庫(kù)資源得到更便捷、更充分的利用。

 

  二是LIVAC語(yǔ)料庫(kù)在跟蹤研究現(xiàn)代漢語(yǔ)不同社區(qū)詞的共時(shí)變化上已經(jīng)發(fā)揮了重要作用,但應(yīng)該進(jìn)一步豐富檢索功能,讓更多的研究人員利用這一平臺(tái)。

 

  三是語(yǔ)料庫(kù)建設(shè)時(shí)應(yīng)該進(jìn)一步研究如何滿(mǎn)足社會(huì)語(yǔ)言學(xué)研究的需求,進(jìn)行社會(huì)語(yǔ)言學(xué)研究所需信息的標(biāo)注,以便深入開(kāi)發(fā)利用。

 

 、訇惾鸲恕度N漢語(yǔ)書(shū)面語(yǔ)體研究》,香港理工大學(xué)2000年博士學(xué)位論文。[Chan Shui Duen,"Linguistic Characterization of Three Written Chinese Registers," Ph.D Dissertation,the Hong Kong Polytechnic University,2000.]

 

 、谡Z(yǔ)料庫(kù)在線網(wǎng)站:。

 

作者介紹:蘇金智,男,教育部語(yǔ)言文字應(yīng)用研究所研究員,中國(guó)社會(huì)科學(xué)院研究生院教授,博士生導(dǎo)師,哲學(xué)博士,主要從事社會(huì)語(yǔ)言學(xué)研究;肖航,男,教育部語(yǔ)言文字應(yīng)用研究所副研究員,主要從事計(jì)算語(yǔ)言學(xué)和語(yǔ)料庫(kù)語(yǔ)言學(xué)研究(北京 100010)。

 

社會(huì)語(yǔ)言學(xué)研究之所以成為一門(mén)獨(dú)立的學(xué)科,不僅在語(yǔ)言觀方面與傳統(tǒng)結(jié)構(gòu)語(yǔ)言學(xué),尤其是轉(zhuǎn)換生成語(yǔ)法學(xué)派不同,在研究方法上也有較大的差別。關(guān)于語(yǔ)言觀上的不同,本文不加以討論,本文重點(diǎn)討論方法上的差別,尤其是語(yǔ)料庫(kù)方法對(duì)社會(huì)語(yǔ)言學(xué)研究的促進(jìn)作用。《語(yǔ)言學(xué)方法論…

社會(huì)語(yǔ)言學(xué)研究之所以成為一門(mén)獨(dú)立的學(xué)科,不僅在語(yǔ)言觀方面與傳統(tǒng)結(jié)構(gòu)語(yǔ)言學(xué),尤其是轉(zhuǎn)換生成語(yǔ)法學(xué)派不同,在研究方法上也有較大的差別。關(guān)于語(yǔ)言觀上的不同,本文不加以討論,本文重點(diǎn)討論方法上的差別,尤其是語(yǔ)料庫(kù)方法對(duì)社會(huì)語(yǔ)言學(xué)研究的促進(jìn)作用。《語(yǔ)言學(xué)方法論…

社會(huì)語(yǔ)言學(xué)研究之所以成為一門(mén)獨(dú)立的學(xué)科,不僅在語(yǔ)言觀方面與傳統(tǒng)結(jié)構(gòu)語(yǔ)言學(xué),尤其是轉(zhuǎn)換生成語(yǔ)法學(xué)派不同,在研究方法上也有較大的差別。關(guān)于語(yǔ)言觀上的不同,本文不加以討論,本文重點(diǎn)討論方法上的差別,,尤其是語(yǔ)料庫(kù)方法對(duì)社會(huì)語(yǔ)言學(xué)研究的促進(jìn)作用!墩Z(yǔ)言學(xué)方法論…

 

本文由第一文庫(kù)網(wǎng)()首發(fā),轉(zhuǎn)載請(qǐng)保留網(wǎng)址和出處!

>> 查看更多相關(guān)文檔

 

免費(fèi)下載文檔:

 


  本文關(guān)鍵詞:語(yǔ)料庫(kù)與社會(huì)語(yǔ)言學(xué)研究方法,由筆耕文化傳播整理發(fā)布。



本文編號(hào):171627

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/wenyilunwen/yuyanyishu/171627.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶(hù)0827f***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com
日韩欧美综合中文字幕| 亚洲国产成人久久一区二区三区 | 夫妻性生活一级黄色录像| 日韩精品一区二区一牛| 久久精品国产一区久久久| 成人欧美精品一区二区三区| 日本少妇中文字幕不卡视频| 在线亚洲成人中文字幕高清| 高潮少妇高潮久久精品99| 久久成人国产欧美精品一区二区| 不卡中文字幕在线视频| 日韩蜜桃一区二区三区| 美国女大兵激情豪放视频播放| 粉嫩国产一区二区三区在线| 好吊视频一区二区在线| 91香蕉视频精品在线看| 国产三级黄片在线免费看| 99久久精品国产麻豆| 熟女一区二区三区国产| 少妇被粗大进猛进出处故事| 国产激情国产精品久久源| 欧美日韩国产亚洲三级理论片 | 日韩精品在线观看一区| 免费观看日韩一级黄色大片| 初尝人妻少妇中文字幕在线| 国产又大又硬又粗又湿| 国产亚洲二区精品美女久久| 好吊视频一区二区在线| 欧美一级不卡视频在线观看| 欧美字幕一区二区三区| 色婷婷在线视频免费播放| 麻豆tv传媒在线观看| 一区二区三区亚洲天堂| 午夜精品一区免费视频| 色欧美一区二区三区在线| 成人精品日韩专区在线观看| 国产成人精品综合久久久看| 国产麻豆成人精品区在线观看| 大香伊蕉欧美一区二区三区| 熟女体下毛荫荫黑森林自拍| 精品久久综合日本欧美|