語料庫與社會語言學(xué)研究方法
本文關(guān)鍵詞:語料庫與社會語言學(xué)研究方法,由筆耕文化傳播整理發(fā)布。
語料庫與社會語言學(xué)研究方法 投稿:賴涾涿
社會語言學(xué)研究之所以成為一門獨立的學(xué)科,不僅在語言觀方面與傳統(tǒng)結(jié)構(gòu)語言學(xué),尤其是轉(zhuǎn)換生成語法學(xué)派不同,在研究方法上也有較大的差別。關(guān)于語言觀上的不同,本文不加以討論,本文重點討論方法上的差別,尤其是語料庫方法對社會語言學(xué)研究的促進作用!墩Z言學(xué)方法論…
中國現(xiàn)代化的進程起步于清晚期。在走向現(xiàn)代化的風(fēng)雨歷程中,中國語文現(xiàn)代化思潮疊浪而興,語文現(xiàn)代化運動接踵而起,形成了不同時期的語言規(guī)劃,促進語言生活逐漸現(xiàn)代化。政府的職責(zé)之一就是管理語言生活。管理好語言生活,必須全面、深入了解語言生活的狀況,準確把握語…
詞(語素)的結(jié)構(gòu)義,是指詞(語素)在特定的組合結(jié)構(gòu)(包括語義結(jié)構(gòu)與語法結(jié)構(gòu)、復(fù)合詞結(jié)構(gòu)與句法結(jié)構(gòu))中所顯示的意義。漢語詞的組合結(jié)構(gòu)(這里主要指復(fù)合詞結(jié)構(gòu))不僅可以保存詞(語素)的古(舊)義,還可以促成新義的衍生。人類的語言,特別是語言的詞匯,隨著社會…
作者:蘇金智肖航
浙江大學(xué)學(xué)報:人文社會科學(xué)版 2012年11期
社會語言學(xué)研究之所以成為一門獨立的學(xué)科,不僅在語言觀方面與傳統(tǒng)結(jié)構(gòu)語言學(xué),尤其是轉(zhuǎn)換生成語法學(xué)派不同,在研究方法上也有較大的差別。關(guān)于語言觀上的不同,本文不加以討論,本文重點討論方法上的差別,尤其是語料庫方法對社會語言學(xué)研究的促進作用!墩Z言學(xué)方法論》一書把語言學(xué)的研究方法分為上中下三篇,上篇為“理論方法篇”,中篇為“描寫方法篇”,下篇為“實驗方法篇”。社會語言學(xué)研究方法部分放在中篇“描寫方法篇”,主要涉及社會語言學(xué)的抽樣方法、數(shù)據(jù)的收集、描寫與分析[1]。社會語言學(xué)的研究方法主要是描寫的還是解釋的,我們這里也暫且不加以討論。我們認為從社會語言學(xué)角度對數(shù)據(jù)進行分析描寫是有必要的,但僅僅是分析描寫遠遠不夠。《社會語言學(xué)研究方法的理論與實踐》一書把社會語言學(xué)研究方法的特征概括為三個:定性與定量研究結(jié)合、解釋性、實證性。該書的這一概括還是比較全面的,但在解釋“語料或數(shù)據(jù)”時,認為定性研究所收集的數(shù)據(jù)主要是詞語而不是數(shù)字,定量研究所收集的數(shù)據(jù)主要是數(shù)字[2]。這種解釋似乎不夠全面,利用語料庫進行社會語言學(xué)研究,收集的數(shù)據(jù)既需要詞語,也需要數(shù)字。該書還沒有把語料庫方法作為社會語言學(xué)的一種重要方法,沒有看到語料庫對社會語言學(xué)研究的重要作用!渡鐣Z言學(xué)教程》第六章設(shè)專章討論語料庫與社會語言學(xué)研究,認為語料庫語言學(xué)為社會語言學(xué)帶來嶄新的研究工具[3]131。我們認為,隨著現(xiàn)代信息技術(shù)的不斷發(fā)展,利用語料庫方法研究社會語言學(xué)將會是一種定量研究與定性研究完美結(jié)合的社會語言學(xué)研究的重要方法。二、基于語料庫方法的社會語言學(xué)研究現(xiàn)狀
社會語言學(xué)研究在方法上的最大特點是在對言語社區(qū)語言使用進行定量和定性分析的基礎(chǔ)上,揭示語言變量與社會變量之間的關(guān)系。早期的社會語言學(xué)研究更多的是注重口語的研究,因為口語的研究比較容易同言語社區(qū)結(jié)合起來,從而探討語言變異與民族、年齡、社會階層、性別等社會變量之間的關(guān)系。而這類研究一般要進行社會調(diào)查,調(diào)查一般采用的是抽樣的方法,主要是判斷抽樣的方法。早期書面語的研究一般采用文獻調(diào)查的方法,因為缺乏先進的手段,在語言變異研究方面很難有較大的突破并取得重大的成果。語料庫語言學(xué)的出現(xiàn)不但給社會語言學(xué)研究書面語帶來了生機,同時也大大推動了這一領(lǐng)域的定性與定量有機結(jié)合的分析研究。
McEnery和Wilson的《語料庫語言學(xué)》(Corpus Linguistics)一書第4章第7小節(jié)“語料庫在語言研究中的應(yīng)用”專門介紹了語料庫對社會語言學(xué)研究方法的影響。作者在探討一般意義上的社會語言研究所收集的語料與語料庫的語料之間的區(qū)別時指出,社會語言學(xué)研究所收集的是專門性的語料,而不是一般的來自自然語言的語料,這些語料不一定是用來作定量分析用的,因此不一定經(jīng)過嚴格的抽樣;而語料庫卻可以提供來自自然語言的具有代表性的樣本,且可以用來作定量分析。當然該書作者也指出,利用語料庫方法進行社會語言學(xué)研究還只停留在相對比較簡單的詞匯層面上的語言與性別方面的研究[4]。
到目前為止,利用語料庫方法進行社會語言學(xué)研究取得重要成果并值得關(guān)注的主要有四個方面:一是語言與性別的研究,二是漢語社區(qū)詞的研究,三是語域研究,四是話語分析方面的研究。
Kjellmer[5]和Holmes[6]利用語料庫方法進行語言與性別研究取得了一些重要成果。Kjellmer利用Brown語料庫和LOB語料庫檢驗美國英語和英國英語中的男性偏愛。他專門檢索了男性代詞與女性代詞(he和she)的出現(xiàn)情況以及詞項man/men與woman/women的出現(xiàn)情況,結(jié)果發(fā)現(xiàn)在兩個語料庫中女性詞項出現(xiàn)頻率均大大低于男性詞項的出現(xiàn)頻率,但英國英語的女性詞項出現(xiàn)頻率高于美國英語。他還發(fā)現(xiàn)這種差異的比率是由體裁決定的,總的來說,女性更富于想象,愛情小說中女性出現(xiàn)的頻率最高。Kjellmer還發(fā)現(xiàn),女性相對缺少主動性,但經(jīng)常出現(xiàn)客觀動詞而不是主觀動詞的假定是沒有根據(jù)的,實際上男女都有類似的主客觀比率。Holmes對比了Ms與Miss/Mrs的出現(xiàn)頻率,分析了帶有男權(quán)主義色彩的后綴和作為普通類別詞語man的用法。Holmes在方法上有兩個重要看法值得注意:一是要注意語境和是否有合適的替代成分,如policeman或policewomen可以用police officer代替,但在Duchess of York(約克的公爵夫人)中后綴-ess沒有合適的替代成分,因此這類后綴在計算男權(quán)主義的后綴時不應(yīng)該算進去。二是指出語義形式的分類很難。例如man什么時候指男性,什么時候作為普通的類(不分性別),判別起來并不容易。
鄒嘉彥等利用香港城市大學(xué)語言科學(xué)資訊研究中心在20世紀90年代建立起來的共時語料庫(Linguistic Variety in Chinese Communities,LIVAC)的基礎(chǔ)上,進行了中文五地(香港、澳門、上海、臺灣和新加坡)社區(qū)詞的研究,取得了一批令人矚目的成果。該語料庫不僅可以從共時平面進行語言變異的研究,也可以從歷時的角度進行語言變化的研究。《社會語言學(xué)教程》第六章“基于語料庫的社會語言學(xué)研究”專門討論如何利用語料庫進行社會語言學(xué)研究。該章利用這一共時語料庫從共時角度比較了各地中文詞匯使用的不同情況,分析了新詞的發(fā)展變化,并從港澳報刊地名詞的演變觀察社會的變化,開拓了我國社會語言學(xué)變異研究的新路子[3]。
黃昌寧等認為,語料庫方法是解決不同語域的語言特性描寫問題的最好方法,并且介紹了Biber進行口語和書面語兩種不同語域變體的研究[7]。語域(register)是社會語言學(xué)的一個重要概念,陳瑞端把這個英文詞翻譯成“語體”,并對大陸、香港和臺灣三地的科學(xué)語體、事務(wù)語體和報道語體的許多語言成分進行了定量分析①。這些研究是社會語言學(xué)利用語料庫方法在語域研究方面的開拓性研究,為我們積累了經(jīng)驗。
桂詩春等介紹了話語分析研究中的語料庫方法[1]。Hope把語料庫方法與社會語言學(xué)的研究結(jié)合起來研究一些莎士比亞有爭議的劇作者的歸屬問題。Hope通過第二人稱代詞和助動詞的使用,觀察作家的出生年份和使用規(guī)則化句子的關(guān)系來判定作品的歸屬[8]。Sotillo和Wang-Gempp的《運用語料庫語言學(xué)的方法探討網(wǎng)絡(luò)政治話題討論中的階級、意識形態(tài)、說話跑題》,對一個有46300個詞的語料庫的稱呼語、夸張用法、詞匯選擇、詞語搭配、認知動詞和人稱代詞的使用情況進行了分析,其語料來自美國北新澤西五個城鎮(zhèn)居民有關(guān)政治話題的在線討論。該研究發(fā)現(xiàn),詞匯選擇(lexical choices)和負面的語義韻律(negative semantic prosody)可用于破壞候選人的形象,第一人稱和第二人稱單數(shù)代詞比第一人稱和第三人稱復(fù)數(shù)代詞出現(xiàn)的頻率高。參與者用第二人稱代詞完成以下四個語用功能:勸說有可能投票的人;告誡某一候選人不要出現(xiàn);排除不同政見;在更廣泛的意義上與網(wǎng)民交流[9]。我國學(xué)者也重視利用語料庫的方法進行話語分析研究,馬博森在《當代中國話語語料庫的建構(gòu)問題》一文中認為運用語料庫語料及語料庫分析方法研究不同類型的話語,可以幫助人們進一步認識語言與社會之間的關(guān)系。他還提出了建構(gòu)當代話語語料庫的基本設(shè)想及總體框架。其總體框架是分別建書面語語料庫和口語語料庫。書面語又根據(jù)語域和體裁建子語料庫,口語分社會話語和家庭話語兩大類建庫[10]。
回顧過去的研究,其重點主要集中在詞匯層面上,語法方面和話語方面雖然也出現(xiàn)了一些成果,但從總體上看還不能與詞匯研究相比,這與語料庫的設(shè)計和建設(shè)有直接關(guān)系,因此,利用語料庫方法進行社會語言學(xué)研究還有許多開拓空間。
三、利用語料庫檢驗漢語外來詞變化的例子
蘇金智對劉正埮等編的《漢語外來詞詞典》[11]中漢語外來詞的消長進行了研究,判斷其中約占詞典1%的134個音譯詞基本上被漢語固有詞語所取代[12]。這篇文章立論時只是將是否收入《現(xiàn)代漢語詞典》作為標準,沒有語料庫的支持,F(xiàn)在我們通過國家語委現(xiàn)代漢語語料庫的查詢系統(tǒng)②對134個音譯詞逐個進行查詢,看看這些詞語的出現(xiàn)情況,以證明這一判斷是否正確。國家語委現(xiàn)代漢語語料庫是一個大型的國家級的平衡語料庫,包含1億字生語料庫、5500萬字標注語料庫、100萬字句法樹庫、語料庫建設(shè)加工系列軟件和語料庫查詢檢索系統(tǒng)[13]。語料庫選材時間跨度為1919至2003年,1997年以前約7000萬字,1997年以后約3000萬字。
通過該檢索系統(tǒng)對這134個漢語音譯詞的出現(xiàn)情況逐一進行搜索,其中只有15個詞能統(tǒng)計到詞頻,如表1所示,其余119個詞未統(tǒng)計到詞頻。
經(jīng)原文核對,上面15個音譯詞中只有12個完全對應(yīng)于外語原形詞在語料庫中出現(xiàn),它們是:“安那其(琪)”、“安琪兒”、“白脫(油)”、“德律(利)風(fēng)”、“德謨克拉西”、“費厄潑賴”、“回絲”、“膠姆糖”、“萊塞”、“密斯”、“賽因斯”、“水門汀”。其他3個詞雖然出現(xiàn),但 語料庫中的例子顯示與《漢語外來詞詞典》所對應(yīng)的原形詞無關(guān),而是對應(yīng)于其他外語原形詞。如“喀斯特”出現(xiàn)17次,全部是地質(zhì)用語(這個用法已經(jīng)收入中國社會科學(xué)院語言研究所編的《現(xiàn)代漢語詞典》),即Karst的音譯,與《漢語外來詞詞典》所列的義項“種姓制度”無關(guān);“摩托”一詞出現(xiàn)18次,是摩托車的意思,與發(fā)動機無關(guān);“馬克”出現(xiàn)54次,44次作為貨幣名稱出現(xiàn),10次作為人名出現(xiàn),與“邊界”和“邊境”無關(guān)。
為了方便討論,我們把這12個音譯詞的出現(xiàn)情況在表2中列出。
從表2可以看出,“安那其(琪)”、“水門汀”兩詞都只出現(xiàn)在20世紀30年代;“德律(利)風(fēng)”、“萊塞”、“德謨克拉西”、“賽因斯”等4個詞作為歷史詞提及;“費厄潑賴”出現(xiàn)7例,6例實際上也是作為歷史詞提及,只有1例是在實際的語言環(huán)境中使用。另外,1980年以后實際語言環(huán)境中使用的外來詞是“安琪兒”、“白脫(油)”、“回絲”、“膠姆糖”和“密斯”等5個詞。從下面表3中5個詞相對應(yīng)的漢語固有詞與音譯詞出現(xiàn)的頻率的對比中可以發(fā)現(xiàn),固有詞出現(xiàn)的頻率均大大多于音譯詞。這里需要說明的是,膠姆糖本來是英文chewing gum的半音譯詞,漢語固有詞是口香糖,但實際使用中這個詞也包括了泡泡糖,所以兩者都計算在內(nèi)。
在134個音譯詞中,除了上面分析的15詞外,還有119個沒有統(tǒng)計到詞頻,沒有統(tǒng)計到詞頻的詞占絕大多數(shù)。由此可以證明,《語言接觸與語言借用——漢語借詞消長研究》一文中所分析的134個音譯詞被漢語固有詞代替的結(jié)論基本上符合現(xiàn)代漢語的語料實際。
通過利用語料庫檢驗漢語外來詞變化的例子可以看到,語料庫能夠在社會語言學(xué)研究中起到重要作用,但同時我們也看到了上述語料庫所存在的局限。這個局限主要體現(xiàn)在兩個方面,一是語料庫歷時分布的均衡性不足,二是音譯詞沒有得到有效的標注。下文將進行比較詳細的討論。
四、社會語言學(xué)研究需要什么樣的語料庫?
利用語料庫和語料庫方法進行社會語言學(xué)研究需要注意兩方面的問題:一是語料庫的作用是什么,如何建設(shè)一個好的語料庫;二是社會語言學(xué)研究需要什么樣的語料庫。
語料庫的通常定義是語言研究收集的、用電子形式保存的語言材料,由自然出現(xiàn)的書面語或口語的樣本匯集而成,用來代表特定的語言或語言變體。經(jīng)過科學(xué)選材和標注、具有適當規(guī)模的語料庫能夠反映和記錄語言的實際使用情況。人們可以通過語料庫觀察和把握語言事實,分析和研究語言系統(tǒng)的規(guī)律。語料庫語言學(xué)通常被認為不屬于語言本身某個側(cè)面的研究,而是一種以現(xiàn)實生活中人們運用語言的實例為基礎(chǔ)進行語言研究的方法,以語料庫為語言描述的起點,用語料來驗證有關(guān)語言假說。它為語言研究提供了一種方法論基礎(chǔ),同時又給語言學(xué)研究提供了新的思路,所以它是介于理論和方法論之間的一種研究[14]。語料庫語言學(xué)是語言研究與相應(yīng)的計算機技術(shù)相伴相生的產(chǎn)物,是語言研究中定量和定性方法相結(jié)合的典范。相對傳統(tǒng)語言學(xué),語料庫語言學(xué)不僅研究哪些詞語、結(jié)構(gòu)和使用是可能出現(xiàn)的,而且還要統(tǒng)計其出現(xiàn)的概率和方式。
語料庫設(shè)計和開發(fā)最主要的出發(fā)點是使在其基礎(chǔ)上開展的語言調(diào)查是合理、可靠的。Kennedy指出,語料庫設(shè)計所面臨的最基本的問題是語料庫所采集的語言數(shù)據(jù)是否能真正代表某種期望的語言或語體[15]。McEnery和Wilson認為,語料庫并不是語篇的簡單堆砌,它應(yīng)具有樣本廣泛、規(guī)模有限、機器可讀等基本特征[4]。
語料庫的代表性和平衡性是語料庫建設(shè)的基本要求。作為對語言的抽樣,語料的代表性是語料庫數(shù)據(jù)合理性和可靠性的保證。Leech認為,一個語料庫具有代表性是指從該語料庫獲得的分析結(jié)果可以概括成為這種語言整體或其指定部分的特性[16]。所有語料庫建設(shè)者都力圖使其創(chuàng)建的語料庫足以代表或反映其所要研究的目標語域或整個語言的語言事實,因此在創(chuàng)建初期都會對語料庫的設(shè)計、取樣進行科學(xué)的分析[17]。但有一點我們必須認識到,無論如何也無法窮盡“某種語言的全體使用者說出來(或?qū)懴聛恚┑暮蜕形凑f出來(或?qū)懴聛恚┑乃性捳Z”,因為它是一個開放集,理論上是無法真正捕獲到這些語言全貌的。因而為了盡可能地(至少在統(tǒng)計上)反映語言的實際狀況,對語言進行抽樣的方法在一定程度上可以滿足研究的需要,與“抽樣”緊密關(guān)聯(lián)的一個重要概念就是“代表性”問題,也即所收集的語料是否可以在統(tǒng)計上代表各種類型的真實話語。語料平衡性不能簡單理解為文本的不同來源。實際上,不同來源語料的使用、發(fā)行和讀者數(shù)都不一樣。Sinclair提出,至少應(yīng)該區(qū)分小說/非小說、圖書/期刊/報紙、正式/非正式出版物、作者屬性等[18]。然而,由于語言自身的高度復(fù)雜性,關(guān)于語料的代表性和平衡性還沒有找到能為大家普遍接受的答案。
語料庫規(guī)模也是建設(shè)語料庫需要考慮的一個重要問題。多大的語料庫才夠用是伴隨語料庫作為一種研究方法產(chǎn)生的,也是最難回答的問題。一般就語言研究而言,例如研究詞匯和詞典編撰,或者比較各種文本的語言結(jié)構(gòu),語料庫越大越好。但鑒于語句的無限性及語言的不斷變化,語料是不能窮盡的,代表性也是相對而言的。因此,從量化研究的需要出發(fā),語料的規(guī)模應(yīng)是有限的。
語料庫的標注加工是語料庫能否發(fā)揮作用最重要的一環(huán)。一個語料庫的功能主要與三個因素有關(guān):一是語料庫的規(guī)模,二是語料的分布,三是語料的加工程度。規(guī)模的大小關(guān)系到統(tǒng)計數(shù)據(jù)是否可靠,語料的分布涉及統(tǒng)計結(jié)果的適用范圍,語料加工的深度則決定這個語料庫能為使用者提供什么樣的語言學(xué)信息。為了從語料庫中抽取信息,必須首先從多個層面對語料庫進行分析,并且將分析結(jié)果標注到語料庫上去,這個過程就是語料庫標注。語料庫標注是指給口語或書面語語料庫增添解釋的(interpretative)和語言的(linguistic)信息的實踐[16]。“標注”也可以視為這個過程的最終產(chǎn)品,即附加、關(guān)聯(lián)或分散在語料中的語言標記。語料庫標注給語料庫帶來巨大的附加價值,是語料庫建設(shè)中最為關(guān)鍵的一環(huán)。Leech提出了英語語料庫已經(jīng)達到或可以達到的七個語言學(xué)標注層級,分別為拼寫(orthographic)、語音(phonetic)、韻律(prosodic)、語法(grammatical)、句法(syntactic)、語義(semantic)和語用(pragmatics/discourse)[16]。
大型語料庫的建立為各類語言研究提供了大量的真實語料,也為各種語言成分的定量分析提供了條件。但由于語料庫的規(guī)模、分布和標注等方面存在局限,數(shù)據(jù)稀疏的問題還普遍存在。比如上文我們在討論音譯詞時,提到134個音譯詞中有119個詞查不到頻次,即查詢結(jié)果為0。這很可能主要是語料時間分布上不平衡出現(xiàn)的問題。
社會語言學(xué)研究對語料的代表性和平衡性有嚴格的要求,具有良好代表性、類別多樣、時間分布平衡的語料庫對于社會語言學(xué)的語言變異的研究意義更大。目前語料庫的標注還遠遠不能適應(yīng)社會語言學(xué)研究的要求,上面所說的七個語言學(xué)標注層級中,語用標注對社會語言學(xué)研究的幫助最大,但已標注語用信息的語料庫一般都是用于專題研究性質(zhì)的小型語料庫,目前國內(nèi)外的大型語料庫大都缺少語用方面的標注。社會語言研究需要的語料庫大致可從以下幾個方面考慮:
。1)語料樣本具有廣泛性、代表性和平衡性;樣本分布既有共時意義也有歷時意義。所謂廣泛性,指語料庫收集的語料應(yīng)該涉及各種文體,涵蓋不同行業(yè)和不同地區(qū)的語言使用者。代表性、平衡性則是一般語料庫共有的要求。樣本分布具有共時意義可以用于共時的語言變異研究,具有歷時意義則可以用于歷時的語言變化研究。
。2)語料樣本信息豐富完整,包含作者的民族、性別、年齡、出生地、母語等更多背景信息,其中部分信息需要通過標注獲得。這些信息是社會語言學(xué)研究中重要的社會因素,是研究語言與社會共變的重要資料。
。3)語料庫具有多層次、多方位的標注。例如,在詞語標注方面,不僅有詞性標注,有些具有地域特點的詞語還應(yīng)該有地區(qū)來源的標注。漢語里至少有四類詞可以標注來源:第一類是方言詞,可以標注出來自何地何種方言;第二類是社區(qū)詞,可以標注出來自大陸、臺灣、香港、澳門或其他華語社區(qū);第三類是少數(shù)民族語言的借詞,可以標注出來自何地何種少數(shù)民族語言;第四類是外來詞,可以標注出來自哪個國家哪種語言,最好還能夠標注出外來詞的次類,如原形詞、字母詞、音譯詞、半音譯半意譯詞、意譯詞等等,外來詞如果有這樣的標注,上面提到的沒有頻次的119個音譯詞的數(shù)量一定會大大減少。
五、期待與希望
近年來,語料庫研究不斷取得新的進展,相信在計算語言學(xué)界和社會語言學(xué)界的共同努力下,語料庫的建設(shè)會進一步適應(yīng)社會語言學(xué)研究的需求,推動社會語言學(xué)向定性研究和定量研究完美結(jié)合的方向發(fā)展。
社會語言學(xué)研究方法不僅是描寫性的,更重要的是解釋性的,解釋語言在社會中發(fā)生的變化。語料庫方法能夠為語言變化的研究提供現(xiàn)代化的手段,可使這一領(lǐng)域的研究發(fā)生質(zhì)的變化。我們期待計算語言學(xué)家更多關(guān)注語言變化研究,關(guān)注社會語言學(xué)研究,為社會語言學(xué)研究提供更多的理論方法和技術(shù)支持。從漢語語料庫的建設(shè)和中國社會語言學(xué)研究的角度出發(fā),我們認為以下三個問題值得重視:
一是現(xiàn)有的古代漢語語料庫和現(xiàn)代漢語語料庫應(yīng)該進一步整合,建設(shè)成為可以進行連續(xù)檢索、分析漢語歷時變化的重要語料庫,使語料庫資源得到更便捷、更充分的利用。
二是LIVAC語料庫在跟蹤研究現(xiàn)代漢語不同社區(qū)詞的共時變化上已經(jīng)發(fā)揮了重要作用,但應(yīng)該進一步豐富檢索功能,讓更多的研究人員利用這一平臺。
三是語料庫建設(shè)時應(yīng)該進一步研究如何滿足社會語言學(xué)研究的需求,進行社會語言學(xué)研究所需信息的標注,以便深入開發(fā)利用。
①陳瑞端《三種漢語書面語體研究》,香港理工大學(xué)2000年博士學(xué)位論文。[Chan Shui Duen,"Linguistic Characterization of Three Written Chinese Registers," Ph.D Dissertation,the Hong Kong Polytechnic University,2000.]
、谡Z料庫在線網(wǎng)站:。
作者介紹:蘇金智,男,教育部語言文字應(yīng)用研究所研究員,中國社會科學(xué)院研究生院教授,博士生導(dǎo)師,哲學(xué)博士,主要從事社會語言學(xué)研究;肖航,男,教育部語言文字應(yīng)用研究所副研究員,主要從事計算語言學(xué)和語料庫語言學(xué)研究(北京 100010)。
社會語言學(xué)研究之所以成為一門獨立的學(xué)科,不僅在語言觀方面與傳統(tǒng)結(jié)構(gòu)語言學(xué),尤其是轉(zhuǎn)換生成語法學(xué)派不同,在研究方法上也有較大的差別。關(guān)于語言觀上的不同,本文不加以討論,本文重點討論方法上的差別,尤其是語料庫方法對社會語言學(xué)研究的促進作用!墩Z言學(xué)方法論…
社會語言學(xué)研究之所以成為一門獨立的學(xué)科,不僅在語言觀方面與傳統(tǒng)結(jié)構(gòu)語言學(xué),尤其是轉(zhuǎn)換生成語法學(xué)派不同,在研究方法上也有較大的差別。關(guān)于語言觀上的不同,本文不加以討論,本文重點討論方法上的差別,尤其是語料庫方法對社會語言學(xué)研究的促進作用!墩Z言學(xué)方法論…
社會語言學(xué)研究之所以成為一門獨立的學(xué)科,不僅在語言觀方面與傳統(tǒng)結(jié)構(gòu)語言學(xué),尤其是轉(zhuǎn)換生成語法學(xué)派不同,在研究方法上也有較大的差別。關(guān)于語言觀上的不同,本文不加以討論,本文重點討論方法上的差別,,尤其是語料庫方法對社會語言學(xué)研究的促進作用!墩Z言學(xué)方法論…
本文由第一文庫網(wǎng)()首發(fā),轉(zhuǎn)載請保留網(wǎng)址和出處!
>> 查看更多相關(guān)文檔
免費下載文檔:
本文關(guān)鍵詞:語料庫與社會語言學(xué)研究方法,由筆耕文化傳播整理發(fā)布。
本文編號:171627
本文鏈接:http://sikaile.net/wenyilunwen/yuyanyishu/171627.html