新型雙語旅游語料庫的研制和應(yīng)用
本文關(guān)鍵詞:新型雙語旅游語料庫的研制和應(yīng)用,由筆耕文化傳播整理發(fā)布。
2010 年 2 月 第 33 卷 第 1 期
現(xiàn)代外語 ( 季刊 )
Modern Foreign Languages (Quarterly )
February 2010 Vol.33 No.1
新型雙語旅游語料庫的研制和應(yīng)用*
香港理工大學(xué)
李德超 北京外
國語大學(xué) 王克非
提 要 :在 評 介 國 內(nèi) 外 現(xiàn) 有 單 語 或 雙 語 旅 游 專 門 語 料 庫 的 基 礎(chǔ) 上 ,本 文 著 重 論 述 香 港 理 工 大 學(xué) 正 在 研 制 的 一 種 新 型 中 英 雙 語 旅 游 語 料 庫 的 設(shè) 計(jì) 理 念 和 操 作 程 序 ,包 括 語 料 文 本 的 數(shù) 字 化 、語 料 的標(biāo)注 、 語料的對齊和語料的篇頭 標(biāo) 注 等 。 本 文 最 后 探 討 了 旅 游 語 料 庫 在 推 動 旅 游 翻 譯 研 究 與 教 學(xué)的前景 。 關(guān)鍵詞 : 雙語旅游語料庫 、 設(shè)計(jì)理念 、 旅游翻譯教學(xué)與研究 [ 中圖分類號 ] H313 [ 文獻(xiàn)標(biāo)識碼 ] A [ 文章編號 ] 1003-6105 (2010 )01-0046-09
1. 引言
過去 20 年來 , 基于語料庫的翻譯研究從 無到有 , 發(fā)展迅速 。 目前 , 翻譯研究中常用的 語 料 庫 主 要 有 譯 文 語 料 庫 (translational corpus )、 類比 語 料 庫 (comparable corpora ) 和 對應(yīng)語料庫 (parallel corpus ) 三種 。 譯文語料 庫收錄譯文 , 其研究旨在揭示翻譯語言本身 獨(dú)有特征 ( 如 Mona Baker 建立的 “ 翻譯英語 語料庫 ”, 即 TEC )。 類比語料庫主要是同一 種語言的原生文本和翻譯文本 ( 譯自某種外 語 ) 構(gòu)建的語料庫 , 它們之間無翻譯對應(yīng)關(guān) 系 , 但在時(shí)代 、 體裁 、 主題等方面具有可比性 , 可用來研究翻譯語言的特點(diǎn) 。 這類研究可參 看 Laviosa (2002 )。 相較以上兩種語料庫 , 翻譯研究中更為 常用的是對應(yīng)語料庫 , 它收錄原文與譯文雙 語對照的文本 , 通常會按事先設(shè)定的標(biāo)準(zhǔn) ( 如 以句或段為單位的方式 ), 對語料進(jìn)行某一語 言單位上的對齊 ( 如句或段 ), 以方便檢索 。 對 應(yīng)語料庫常用于考察原文中的某些語言現(xiàn)象 如何在譯文中得到反映 , 最終目的在于揭示 翻譯活動中隱性的規(guī)律 。 目前對應(yīng)語料庫在 不同的國家和地區(qū)都有廣泛應(yīng)用 , 比較知名 的有挪威的 “ 英語 - 挪威語對應(yīng)語料庫 ”、 英國 的 “ 德語 - 英語文學(xué)文本對應(yīng) 語 料 庫 ” 以 及 我
*
國由北京外國語大學(xué)中國外語教育研究中心 研制的 “ 通用漢英對應(yīng)語料庫 ”, 等等 。 縱觀目前為翻譯研究而建的上述三種語 料庫 , 多數(shù)以文學(xué)文本為主 , 或是以收納百科 文本 ( 包括各種文學(xué)與非文學(xué)作品 ) 為特色 , 而結(jié)合地域特點(diǎn)的或針對某一文類而專門研 制的雙語專門語料庫則較為少見 。 專門語料 庫指的是 “ 關(guān)于特定主題文本的集合 ”, 且這 些文本 “均由行內(nèi)專家為不同的讀者群所 寫 ”, 這些讀者群可能是同行的專家 , 或是缺 乏相關(guān)專業(yè)知識的大眾, 亦可能是學(xué)生等 (Kübler 2003 : 29 )。 雙語的專門語料庫則收 集包括原文與譯文的專題文本 。 迄今為止 , 專門為翻譯研究而研制的應(yīng) 用型雙語專門語料庫并不多 , 且通常規(guī)模較 小 , 從幾萬到幾十萬詞 。 小型的雙語專門語料 庫因其規(guī)模小 、 建造方便和針對性強(qiáng)等特點(diǎn) , 常在術(shù)語翻譯研究或特定領(lǐng)域 ( 如法律翻譯 、 財(cái)經(jīng)翻譯等等 ) 的譯員培訓(xùn)中作為輔助工具 , 如 Kübler (2003 ) 為 培 訓(xùn) 軟 件 指 南 譯 員 而 建 立的小型英法計(jì)算機(jī)語料庫 。 雙語專門語料庫無論對翻譯研究還是譯 員 培 訓(xùn) 都 有 其 潛 在 的 價(jià) 值 。 Johansson 早 在 1991 年就提出 , 雙語專門語料庫可以幫助我 們解決不少特定的問題 , 因而在各種語料庫 中 , 尤其值得提倡 。 從語言運(yùn)用角度而言 , 雙
本研究得到香港理工大學(xué)項(xiàng)目資助 , 編號為 1-ZV74 及 4-ZZ75 。 在此亦感謝匿名審稿人的寶貴意見 。
李德超
王克非
47
語專門語料庫 ( 尤其是非文學(xué)專門語料庫 ) 能 幫助譯者理解和掌握同一領(lǐng)域中不同語言的 常用術(shù)語 、 慣用表達(dá)式 、 文章語氣及典型的語 篇結(jié)構(gòu) , 避免在專業(yè)翻譯中經(jīng)常出現(xiàn)的語言 “ 不自然 ” 或 “ 形似而神不似 ” 的現(xiàn)象 。 但時(shí)至 今日 , 無論國內(nèi)國外 , 較具規(guī)模的雙語專門語 料庫還不多見 , 如旅游方面就僅有一些小規(guī) 模的語料庫 。
個(gè) 詞 , 收 錄 了 2 , 786 個(gè) 不 同 類 符 ( types ) 和 42 , 025 形 符 ( tokens )。 庫 中 所 有 的 詞 語 都 用 CLAW7 標(biāo) 注 軟 件 消 除 屈 折 形 式 , 還 按 詞性作了標(biāo)注。 語料庫旨在歸納出適合于 日 本 旅 游 市 場 (尤 其 是 京 都 地 區(qū) )的 幾 百 個(gè) 最常用的旅游英語詞匯, 以供在日本大學(xué) 學(xué)習(xí)旅游英語課程的不同程度的學(xué)習(xí)者使 用。 我國國內(nèi)研制旅游專門語料庫就更為鮮 見 。 馮志偉 (2001 ) 提及 , 中國科學(xué)院自動化所 建立了一個(gè)旅游咨詢口語對話語料庫和一個(gè) 旅館預(yù)定口語對話語料庫 , 但關(guān)于這個(gè)口語 語料庫的情況卻一直不為人知 。 除此之外 , 國 內(nèi)尚不見有其它專門研發(fā)的旅游語料庫 ( 無 論是單語還是雙語 )。 綜上所述 , 國內(nèi)外旅游專門語料庫的研 制還很不夠 , 現(xiàn)有的幾個(gè)也存在以下缺點(diǎn) : 一 是規(guī)模小 , 除了 Wilkinson 的語料庫有 67 萬 詞外 , 其它兩個(gè)語料庫的規(guī)模均不超過 5 萬 詞 , 并且形式單一 , 均為單語 ( 英語 ) 語料庫 。 二是語料庫的設(shè)計(jì)比較簡單 , 選擇語料的方 法含糊不清 , 也沒有說明其選擇語料的標(biāo)準(zhǔn) , 容易讓人質(zhì)疑其語料的代表性 。 三是相較其 它綜合語料庫 , 這些語料庫對語料的處理都 很粗糙 , 除日本大學(xué)的語料庫外 , 其它的均未 對語料做后期整理 ( 包括對齊 、 標(biāo)注 、 加篇頭 等 )。 四是這些專門語料庫的用途都較單一 , 都是為旅游英語 ( 尤其是詞匯 ) 的教學(xué)而研 制 。 至于旅游文本在結(jié)構(gòu) 、 修辭上的特點(diǎn)等深 層次的問題完全沒有探究 , 也沒有考慮到旅 游翻譯教學(xué)與研究上的問題 。 本文介紹的新 型雙語旅游語料庫希望能克服以上弱點(diǎn) , 既 可直接用于指導(dǎo)現(xiàn)實(shí)中的旅游翻譯 ( 實(shí)踐意 義 ), 亦可促進(jìn)旅游翻譯教學(xué)和研究 ( 理論意 義 )。
2. 現(xiàn)有旅游專門語料庫
迄今, 國內(nèi)外專門收錄旅游文本的單 語或雙語語料庫均不多見。 縱覽相關(guān)文獻(xiàn), 我們發(fā)現(xiàn)國外的旅游專門語料庫主要有以 下三個(gè), 分別為芬蘭、 英國和日本學(xué)者研 制。
1) 芬 蘭 薩 翁 林 納 翻 譯 研 究 學(xué) 院 (Savonlinna School of Translation Studies ) 英 語教師 Michael Wilkinson 研制的合共 67 萬
詞英語旅游文本語料庫 。 該語料庫主要供芬 蘭學(xué)生將芬蘭旅游文本譯至英語時(shí)參考 , 檢 驗(yàn)他們的譯文用詞是否地道 。 同時(shí) , 學(xué)生可 以利用該語料庫來 “確認(rèn) 、證 實(shí) 或 摒 棄 主 觀 的決策 , 或是獲得搭配方面的用法 ”(2005 :
1 )。 2) 英 國 埃 塞 克 斯 大 學(xué) (University of Essex ) 研究生 Carlota Alcantar 于 2007 年研
制的英語旅游文本語料庫 。 該語料庫總詞數(shù) 為 37 , 795 , 收集的旅游文本分別來自 :a) 政 府旅游部門的介紹 ;b ) 酒店 、 餐館和旅行社的 宣傳資料 ;c) 語言培訓(xùn)學(xué)校相關(guān)的資料 。 研制 語料庫旨在總結(jié)出英語旅游文本寫作中最常 用的 421 個(gè)詞匯和短語 , 以幫助墨西哥納亞 里特州立大學(xué)旅游學(xué)院的教師有效地教授旅 游常用詞匯 。
3) 日 本 大 學(xué) (Nihon University) Kiyomi 等人于 2006 年研 制 的 “ 京 都 旅 游 語 料 庫 ” ( Kyoto Tourism Corpus )。 此 單 語 語 料 庫 收
集的均為日本京都市用英文寫就的關(guān)于京 都 旅 游 介 紹 的 文 本 , 共 885 篇 , 平 均 每 篇 47
3. 新型雙語旅游語料庫的設(shè)計(jì)思路和
特點(diǎn) 本文以下著重描述香港理工大學(xué)中文及
48
新型雙語旅游語料庫的研制和應(yīng)用
雙語學(xué)系最近研制的新型雙語旅游語料庫 。 這是香港以至全國第一個(gè)較大容量的英漢 / 漢英旅游語料庫 。 我們主要介紹這個(gè)語料庫 的研制思路和方法 、 語料庫的構(gòu)成和特點(diǎn) , 并 討論專門語料庫的發(fā)展前景 。 如 Kennedy 所言 , 無論何種語料庫 , 其 整體的設(shè)計(jì)和語料的匯集對于 “ 基于該語料 庫的研究的信度和效度都具有十分重大的作 用 ”(1998 : 60 )。 它還直接影響到語料庫所設(shè) 計(jì)的研究目的和教學(xué)作用能不能有效實(shí)現(xiàn) 。 就本旅游語料庫而言 , 設(shè)計(jì)目的有三 : 一是研究用途 。 包括旅游語言本身特點(diǎn) 的研究及旅游翻譯特點(diǎn)的研究 。 前者研究旅 游語言在語篇 、 修辭 、 詞匯等語言層面上與普 通語言不同的特點(diǎn) ; 后者則研究在翻譯過程 中旅游翻譯與普通翻譯的不同特點(diǎn) 。 研究問 題包括 : 旅游翻譯在語言特點(diǎn)上是否存在與 普通翻譯一樣的共性 ? 抑或有自己另外的特 點(diǎn) ? 這些特點(diǎn)是與特定時(shí)期的翻譯規(guī)范有關(guān) 還是超越時(shí)間 、 時(shí)空限制 ? 二是翻譯教學(xué)用途 。 具體來說 , 本語料庫 將為教授中英雙語旅游翻譯的教師提供真實(shí) 的教學(xué)材料 , 并為設(shè)計(jì)數(shù)據(jù)驅(qū)動教學(xué) (data-
必須嚴(yán)謹(jǐn) , 確保語料庫的效度和信度 。 語料庫 設(shè)計(jì)時(shí)要考慮的因素很多 , 大體可分為整體 設(shè)計(jì)和具體操作兩個(gè)層面 。 下面分述這兩個(gè) 層面 。
3.1 整體層面的考慮
從性質(zhì)來看, 本語料庫屬于專用 (specialized )、 同 質(zhì) 的 (homogeneous ) 語 料 庫 ( 參見黃昌寧 2002 ), 只收集與旅游景點(diǎn)介紹 相 關(guān) 的 中 、 英 文 原 生 性 文 本 (spontaneously
sourced texts ) (Mason 2001 : 68) 及 相 關(guān) 的 中-英互譯文本 ( 在時(shí)機(jī)成熟后亦會擴(kuò)展至收
集與旅游相關(guān)的行業(yè) ,如 酒 店 、交 通 等 介 紹 的文本 ), 這就局限了本語料庫的文本采樣 不能象異質(zhì)語料庫般采用隨遇性的文本采 樣原則, 而只能是采取目的性取樣標(biāo)準(zhǔn) (purposeful sampling )。 為了確保采集到的文 本在內(nèi)容上與語料庫研制目的相關(guān) , 在語言 上符合標(biāo)準(zhǔn) , 本語料建設(shè)中除了會實(shí)行多個(gè) 專 家 把 關(guān) 制 之 外 , 還 會 推 出 同 儕 報(bào) 告 (peer
debriefing ) 及 研 究 成 員 的 檢 視 (member check ) 等 方 法 來 核 實(shí) 文 本 的 適 合 性 和 代 表
性 。 同時(shí) , 對于某些介紹比較多的旅游景點(diǎn)文 本材料 , 在選取這些材料入庫時(shí)我們亦會附 加 以 三 角 驗(yàn) 證 法 (triangulation ), 多 渠 道 、 多 方式地反復(fù)核對入庫文本 ( 參見 Li 2004 )。 以 上這些確保文本數(shù)據(jù)有效性 (validity ) 的做法 均為傳統(tǒng)雙語旅游語料庫研制中所鮮見 。 下面我們就本語料庫在構(gòu)成 、 大小 、 語料 的代表性及語料的選擇等具體做法作進(jìn)一步 介紹 。
driven learning , 簡稱 DDL) 提供真實(shí)和多樣 化的資源 。 DDL 這里指的是 “ 在課堂上利用 電 子 計(jì) 算 機(jī) 生 成 的 索 引 (concordances ) 來 幫 助 學(xué) 生 發(fā) 掘 目 標(biāo) 語 模 式 (pattern ) 中 的 規(guī) 律 ,
并根據(jù)索引結(jié)果來研發(fā)種種學(xué)習(xí)活動及設(shè)計(jì) 學(xué)習(xí)練習(xí) ”(Johns & King 1991 : iii )。 就本旅 游語料庫而言 , 就是根據(jù)語料庫比較和檢索 的結(jié)果 , 開發(fā)出各種 DDL 的教學(xué)手段來輔助 旅游翻譯的教學(xué) 。 而學(xué)生亦能從語料庫中揣 摩職業(yè)旅游翻譯譯員所用的翻譯策略 , 從比 較 、 思考中學(xué)習(xí)他們老到的方法與技巧 。 開發(fā)
1) 語料庫的 構(gòu) 成 和 大 小 : 從 整 體 上 看 ,
本語料庫由一個(gè)雙語旅游翻譯對應(yīng)語料庫 (parallel corpus , 簡 稱 PC ) 與 一 個(gè) 雙 語 旅 游 翻 譯 類 比 語 料 庫 (comparable corpora , 簡 稱
DDL 教學(xué)手段往往需要更大規(guī)模的語料庫 , 本庫建成后會持續(xù)擴(kuò)容 , 以滿足 DDL 需求 。
三是實(shí)用性 。 即能夠?yàn)閲鴥?nèi)外從事涉外 旅游的英漢語從業(yè)者提供方便的旅游翻譯參 考或用作自學(xué)材料 , 提高他們的業(yè)務(wù)水平 。 為了實(shí)現(xiàn)上述目標(biāo) , 本語料庫在設(shè)計(jì)時(shí)
CC)組成 。 在研究的第一階段 ,這兩個(gè)語料庫 暫定為各 100 萬字 / 詞 ( 為統(tǒng)計(jì)方便 , 中文部
分按字?jǐn)?shù)計(jì)算 , 英文部分按詞數(shù)計(jì)算 ), 目前 各個(gè)語料庫已經(jīng)完成三分之二 。 按照我們的 設(shè) 計(jì) ,PC 與 CC 均 為 動 態(tài) 語 料 庫 (dynamic corpora ), 即在將來會按每兩年一次的頻率 ,
李德超
王克非
49
把符合條件的文本補(bǔ)充至各庫之中 , 并不斷 提高加工的深度 。 與那些只是選擇特定時(shí)間 范圍內(nèi)部分語言現(xiàn)象的靜態(tài)語料庫相比 , 本 語料庫的動態(tài)設(shè)計(jì)能夠反映旅游用語及旅游 翻譯的時(shí)代變遷和語言風(fēng)格的變化 。 動態(tài)設(shè) 計(jì)的思路會讓本旅游語料庫的規(guī)模逐漸擴(kuò) 大 ,, 同時(shí)也為研究旅游翻譯和旅游語言提供 了縱向研究的可能 。 在現(xiàn)階段 ,PC 與 CC 合 并起來有 200 萬字詞 。 語料庫是否適用的主 要因素并非全在于其規(guī)模的大或小 , 而主要 在于 “ 適用于語料庫的文本是否容易獲得 , 或 是取決于其它因素 , 諸如文本是否需要手動 標(biāo)注等等 ”(Hunston 2002 : 26 ), 以 及 語 料 庫 能不能實(shí)現(xiàn)研制目的 ( 如旅游翻譯的教學(xué) ) 和 解決預(yù)定的一些研究問題 ( 如旅游語言的特 點(diǎn) )。 對于本研究而言 , 各 100 萬字詞的 PC 和 CC , 在語料收集和分析上較易做到 , 且在 現(xiàn)階段為達(dá)到這個(gè)目標(biāo) , 在財(cái)力和在人力的 資源上尚可操控 。
Laviosa 1997 )。 這些參數(shù)的一致性至少能確 保 CC 在設(shè)計(jì)上避免由于中英文本語料的不
均衡而造成研究中出現(xiàn)錯誤的或有偏差的結(jié) 論。
PC 與 CC 相結(jié)合的設(shè)計(jì)考量在于讓這兩 種語料庫的特點(diǎn)互補(bǔ) 。 Johansson (1998 : 6 ) 認(rèn) 為 , PC 研 究 中 出 現(xiàn) 的 一 些 不 容 易 解 答 的 問題 , 需以 CC 為 比 較 參 照 系 才 能 得 到 讓 人
信服的答案 。 這些問題包括 : 譯文在多大程 度上體現(xiàn)普通語言的運(yùn)用 ? 譯文在多大程度 上受到原文的影響? 以及譯文具有什么樣 的 總 體 特 征 ? 等 等 。 正 因 為 PC 與 CC 結(jié) 合 能在語料庫翻譯研究中發(fā)揮更大的增效作 用 , 近 來 有 不 少 翻 譯 學(xué) 者 都 提 倡 把 PC 中 的 一 些 發(fā) 現(xiàn) 運(yùn) 用 在 CC 的 背 景 框 架 中 解 釋 , 充分發(fā)揮語料庫翻譯研究的定性與定量研 究 相 結(jié) 合 的 優(yōu) 勢 ( 參 看 Kenny 2006 )。 除 此 之 外 , 本 語 料 庫 里 具 有 雙 向 性 的 PC 與 CC 結(jié)合還能提供更廣闊、 更豐富的語言對比 潛 能 。 如 下 圖 所 示 (C 表 示 本 旅 游 語 料 庫 的 組 成 部 分 ):
中文 譯文 英文
PC 是一個(gè)雙向的漢英 / 英漢旅游翻譯語
料庫 , 先收錄香港地區(qū)的英譯漢和漢譯英的 旅游翻譯文本 , 并逐步將收集的范圍擴(kuò)大到 大陸 、 臺灣以及全球華人地區(qū)的旅游文本 。 這 些文本包括以網(wǎng)頁形式的電子文本和以書面 形式的文字文本 ( 包括書籍 、 宣傳冊 、 旅游區(qū) 內(nèi)張貼的介紹等等 )。
C1 中譯文
C2 英譯文
PC
原文
CC 主 要 收 錄 以 香 港 地 區(qū) 為 主 的 兩 岸 三 地非翻譯 (non-translation ) 的中文和英文旅游
原生性文本 。 英文旅游文本將涵蓋英 、 美 、 澳 等主要以英語為母語的國家 ( 國別在語料中 加以標(biāo)識 )。 與 PC 一樣 ,CC 收錄的文本范圍 同樣包括來自電子 、 書面以及其它媒介形式 的文本 。 在構(gòu)建 CC 時(shí) , 我們注重讓中文文本 庫與英文文本庫在以下幾個(gè)主要參數(shù)上具有 一致性 , 以確保收錄在 CC 中的中英文文本 具有最大的可比性 , 如 : 文本均全文收錄 、 長 度大致相近 、 文本創(chuàng)作的時(shí)間跨度均為過去 十年、 文本的作者盡可能多樣等等 (參考
1
C3 中文原文
C4 英文原文
CC
非譯文 C5 中文非譯文
C6 英文非譯文
圖1
旅游語料庫結(jié)構(gòu)圖
1
從圖 1 可見 , 若以庫為單位 , 本語料庫內(nèi) 可以作子庫之間的比較 , 至少有以下幾種可 能性 : 一 、 可以是 PC 研究中常見的原文與譯 文 的 比 較 (C1 :C4 ;C2 :C3 ); 二 、 可 以 作 同 一 種 語 言 之 間 譯 文 與 非 譯 文 的 比 較 (C1 :C3 ;
C5:C3; C2:C4;C6:C4); 三 、 亦 可 以 是 不 同
本圖部分改編自 Johansson 和 Hofland (1994 : 26 )。
50
新型雙語旅游語料庫的研制和應(yīng)用
語言之間 ( 這里即中文與英文 ) 非譯文之間的 比較 (C5 :C6 )。 同時(shí) ,C5 和 C6 還能起到參考 語料庫的作用 , 為 C1 :C4 和 C2 :C3 時(shí)提供 盡可能多的參照系 。 本旅游語料庫的這種設(shè) 計(jì)方式為最大限度地有效利用語料庫創(chuàng)造了 條件 。
構(gòu) 以 致 僵 硬 的 譯 文 不 予 收 錄 ;4 ) 在 最 后 階 段 , 部分文本請精通中英雙語的專家和翻譯 教師審閱其語言和用法上的可接受性 。 由于 本旅游語料庫除了用于語言研究外 , 還會用 于教學(xué) , 上述嚴(yán)謹(jǐn)選材除了盡量使語料具有 代表性外 , 還要確保文本有一定的質(zhì)量 , 這 樣才不會對旅游翻譯教學(xué)造成反效果 。 可能有人認(rèn)為 , 語料若不是全部用隨機(jī) 方式而任意抽取 , 反而不利于呈現(xiàn)旅游文本 的 “ 最自然的狀態(tài) ”, 因而語料庫也并非所有 香港旅游文本的最真實(shí)反映 , 而是帶有很大 的主觀色彩 。 對此 , 我們認(rèn)為 : 一 、 對語料進(jìn)行 適當(dāng)選擇是當(dāng)今絕大部分語料庫的通用做 法 , 亦是一種發(fā)展趨勢 ( 如 BNC 就對不少語 料進(jìn)行了剪裁 ), 只不過很多語料庫建設(shè)者未 將選材標(biāo)準(zhǔn)明確列出而已 。 未經(jīng)挑選的大量 原始語料的集合只會讓語料庫內(nèi)容參差不 齊 , 水平不一 。 由這些材料集合而成的語料庫 雖然最少受到研究者的 “ 干擾 ”( 即研究者主 觀性的影響 ), 但它卻不利于開展研究或教 學(xué) , 而后者恰恰才是語料庫建設(shè)的目的 。 二 、 所有語料庫都不可能做到完全客觀 , 不受研 究者主觀性的影響 。 正如 Crisafulli 所言 ,“ 語 料庫從開始設(shè)計(jì)如就是一種 ( 設(shè)計(jì)者 ) 詮釋的 表現(xiàn) ”(2002 : 32 )。 不少學(xué)者亦指出 , 語料庫 的設(shè)計(jì)以及語料的收集 ( 包括要容納哪些主 要信息和次要信息等等 ), 都要根據(jù)研制語料 庫之前所設(shè)定的研究目的和研究問題而定 ( 參看 Olohan 2004 : 42 ), 只要語料庫的選材 能夠達(dá)到預(yù)定的目的 , 語料庫的設(shè)計(jì)和語料 的組成能與研究目的相符 , 能讓學(xué)者進(jìn)行相 應(yīng)的研究 , 這就是一個(gè)好的語料選取過程 。
PC 與 CC 選取的旅游文本 主 要 包 括 :1) 自然景觀 、 人文景觀的介紹 ;2 ) 觀光小冊子 ; 3)酒店 、旅館 、餐飲業(yè)及娛樂場所和設(shè)施的介 紹 ;4 ) 博物館 ( 包括展品 ) 的說明和介紹 。 將來
還可考慮收集與旅游業(yè)相關(guān)的其它行業(yè)的文 本 , 如與交通 、 導(dǎo)游 、 票務(wù) 、 旅行社業(yè)務(wù) ( 包括 旅游行程設(shè)計(jì) )、 貨幣兌換 、 投訴處理 、 旅游安 全 、 旅游管理部門的宣傳和公示語等相關(guān)的 文本 。
2) 語 料 的 選 取 和 代 表 性 問 題 : 香 港 旅 游
業(yè)興旺 , 市場上充斥著大量與旅游相關(guān)的宣 傳頁和小冊子 。 數(shù)量多 , 質(zhì)量難免良莠不齊 , 這就更凸現(xiàn)了語料選取過程的重要性。 —— 即 Kennedy 特別指出語料的代表性問題 — 所選語料能否代表這個(gè)領(lǐng)域中的大多數(shù)文 本— —— 是語料庫建設(shè)必須考慮的一個(gè)重要問 題 。 他認(rèn)為 , 選擇語料時(shí)必須注意的問題包 括 : 語料的文學(xué)價(jià)值 、 社會上的影響 、 所面向 的讀者群體、 文本地區(qū)性和時(shí)間因素等等 (1998 : 62-66 )。 由于 Kennedy 針對的是單語 普通語料庫 ( 尤其是文學(xué)語料庫 ) 的建設(shè) , 他 所提及的上述要素并非全都適用于本語料 庫 。 但就本語料庫而言 , 在面對大量有關(guān)旅游 的文本時(shí) ,“ 研究者需要考慮一系列的問題 , 確定一系列的標(biāo)準(zhǔn) , 幫助作出選擇和排除某 些文本的決定 ”(Olohan 2004 : 46 )。 借 用 Maia (2003 :45 ) 的 做 法 , 本 旅 游 語 料庫訂出以下幾條標(biāo)準(zhǔn) :1 ) 據(jù)社會語域標(biāo)準(zhǔn) ( 如分為景點(diǎn)介紹 、 觀光介紹 、 旅游配套設(shè)施 介紹等若干類 ), 將分層抽樣 、 均衡抽樣和比 例抽樣結(jié)合使用 , 使入庫語料具有一定代表 性 ;2 ) 所有文本 , 若含任何語法 、 用詞或印刷 上的錯誤 , 均不收錄 , 或略加更正后收錄 ;3 ) 就翻譯文本而言 , 任何太過貼近原文句法結(jié)
3.2 具體操作層面的考慮
語料庫具體操作層面的考慮因素包括語 料文本的數(shù)字化 、 語料的標(biāo)注 、 語料的對齊 、 語料的篇頭標(biāo)注等實(shí)際問題 。
1) 語料文本的數(shù)字化 。 目前 , 語料庫所
收錄的文本絕大部分來源于以下三種途徑 : 網(wǎng)上的電子文本 、 以紙質(zhì)形式出現(xiàn)的印刷品 、 書籍或宣傳頁和拍攝下來的以建筑物形式樹
李德超
王克非
51
立的有關(guān)旅游景區(qū)的介紹 。 所有的這些材料 都需轉(zhuǎn)為 txt 文檔備用 。 不少印刷品都帶有插圖 、 照片 、 標(biāo)志等
和語法上的修辭特點(diǎn) , 在語料中標(biāo)出所使用 的修辭或比喻手法 。 這種標(biāo)注方法由于沒有 現(xiàn)成的軟件可以做到 , 一切只能人工進(jìn)行 , 所 以費(fèi)時(shí)甚巨 。 但一旦標(biāo)注完成 , 它將為我們揭 示英漢旅游文本在修辭用法上的不同 , 甚至 為文本背后兩種民族的審美觀念的不同提供 有力的佐證 , 這對比較修辭學(xué) 、 比較美學(xué)研究 等都大有裨益 。 針對旅游文本及旅游翻譯的特點(diǎn) , 本語 料庫亦會使用一 些 CLAWS7 的 碼 集 中 沒 有 的自主創(chuàng)設(shè)碼來對語料進(jìn)行標(biāo)注 。 這些自主 創(chuàng)設(shè)碼主要有兩類 : 一類是用于標(biāo)注上述提 及的 “ 超音段特征 ”, 以創(chuàng)設(shè)碼 <SUS> 表示 ; 另 一 類 是 各 種 類 型 的 修 辭 手 段 (rhetorical devices ), 在創(chuàng)設(shè)碼上全以 <RHE> 開頭 , 后面 會加一個(gè)或二個(gè)字母來表明語料中所用的具 體 修 辭 手 法 , 如 隱 喻 以 <RHEM> 表 示 , 頭 韻 以 <RHEA> 表示 , 排比以 <RHEP> 表示等等 。 因?yàn)?CLAWS7 軟件只能標(biāo)注詞類 , 上述標(biāo)注 因而不能采用機(jī)器進(jìn)行 , 只能手工賦碼 。 之所 以創(chuàng)作這些碼集 , 主要是因?yàn)樗鼈兯淼?語言特點(diǎn)在旅游文本體裁中非常顯著 , 且作 用重大, 往往決定旅游文本的呼喚功能 (vocative function ) 是否能 得 以 實(shí) 現(xiàn) , 因 而 有 必要在語料庫中將這些特點(diǎn)明示 。 另外 , 標(biāo)注還涉及 CLAWS7 的碼集與自 主創(chuàng)設(shè)碼的兼容問題。 因?yàn)樽髡卟⒎?br />
Nord 稱 之 為 “ 非 言 語 因 素 ” (non-verbal elements ) (2005: 118) 以 及 用 不 同 字 體 大
小 、 形式 、 下劃線等來模仿語調(diào) 、 語氣和停頓 功 能 的 “ 超 音 段 特 征 ” (suprasegmental features ), 它們都構(gòu)成了旅游文宣中不可缺 少的一部分。 但在轉(zhuǎn)換成語料庫電子文本 后 , 無論是 “ 非言語因素 ” 和 “ 超音段特征 ” 都 得去除 , 以方便標(biāo)注和以后的檢索 , 因此 , 我 們對于具有這些特征的文本就在其電子文 本的 “ 篇頭 ” 上注明 , 方便研究者和學(xué)習(xí)者如 有需要時(shí)去打開相應(yīng)的掃描文檔來查找 , 同 時(shí)亦會在文本中出現(xiàn)這些 “ 超音段特征 ” 的 地方以賦碼 <SUS> 做人工標(biāo)注 , 讓使用者 能夠通過計(jì)算機(jī)快速查找 。 以相片出現(xiàn)的旅 游介紹則需要手工輸入 , 之后亦存為 txt 文 檔備用 。
2)語料的標(biāo)注 。 在本文 ,標(biāo)注指對語料成
份 ( 通常是詞性 、 詞類 ) 的劃分 , 以方便進(jìn)一步 檢索和研究 , 這種標(biāo)注方式稱之為 POS 標(biāo)注 法 (part-of-speech tagging )。 對 于 英 文 語 料 , 一般的 POS 標(biāo)注法就是參考 BNC 對語料詞 性和詞類的劃分和縮寫方法 ( 如 NN1 表示單 數(shù) 名 詞 、NN2 表 示 復(fù) 數(shù) 名 詞 、NP0 表 示 專 有 名 詞 等 , 參 看 BNC 網(wǎng) 站 ), 先 用 軟 件 ( 如 CLAWS 標(biāo)注系統(tǒng) )進(jìn)行機(jī)器標(biāo)注 。 由于機(jī)器 標(biāo)注都不能達(dá)到百分百的標(biāo)注準(zhǔn)確率 ( 最好 的 CLAWS 標(biāo)注系統(tǒng)也只能達(dá)到 96% 左右 , 見 Kennedy 1998 : 218 ), 因 此 機(jī) 器 標(biāo) 注 完 成 后還要進(jìn)行人工修正 。 中文亦有類似標(biāo)注詞 性和詞類的系統(tǒng) , 但其準(zhǔn)確性不如 CLAWS , 且中文詞性的區(qū)分不如英文的清晰 , 因而標(biāo) 注中文語料人工后期修正的時(shí)間要花費(fèi)更 多。 本語料庫除了按照傳統(tǒng)的 POS 標(biāo)注外 , 還根據(jù)旅游文本中的一個(gè)突出的修辭特點(diǎn) , 在語料上采用相應(yīng)的修辭手段標(biāo)注 。 研究員 在研讀文本時(shí) , 分別會根據(jù)文本在語音 、 詞匯
CLAWS7 的開發(fā)人員 , 亦無權(quán)將自創(chuàng)的碼集 加入至 CLAWS7 的碼集 之 中 , 從 而 達(dá) 到 以 CLAWS7 軟件統(tǒng)一以計(jì)算機(jī)附碼的目的 。 事
實(shí)上, 即便作者有權(quán)將自主創(chuàng)設(shè)碼加入
CLAWS7 的碼集 , 但對于作者自主創(chuàng)設(shè)碼的
標(biāo)注 ( 如修辭手段的標(biāo)注 ), 主要是基于對整 個(gè)句子的認(rèn)知理解 , 以目前人工智能的發(fā)展 程度來看 , 計(jì)算機(jī)亦不能對此附碼 。 為了與
CLAWS7 的 碼 集 相 兼 容 , 我 們 采 取 的 手 法 是 : 在所有的語 料 用 CLAWS7 的 碼 集 標(biāo) 注
后 , 再用手工形式對處理過的語料加注自主 創(chuàng)設(shè)碼 。 手工賦碼費(fèi)時(shí) , 但準(zhǔn)確性高 。 我們力 求 在 手 工 賦 碼 時(shí) 做 到 標(biāo) 注 格 式 與 CLAWS7
52
新型雙語旅游語料庫的研制和應(yīng)用
的碼集格式完全一致 , 以便在檢索語料時(shí)用 軟件統(tǒng)一提取 。
料庫相比 , 本語料庫的 “ 新 ” 主要體現(xiàn)在以下 幾點(diǎn) :( 一 ) 從語料庫的結(jié)構(gòu)成份來看 , 本語料 庫一反傳統(tǒng)旅游語料庫均由 PC 單軌組成的 特點(diǎn) , 改為由 PC 與 CC 聯(lián)合雙軌組成 。 正如 圖一所示 , 這種組合形式能提夠更為豐富的 各子庫之間比較的可能性 , 使研究者能更全 面地考察旅游文本的體裁慣例 , 更深入地了 解旅游翻譯與其它類型的翻譯 ( 如文學(xué)翻譯 、 法律翻譯等 ) 在詞匯 、 句法和修辭等多個(gè)語言 層面上呈現(xiàn)出來的不同特點(diǎn) ; ( 二 ) 從語料庫 的詞容來看 , 本語料庫中的 PC 與 CC 加起來 共 200 萬字 , 這亦是目前世界上最大的雙語 旅游語料庫 。 更為重要的是 , 本語料庫建成之 后 , 每二年將更新一次語料庫的內(nèi)容 , 使語料 庫能反映旅游語言的最新變化 。 可以設(shè)想 , 在 較長的一段時(shí)間之后 , 語料庫這種動態(tài)的 、 增 進(jìn)式 (incremental ) 的特點(diǎn)將會使研究者能夠 對旅游語言和旅游翻譯的特點(diǎn)進(jìn)行歷時(shí)或共 時(shí)的研究 , 從而豐富目前雙語旅游語料庫研 究中較為單一的研究范式 ;( 三 ) 從語料的收 集上 , 本語料庫的語料選材嚴(yán)謹(jǐn) , 特別是針對 雙語旅游語料良莠不齊的普遍現(xiàn)象 , 提出雙 語語料均需由專家認(rèn)定后才能入庫 。 這就能 避免目前某些雙語旅游語料庫中出現(xiàn)的部分 收錄譯文錯誤百出的毛病 , 從而在保證本語 料庫的語料具有代表性的同時(shí) , 亦不會誤導(dǎo) 用戶 ;( 四 ) 從語料庫的運(yùn)用前景上 , 傳統(tǒng)旅游 語料庫作用相當(dāng)單一 , 幾乎都是為旅游英語 教學(xué) , 尤其是詞匯教學(xué)而設(shè) ; 而本語料庫的用 途則廣泛的多 : 它除了可以采用 DDL 形式 , 開展多層次、 多類型的旅游英語教學(xué)與中 英 - 英中旅游翻譯教學(xué)之外 , 亦可以用于語言 研究及供旅游從業(yè)人員使用 , 這樣就使雙語 旅游語料庫的價(jià)值得到更大的體現(xiàn) , 亦能給 其它專門語料庫的研制和發(fā)展提供寶貴的經(jīng) 驗(yàn)。
3)語料的對齊 。 PC 里的中 、 英文語料都 先用 Paraconc 軟件以句為單位粗略對齊 , 然
后再人工檢查 , 以方便用 concordancer 檢索 。 中文語料還會用中科院計(jì)算所開發(fā)的 “ 漢語 詞匯分析系統(tǒng) ”(ICTCLAS ) 進(jìn)行切分 。 旅游 文本的翻譯很多時(shí)候并非完全遵守句對句的 原則 , 摘譯 、 擴(kuò)譯或省譯情況還比較多見 。 軟 件在某些地方找不到一對一的對應(yīng) , 就容易 發(fā)生錯配 。 我們設(shè)想將來在此新型雙語旅游 語料庫的基礎(chǔ)上 , 根據(jù)詞頻來自主開發(fā)中 、 英 文 旅 游 文 本 中 常 用 的 雙 語 詞 匯 (bilingual
lexicon ), 這樣就 方 便 在 語 料 庫 擴(kuò) 充 和 更 新
時(shí) , 把這些雙語詞匯用作語料句與句對齊的 另一附加條件 , 進(jìn)而提高對齊的準(zhǔn)確率 。 但無 論如何 , 機(jī)器對齊之后 , 均需要人工檢查作進(jìn) 一步的確定 。 對于摘譯 、 擴(kuò)譯或是省譯的現(xiàn) 象 , 運(yùn)用 concordancer 檢索相關(guān)的句子時(shí) , 可 以在檢索時(shí)設(shè)定 concordancer 同時(shí)出現(xiàn)相對 應(yīng)的句子的相鄰的幾個(gè)句子 , 提供更為詳盡 的語境 , 這樣就能較為準(zhǔn)確的知道是那一部 分原文受到改動 。 語料對齊后 , 會將文本轉(zhuǎn)換 成 XML 格式 , 這樣就能讓語料庫以多種語 言格式編碼 , 方便傳播和檢索 。
CC 中漢語旅游語料的詞匯切分與賦碼 亦 是 采 用 的 是 由 中 科 院 計(jì) 算 所 的 ICTCLAS
軟件 。 該系統(tǒng)分詞精度高 , 分析速度佳 , 唯一 不足就是對詞性的標(biāo)注仍不夠精準(zhǔn) 。 因此 , 經(jīng)過 ICTCLAS 分詞后的語料仍需大量的手 工校對, 以提高中文語料的詞性標(biāo)注正確 率。
4) 語料的篇頭標(biāo)注 。 篇頭提供所收語料 的進(jìn)一步信息 。 根據(jù)不同研制目的 , 不同語料
庫納入篇頭的內(nèi)容亦不同 。 本語料庫里 , 篇頭 內(nèi)容包括篇名 、 作者名 、 作者背景 、 譯者名 、 譯 者背景 、 年代 、 出版信息 ( 書籍 、 電子或圖片 )、 文本字?jǐn)?shù) 、 有無 “ 非言語因素 ” 及 “ 超音段特 征 ”等 。 從以上介紹可以看出 , 與傳統(tǒng)的旅游語
4. 研究前景
目前 , 本旅游語料庫只是初步建成 , 以后
李德超
王克非
53
將會逐漸由主要收集香港地區(qū)的語料擴(kuò)展為 收集兩地三岸的中英文旅游語料 , 并考慮將 語料庫上網(wǎng)或制成可供檢索的光盤 。 同時(shí) , 我 們還會不斷完善現(xiàn)有的標(biāo)注體系 , 根據(jù)研究 和教學(xué)目的 , 進(jìn)行新的語義和句法標(biāo)注 ( 參看 王 克 非 2004 : 75 ), 最 大 限 度 地 發(fā) 揮 語 料 庫 的潛能 。 在教學(xué)方面 , 將根據(jù)語料特點(diǎn) , 開發(fā) 出一系列可供教師在課堂上使用以及學(xué)生隨 時(shí)使用的教學(xué)材料 ( 擬另文敘述 ), 為開展
語篇中用到的特定修辭手法在英文中的習(xí)慣 處理方法 , 并了解它們在譯文讀者大腦中構(gòu) 成的或主觀 、 或客觀 、 或夸張的印象 , 等等 。 除 此之外 , 我們亦可從翻譯的共性入手 , 探討旅 游翻譯是否具有 “ 共性 ”, 而目前翻譯研究中 發(fā)現(xiàn)的一些所謂 “ 共識 ”(common ground ) 是 否又適用于旅游翻譯 , 等等 。 當(dāng)然 , 這些研究 前景都需在進(jìn)一步提升本語料庫研制程度之 后進(jìn)行 。
參考文獻(xiàn)
DDL 旅 游 翻 譯 教 學(xué) 提 供 直 觀 和 真 實(shí) 的 語 料
基礎(chǔ) 。 另外 , 我們亦考慮建立學(xué)習(xí)者旅游翻譯 語料庫 , 收集大學(xué)生旅游翻譯作業(yè)的電子文 本 , 把它與其它兩個(gè)語料庫相對照 , 找出學(xué)生 常犯的錯誤 , 尋求產(chǎn)生這些錯誤的文本內(nèi)及 文本外的原因 。 在研究過程中 , 我們基于本語料庫已經(jīng) 做了一些研究 。 例如 , 研究英漢酒店文宣的文 本比較模式 , 從而得出在語篇結(jié)構(gòu) 、 語言慣例 上更為適切的中譯英酒店文宣譯文 ( 李德超 、 王克非 2009 ), 研究基于旅游語料庫而開發(fā) 各種 DDL 教學(xué)方法 。 本語料庫將來的研究前 景相當(dāng)廣闊 。 比如 , 在詞匯層面 , 我們可以比 較漢英旅游語篇的詞匯色彩和風(fēng)格 ( 如是正 式 、 幽默 、 低調(diào) 、 口語化還是其它 ), 或是通過 詞頻來統(tǒng)計(jì)在特定旅游場景中最常用的詞 匯 , 作為編纂不同程度的旅游教材的基礎(chǔ) , 或 是考察特定的形容詞 ( 如 “ 美麗的 ”) 在譯文中 對應(yīng)的詞匯 , 從而挖掘旅游翻譯過程中的審 美因素 , 等等 。 在句子層面 , 我們可以考察漢 英旅游語篇在句子結(jié)構(gòu)和句子復(fù)雜程度的偏 好 , 或是研究句子選擇主動或被動表達(dá)式的 深層原因 , 或是了解句子在不同的文化場合 所傳達(dá)的不同語用效果 , 所能激發(fā)起讀者不 同的文化聯(lián)想 , 等等 。 在語篇層面 , 我們可以 比較漢英旅游語篇在銜接手段上的差別 , 或 是歸納出它們在語步結(jié)構(gòu)和體裁結(jié)構(gòu)潛勢上 的不同特點(diǎn) , 從而考察它們在社會認(rèn)知根源 上的異同 。 而在修辭層面 , 我們亦可以比較漢 英旅游語篇最常用的修辭手法 , 考察讀者對 這些手法的接受和反應(yīng) , 或是考察中文旅游
Alcantar , C. 2007. Construction of a special corpus to extract the most frequent words in a particular field [J ]. Essex Graduate Student Papers in Language & Linguistics 9 : 1-17. Barnbrook , G. , P. Danielsson & M. Mahlberg. 2006. Meaningful Texts : Corpora Continnum. Chujo , K. , M. Utiyama & K. Oghigian. 2006. Selecting Paper Level-Specific at Kyoto Tourism
[P ]. [M ].
The Extraction of Semantic London and New York :
Information from Monolingual and Multilingual
Vocabulary Using Statistical Measures presented Conference of International Teaching and Learning :
2006 New
Aspect of English Language Learning in Taiwan. Available online at URL http : / / www2.nict.go. jp / x / x161 / members / mutiyama / pdf / KyotoArticle-Chujo-Utiyama-Oghigian.pdf Crisafulli , E. 2002. The quest for an eclectic methodology of translation description [A ]. In T. Hermans (ed. ). Crosscultural Transgressions : Research Models in Translation Studies II [C ]. Manchester : St. Jerome. Hermans , T.
(ed. ).
2002.
Crosscultural
Transgressions : Research Models in Translation Studies II : Historical and Ideological Issues [C ]. Manchester : St. Jerome. Hunston , S. 2002. Corpora in Applied Linguistics
[M ]. Cambridge : Cambridge University Press.
Johansson , S. 1998. On the role of corpora in crosslinguistic research [A ]. In S. Johansson & S. Oksefjell (eds ). Corpora and Cross-Linguistic
54
新型雙語旅游語料庫的研制和應(yīng)用
Research [C ]. Amsterdam : Rodopi. Johansson , S. & K. Hofland. 1994. Towards an English-Norwegian parallel corpus [A ]. In U. Fries , G. Tottie & P. Schneider (eds ). Creating and Using English Language Corpora [C ]. Amsterdam : Rodopi. Johansson , S. 2003. Reflections on corpora and their uses in cross-linguistic research Corpora in Translator
[A ].
and information retrieval using comparable and parallel corpora Bernardini & D. Jerome. Mason , I. 2001. Translator behavior and language usage : Some constraints on contrastive studies In F.
[C ]. [J ]. Hermes 26 : 65-80. [A ].
In F.
[C ].
Zanettin ,
S. St.
Stewart (eds. ).
Corpora in
Translator Education
Manchester :
Zanettin , S. Bernardini & D. Stewart (eds ). Education Manchester : St. Jerome. Johansson , S. 1991. Times change and so do corpora
[A ]. In K. Aijmer & B. Altenberg (eds ). English
Nord , C. 2005. Text Analysis in Translation : Theory , Methodology , and Didactic Application of a Model for Translation-oriented Text Analysis
(2nd edition ) [M ]. Amsterdam / Atlanta : Rodopi.
Olohan , M. 2004. Introducing Corpora in Translation Studies [M ]. London / New York : Routledge. Wilkinson , M. 2005. Discovering translation equivalents in a tourism corpus by means of fuzzy searching [J ]. Translation Journal 9 : 110. Wilkinson , M. 2009. Compiling a Specialized Corpus to Be Used as a Translation Aid [R ]. Available online at URL http : / / www.joensuu.fi / hallinto / jopke / dokumentit / Wilkinson.doc Zanettin , F. , S. Bernardini & D. Stewart (eds ). 2003. Corpora in Translator Education
[C ].
Corpus Linguistics :
Studies in Honour of Jan
Svartvik [C ]. London and New York : Longman. Johns , T. & P. King. 1991. Classroom concordancing
[J ]. ELR Journal , New Series 4.
Kennedy , G. D. 1998. An Introduction to Corpus Linguistics Longman. Kenny , D. 2005. Parallel corpora and translation new perspectives ? studies : Old questions ,
[M ].
London / New York :
Reporting that in GEPCOLT : A case study [A ]. In G. Barnbrook , P. Danielsson & M. Mahlberg
(eds. ).
Meaningful Texts :
The Extraction of
Manchester : St. Jerome.
馮志偉 ,2001 , 中 國 語 料 庫 研 究 的 歷 史 與 現(xiàn) 狀 [A ]。 國際中文計(jì)算機(jī)會議 ICCC2001 論文集 (C )。 新 加坡 。 黃昌寧 ,2002 , 語 料 庫 語 言 學(xué) [M ]。 北 京 : 商 務(wù) 印 書 館。 李 德 超 、 王 克 非 ,2009 , 平 行 文 本 比 較 模 式 與 旅 游 文 本的英譯 [J ]。 中國翻譯 (4 ):54-58 。 王 克 非 ,2004 , 新 型 雙 語 對 應(yīng) 語 料 庫 的 設(shè) 計(jì) 與 構(gòu) 建 [J ]。 中國翻譯 (6 ): 73-75 。 收稿日期 :2009-07-09 ; 作者修改稿 ,2009-07-28 ; 本刊修訂 ,2009-12-28 通訊地址 : 北京外國語大學(xué)中國外語教育研究中心
Semantic Information from Monolingual and Multilingual Corpora [C ]. London : Continuum. Kubler , N. 2003. Corpora and LSP translation [A ]. In F.
(eds. ).
Zanettin ,
S. Bernardini & D. Stewart
Corpora in Translator Education [C ].
Manchester : St Jerome. Laviosa , S. 1997. How comparable can “comparable corpora ” be ? [J ]. Target 9 : 289-319. Laviosa , S. 2002. Corpus-based Translation Studies : Theory , Findings and Applications
[M ].
Amsterdam : Rodopi. Li , Defeng. 2004. Trustworthiness of think-aloud protocols in the study of translation process [J ]. International Journal of Applied Linguistics 3 : 301-313. Maia , B. 2003.
“Some languages are more equal
<kfwang126@126.com> <ctdechao@polyu.edu.hk>
(王 ) (李 )
香港理工大學(xué)中文及雙語學(xué)系
than others ”: Training translators in terminology
109
contrasting. On the semantic construal of [shèng ] and [bài] from the Construction Approach , by Li Guohong , p.31 The Chinese antonyms [shèng] and [bài] sometimes are synonymous with each other. To address this strange phenomenon , the paper analyzes their semantic properties from the cognitive perspective , with the findings that (1) [shèng] bears a definite semantic direction , while [bài] is opaque , and (2) when acting as a complex predicate juxtaposed with other words in a two-argument construction , [shèng] and [bài] take the following sequence in deciding their semantic direction : direction of the directional words > direction of the imperfective > inherent direction of the perfective > direction of the atemporal > prototypical direction of the perfective ; when acting as a one-argument predicate , [shèng ] and [bài] are semantically directed to the agent. A study of Kenneth Burke ’s philosophy of language from his concept of “terministic screen ”, by Ju Yumei , p. 39 This paper explores Kenneth Burke ’s philosophy of language. It begins by analyzing his concept of “terministic screen ” . And based on the analysis , it studies Burke ’s philosophy of language from the following four aspects , i.e., human beings cannot live without language ; language performs the function of being attitudinal and persuasive ; language does not simply reflect reality ; language use is full of motives. Through the study , the paper attempts to argue that rhetoric , especially Western rhetoric , is interdisciplinary in nature and hopes that it might shed enlightenment on the development of modern Chinese rhetoric. Development and application of bilingual corpora of tourism texts : A new approach , by Li Dechao and Wang Kefei , p.46 Based on a critical review of the existing monolingual and bilingual corpora of tourism texts both at home and abroad , this paper introduces the design rationale and the practical consideration for Bilingual Corpora of Tourism Texts (the Corpora ), which are being developed in the Hong Kong Polytechnic University. The practical consideration of the Corpora includes the digitization , the tagging , the alignment and the design of the header for the texts to be included in the Corpora. The paper concludes by pointing out the potentials for the teaching and research of tourism translation based on the Corpora. The representation of ambiguous words in Chinese EFL learners ’ mental lexicon : A developmental model , by Zhao Chen , p.55 This paper reports on an experiment exploring Chinese EFL learners ’ mental representation of three types of ambiguous words : homonymy , metaphoric polysemy and metonymic polysemy. The results show that the representation of the three types of ambiguous words in Chinese EFL learners ’ mental lexicon is a developmental model : the sense relatedness of homonymy and metaphoric polysemy becomes ever lower as the learners ’ language proficiency improves. On the contrary , the sense relatedness of metonymic polysemy is ever higher when the learners achieve a higher proficiency. The model is consistent with the usage-based approach for second language learning. An empirical study of the psychological reality of the gap in Chinese topicalization : Evidence from filler priming , by Cai Rendong and Dong Yanping , p.64
本文關(guān)鍵詞:新型雙語旅游語料庫的研制和應(yīng)用,由筆耕文化傳播整理發(fā)布。
本文編號:136688
本文鏈接:http://sikaile.net/guanlilunwen/lvyoujiudianguanlilunwen/136688.html