基于Agent協(xié)商的智能拼音輸入法研究
發(fā)布時間:2021-09-28 15:20
隨著對協(xié)商理論研究的不斷深入,基于Agent的自動協(xié)商技術(shù)被運用到各類領(lǐng)域中,解決實際問題。文字,作為人與計算機交互的主要信息載體,對用戶與計算機的交互體驗有著直接影響。中文輸入法是大多數(shù)中文用戶使用計算機的必備程序。在類型眾多的中文輸入法中,拼音輸入法具有簡單易學、多場景適用等諸多優(yōu)點,因此,拼音輸入法成為了當前中文輸入法領(lǐng)域的主流。在機器翻譯領(lǐng)域,近年來,計算機輔助人類譯員進行翻譯逐漸成為該領(lǐng)域的研究熱點。輔助翻譯的研究專注于如何有效地利用計算機幫助人類譯員高效地完成翻譯任務(wù)、提高翻譯質(zhì)量。受Agent協(xié)商的啟發(fā),本文將輔助翻譯中文拼音輸入法的應(yīng)用場景,抽象為協(xié)商域,利用Agent協(xié)商,完成拼音向漢字的解碼任務(wù)。本文提出了一種基于Agent協(xié)商的智能拼音輸入法(以下稱智能輸入法)。該輸入法面向英譯中的翻譯環(huán)境,專注于譯員在對原文進行翻譯的過程中,如何通過已輸入的拼音序列有效地預(yù)測譯員實際想要輸入的中文片段。實驗結(jié)果證明,該輸入法能夠有效地利用Agent協(xié)商技術(shù)將機器翻譯上下文信息融合到中文拼音輸入法中,在譯員專注于翻譯任務(wù)的過程中,準確地預(yù)測譯員想要輸入的中文片段,減少譯員擊鍵次數(shù)...
【文章來源】:西南大學重慶市 211工程院校 教育部直屬院校
【文章頁數(shù)】:77 頁
【學位級別】:碩士
【部分圖文】:
統(tǒng)計機器翻譯的典型翻譯模型
架有如下的特點:l 完全開源,使用 JAVA 語言開發(fā),平臺無關(guān);l 簡單、易用,用戶只用通過了解一些少量的配置文件,便可定制化自己訓練方案;l 可配置性,所有的參數(shù)均通過配置文件傳遞,方便管理;l 高度解耦的訓練流程,解碼器以及解碼過程用戶可以完全自定義,并運于外部進程中;自定義解碼結(jié)果的評價指標或者使用 Z-MERT 內(nèi)置的通用評價標;l 高度優(yōu)化的執(zhí)行過程,時間、空間等資源占用少。使用 Z-MERT 進行參數(shù)訓練時,用戶需要實現(xiàn)自己的解碼器,訓練過程中將解碼結(jié)果保存為文件,傳遞給 Z-MERT。解碼器對于 Z-MERT 框架是一個“盒”,Z-MERT 不關(guān)注解碼器的執(zhí)行過程。Z-MERT 內(nèi)部提供了豐富的評價指標以供用戶使用,用戶也可以實現(xiàn)平臺的接口自定義評價指標。參數(shù)訓練過程是碼、評價和調(diào)參的不斷迭代過程。這三個過程均可以執(zhí)行在各自獨立的進程中通過進程結(jié)束信號和文件相互傳遞信息。其基本過程可以描述為如下圖 2-2:
西南大學碩士學位論文不重不漏的拼音序列。一般切分的方式是基于已有的漢語拼音表進行查找,在拼音序列首尾分別設(shè)置一個指針,利用貪心算法搜索最長的拼音序列,直到首尾指針重合,停止搜索。本文將這種搜索方式稱為“最長拼音序列搜索算法”,算法過程的形式化描述見算法 1。2)音字、音詞表查詢基于第一步切分后的拼音序列列表,查找列表中每個拼音序列對應(yīng)的漢字列表,會得到一個漢字列表的列表。如圖 3-1 所示。
【參考文獻】:
期刊論文
[1]拼音輸入法經(jīng)驗對漢字字形和語音加工的影響[J]. 朱朝霞,劉麗,丁國盛,彭聃齡. 心理學報. 2009(09)
[2]基于多AGENT系統(tǒng)的電力合約市場協(xié)商平臺框架研究[J]. 余順坤,袁家海. 中國管理科學. 2006(02)
[3]多Agent系統(tǒng)研究綜述[J]. 李海剛,吳啟迪. 同濟大學學報(自然科學版). 2003(06)
[4]基于Agent的金融市場模型研究進展綜述[J]. 劉文財,劉豹,王啟文,張維. 系統(tǒng)工程學報. 2003(02)
[5]Linux下的漢字輸入法設(shè)計技術(shù)[J]. 李培峰,朱巧明,錢培德. 計算機應(yīng)用. 2002(06)
[6]拼寫糾正在拼音輸入法中的應(yīng)用[J]. 陳正,李開復. 計算機學報. 2001(07)
[7]面向Agent編程——編程技術(shù)的一次飛躍[J]. 程顯毅. 計算機科學. 2000(07)
[8]文字和通信[J]. 錢文浩. 科學通報. 1956(10)
博士論文
[1]基于自治與協(xié)商機制的柔性制造車間智能調(diào)度技術(shù)研究[D]. 王世進.上海交通大學 2008
[2]多Agent協(xié)商研究[D]. 姜麗.吉林大學 2007
碩士論文
[1]基于移動Agent的B2C電子商務(wù)協(xié)商模型研究[D]. 周赟.大連工業(yè)大學 2013
[2]常用漢字的結(jié)構(gòu)編碼與識別系統(tǒng)[D]. 黃書錦.復旦大學 2013
[3]中文輸入法若干相關(guān)問題研究[D]. 楊少華.上海交通大學 2013
[4]一種具有英漢輔助翻譯功能的拼音輸入法[D]. 李棟.廈門大學 2006
[5]漢字編碼輸入法研究[D]. 戴石麟.重慶大學 2005
本文編號:3412160
【文章來源】:西南大學重慶市 211工程院校 教育部直屬院校
【文章頁數(shù)】:77 頁
【學位級別】:碩士
【部分圖文】:
統(tǒng)計機器翻譯的典型翻譯模型
架有如下的特點:l 完全開源,使用 JAVA 語言開發(fā),平臺無關(guān);l 簡單、易用,用戶只用通過了解一些少量的配置文件,便可定制化自己訓練方案;l 可配置性,所有的參數(shù)均通過配置文件傳遞,方便管理;l 高度解耦的訓練流程,解碼器以及解碼過程用戶可以完全自定義,并運于外部進程中;自定義解碼結(jié)果的評價指標或者使用 Z-MERT 內(nèi)置的通用評價標;l 高度優(yōu)化的執(zhí)行過程,時間、空間等資源占用少。使用 Z-MERT 進行參數(shù)訓練時,用戶需要實現(xiàn)自己的解碼器,訓練過程中將解碼結(jié)果保存為文件,傳遞給 Z-MERT。解碼器對于 Z-MERT 框架是一個“盒”,Z-MERT 不關(guān)注解碼器的執(zhí)行過程。Z-MERT 內(nèi)部提供了豐富的評價指標以供用戶使用,用戶也可以實現(xiàn)平臺的接口自定義評價指標。參數(shù)訓練過程是碼、評價和調(diào)參的不斷迭代過程。這三個過程均可以執(zhí)行在各自獨立的進程中通過進程結(jié)束信號和文件相互傳遞信息。其基本過程可以描述為如下圖 2-2:
西南大學碩士學位論文不重不漏的拼音序列。一般切分的方式是基于已有的漢語拼音表進行查找,在拼音序列首尾分別設(shè)置一個指針,利用貪心算法搜索最長的拼音序列,直到首尾指針重合,停止搜索。本文將這種搜索方式稱為“最長拼音序列搜索算法”,算法過程的形式化描述見算法 1。2)音字、音詞表查詢基于第一步切分后的拼音序列列表,查找列表中每個拼音序列對應(yīng)的漢字列表,會得到一個漢字列表的列表。如圖 3-1 所示。
【參考文獻】:
期刊論文
[1]拼音輸入法經(jīng)驗對漢字字形和語音加工的影響[J]. 朱朝霞,劉麗,丁國盛,彭聃齡. 心理學報. 2009(09)
[2]基于多AGENT系統(tǒng)的電力合約市場協(xié)商平臺框架研究[J]. 余順坤,袁家海. 中國管理科學. 2006(02)
[3]多Agent系統(tǒng)研究綜述[J]. 李海剛,吳啟迪. 同濟大學學報(自然科學版). 2003(06)
[4]基于Agent的金融市場模型研究進展綜述[J]. 劉文財,劉豹,王啟文,張維. 系統(tǒng)工程學報. 2003(02)
[5]Linux下的漢字輸入法設(shè)計技術(shù)[J]. 李培峰,朱巧明,錢培德. 計算機應(yīng)用. 2002(06)
[6]拼寫糾正在拼音輸入法中的應(yīng)用[J]. 陳正,李開復. 計算機學報. 2001(07)
[7]面向Agent編程——編程技術(shù)的一次飛躍[J]. 程顯毅. 計算機科學. 2000(07)
[8]文字和通信[J]. 錢文浩. 科學通報. 1956(10)
博士論文
[1]基于自治與協(xié)商機制的柔性制造車間智能調(diào)度技術(shù)研究[D]. 王世進.上海交通大學 2008
[2]多Agent協(xié)商研究[D]. 姜麗.吉林大學 2007
碩士論文
[1]基于移動Agent的B2C電子商務(wù)協(xié)商模型研究[D]. 周赟.大連工業(yè)大學 2013
[2]常用漢字的結(jié)構(gòu)編碼與識別系統(tǒng)[D]. 黃書錦.復旦大學 2013
[3]中文輸入法若干相關(guān)問題研究[D]. 楊少華.上海交通大學 2013
[4]一種具有英漢輔助翻譯功能的拼音輸入法[D]. 李棟.廈門大學 2006
[5]漢字編碼輸入法研究[D]. 戴石麟.重慶大學 2005
本文編號:3412160
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/3412160.html
最近更新
教材專著