天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 社科論文 > 圖書檔案論文 >

面向信息檢索的漢語同義詞自動識別

發(fā)布時間:2020-07-16 15:12
【摘要】:同義詞的自動發(fā)現(xiàn)和識別在信息檢索領(lǐng)域有著重要的研究意義和應(yīng)用價值,在自動標引、自動分類、機器翻譯以及知識組織系統(tǒng)的互操作中,也起著重要的作用。 國外還沒有對同義詞的自動識別進行專門的研究,已有的研究只是側(cè)重于詞匯語義相似度的計算,其用途和目的并不是專門用于識別同義詞。在國內(nèi),對于漢語同義詞識別的研究才剛剛開始,主要側(cè)重于基于詞匯字面相似度的方法和基于義類詞典的語義相似度方法。 為了提高同義詞自動識別的效率,本文提出了從詞典釋義中自動發(fā)現(xiàn)和識別同義詞的方法,使用超鏈接分析算法和模式匹配算法,從不同的角度提取同義詞:第一部分是把詞匯之間注釋與被注釋的關(guān)系看成是一種鏈接關(guān)系,對給定的詞匯進行分析,把與給定詞匯具有鏈接關(guān)系的所有相關(guān)詞匯構(gòu)造一個詞匯圖,圖中的每一個結(jié)點代表相關(guān)詞,每條弧代表了詞匯之間注釋與被注釋的關(guān)系,如果詞匯A的注釋中出現(xiàn)了詞匯B,那么在圖中就有一條從B指向A的弧。然后我們利用超鏈接分析方法并結(jié)合PageRank算法,計算詞匯的PageRank值,把PageRank值看成是體現(xiàn)詞匯之間語義相似性的衡量指標,最后為每一個詞匯生成候選同義詞集,并通過一定的篩選原則和方法,推薦出最佳的同義詞。第二部分是利用詞匯定義模式,對詞匯的釋義方式進行分析,歸納總結(jié)出在詞典釋義中同義詞出現(xiàn)的模式,進而利用模式匹配方法獲取同義詞。此外,利用模式匹配方法對Web網(wǎng)頁和期刊論文中的同義詞也進行了提取測試。 最后,利用VB.NET、SQL Server 2000、ASP等開發(fā)工具實現(xiàn)了基于詞典釋義的漢語同義詞自動識別系統(tǒng)、并對系統(tǒng)運行結(jié)果進行了測試。測試結(jié)果表明,利用模式匹配和超鏈接分析方法來自動發(fā)現(xiàn)同義詞具有可行性和實用性。 本研究中實現(xiàn)的系統(tǒng)尚處于實驗階段,有待進一步的完善。今后的研究包括:引入機器學(xué)習(xí)方法,自動獲取模式;完善抽詞詞典、擴大語料的類別和規(guī)模等。
【學(xué)位授予單位】:南京農(nóng)業(yè)大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2005
【分類號】:G354
【圖文】:

《中圖法》,類目,電子版,格式


字段是涵義注釋字段、上下位類是560字段。數(shù)據(jù)的表示規(guī)范化、結(jié)構(gòu)化,為語料的分析和模式匹配處理帶來了方便。在《中圖法》中,類目(以類目“數(shù)量經(jīng)濟學(xué)”為例)的MARC格式如圖3一3:圖3一電子版《中圖法》類目的M人RC格式

同義詞,自動識別系統(tǒng),主界面,詞表


簽簽簽簽簽簽簽簽?zāi)DDL崽崽崽崽嵝扌奘绞绞绞绞绞绞绞绞绞饺∪∪∪∪「母膱D6一SW七b網(wǎng)頁同義詞自動識別模塊6.3同義詞自動識別系統(tǒng)的開發(fā)環(huán)境和使用6.3.1系統(tǒng)的開發(fā)環(huán)境和開發(fā)工具開發(fā)工具和平臺:VB.NET(.NET平臺)數(shù)據(jù)庫:sQLSevrer2000W已b服務(wù)器:Intenr改InofmrationSevrer5.06.3.2系統(tǒng)的界面簡介系統(tǒng)的主程序是一個典型的CS/結(jié)構(gòu)的系統(tǒng)。其主界面如圖6一6:圖6一6同義詞自動識別系統(tǒng)主界面各個菜單包括以下功能:(1)在“文件”菜單下,包括“系統(tǒng)配置”和“系統(tǒng)初始化”兩個子菜單。(2)在“自動處理”菜單下,包括“數(shù)據(jù)導(dǎo)入”、“模式匹配提取”、“匹配結(jié)果整理”、“詞匯關(guān)系推導(dǎo)”及“RP提取…”五個子菜單。(3)在“詞表維護”菜單下,包括“Web配置”、“詞表查詢”、“詞表瀏覽”及“詞表維護”四個子菜單。

對話框,篩選參數(shù),對話框,同義詞


3.4同義詞識別系統(tǒng)的系統(tǒng)配置和閡值參數(shù)設(shè)定同義詞識別系統(tǒng)的配置主要包括兩部分:一是系統(tǒng)配置,點擊“文件”菜單下的“系統(tǒng)配置”進入系統(tǒng)參數(shù)設(shè)置界面,如圖6一7。在系統(tǒng)進行同義詞識別任務(wù)前,首先必須進行程序初始化參數(shù)的設(shè)置,其中包括對抽詞詞典、篩選詞詞典的存放路徑的設(shè)置以及對數(shù)據(jù)庫訪問的有關(guān)信息(包括用戶名和密碼)的初始設(shè)置。二是有關(guān)詞表Web訪問的配置。點擊“web”菜單下的“web設(shè)置”,則進入詞表Web管理的參數(shù)設(shè)置界面(如圖6一8):包括提供V觸b服務(wù)的服務(wù)器的Pl地址,訪問端口號以及數(shù)據(jù)接口信息等等。圖6一,同義詞識別系統(tǒng)配置對話框圖6一8同義詞表維護配置對話框同義詞識別系統(tǒng)的閉值設(shè)定主要用來設(shè)置同義詞篩選參數(shù),包括:PgaeRakn相對值指標的閉值,詞匯字面相似度的閉值等等。點擊“自動處理…”一“PgaeRakn提取識別”菜單下的“閉值設(shè)定”進入同義詞篩選閉值的參數(shù)設(shè)置界面

【引證文獻】

相關(guān)期刊論文 前10條

1 衡中青;侯漢清;;地方志中基于模式匹配的物產(chǎn)異名別稱表達方式研究[J];圖書館理論與實踐;2009年12期

2 魯萍;蘇變萍;侯筱婷;;建設(shè)法規(guī)政策知識庫中后控詞表檢索設(shè)計[J];計算機工程與設(shè)計;2007年12期

3 仲云云;侯漢清;杜慧平;;電子政務(wù)主題詞表的自動構(gòu)建研究[J];中國索引;2008年02期

4 杜慧平;;概念等級關(guān)系自動識別研究[J];中國索引;2010年03期

5 徐偉偉;賀玢;劉清水;;面向知識組織的術(shù)語數(shù)據(jù)庫詞間關(guān)系構(gòu)建研究——以農(nóng)業(yè)機械化術(shù)語數(shù)據(jù)庫為例[J];標準科學(xué);2013年05期

6 黃芳;劉友華;張克狀;李寅;;結(jié)合鏈接結(jié)構(gòu)和共現(xiàn)分析的同義詞自動識別方法[J];現(xiàn)代情報;2009年08期

7 劉友華;黃芳;張克狀;李寅;;基于鏈接結(jié)構(gòu)和共現(xiàn)分析識別同義詞的改進方法[J];信息系統(tǒng)學(xué)報;2009年02期

8 仲云云;侯漢清;杜慧平;;電子政務(wù)主題詞表自動構(gòu)建研究[J];中國圖書館學(xué)報;2008年03期

9 劉華梅;侯漢清;;敘詞表互操作技術(shù)研究——教育集成詞庫的試驗[J];中國圖書館學(xué)報;2008年05期

10 陸勇;章成志;侯漢清;;基于百科資源的多策略中文同義詞自動抽取研究[J];中國圖書館學(xué)報;2010年01期

相關(guān)博士學(xué)位論文 前6條

1 薛春香;農(nóng)史知識組織系統(tǒng)構(gòu)建與應(yīng)用研究[D];南京農(nóng)業(yè)大學(xué);2006年

2 常娥;古籍智能處理技術(shù)研究[D];南京農(nóng)業(yè)大學(xué);2007年

3 何琳;古農(nóng)學(xué)本體的半自動構(gòu)建及檢索研究[D];南京農(nóng)業(yè)大學(xué);2007年

4 李華;面向知識服務(wù)的傳統(tǒng)農(nóng)具數(shù)字博物館設(shè)計與構(gòu)建[D];南京農(nóng)業(yè)大學(xué);2008年

5 劉竟;面向概念檢索的農(nóng)史信息門戶的設(shè)計與構(gòu)建[D];南京農(nóng)業(yè)大學(xué);2008年

6 張少英;同義心理活動動詞解析模式研究[D];北京大學(xué);2013年

相關(guān)碩士學(xué)位論文 前5條

1 宋宇軒;基于搜索日志和點擊日志的同義詞挖掘的研究和實現(xiàn)[D];北京交通大學(xué);2011年

2 張宗仁;基于自然語言理解的本體語義信息檢索[D];暨南大學(xué);2011年

3 劉華梅;基于情報檢索語言互操作技術(shù)的集成詞庫構(gòu)建研究[D];南京農(nóng)業(yè)大學(xué);2006年

4 杜慧平;自然語言敘詞表自動構(gòu)建研究[D];南京農(nóng)業(yè)大學(xué);2007年

5 仲云云;電子政務(wù)主題詞表的構(gòu)建及應(yīng)用研究[D];南京農(nóng)業(yè)大學(xué);2007年



本文編號:2758159

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/tushudanganlunwen/2758159.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶1e0ca***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com