泰語(yǔ)句子相似度計(jì)算研究
本文選題:向量模型 + 句子語(yǔ)義 ; 參考:《昆明理工大學(xué)》2017年碩士論文
【摘要】:泰語(yǔ)句子相似度計(jì)算是信息處理領(lǐng)域的問(wèn)題之一,隨著國(guó)家“一帶一路”戰(zhàn)略的實(shí)施,我國(guó)與東南亞國(guó)家經(jīng)濟(jì)交往越來(lái)越密切,而泰國(guó)是東南亞地區(qū)重要國(guó)家之一,因此基于泰語(yǔ)的自然語(yǔ)言處理研究非常重要。泰語(yǔ)句子相似度計(jì)算在多個(gè)領(lǐng)域有廣泛的應(yīng)用,特別是泰語(yǔ)機(jī)器翻譯以及專家系統(tǒng)領(lǐng)域,相似度計(jì)算是不可或缺的部分。在泰語(yǔ)句子相似度計(jì)算方法的研究過(guò)程中,本文從泰語(yǔ)句子的關(guān)鍵詞、知網(wǎng)的語(yǔ)義、WordNet語(yǔ)料庫(kù)的語(yǔ)義三個(gè)方面的特征進(jìn)行了研究,針對(duì)以上的三個(gè)方面,本文提出了一種融合多特征的泰語(yǔ)句子相似度計(jì)算方法。最后,我們?cè)O(shè)計(jì)和實(shí)現(xiàn)了一個(gè)泰語(yǔ)句子相似度計(jì)算的應(yīng)用系統(tǒng),本文完成的主要工作有以下幾個(gè)方面:1.深入分析了泰語(yǔ)句子相似度計(jì)算以及向量空間模型,設(shè)計(jì)了泰語(yǔ)分詞的方法,并且利用此方法實(shí)現(xiàn)了泰語(yǔ)句子相似度計(jì)算的系統(tǒng)。2.研究了泰語(yǔ)詞匯語(yǔ)義相似度及其計(jì)算方法。句子由詞匯結(jié)合特定的語(yǔ)法規(guī)則構(gòu)成,因此詞語(yǔ)的相似度計(jì)算技術(shù)是研究句子相似度計(jì)算的基礎(chǔ),因此研究詞語(yǔ)的相似度計(jì)算具有非常重要的意義。3.對(duì)現(xiàn)有的文本相似度計(jì)算技術(shù)進(jìn)行了研究和分析,其中重點(diǎn)研究WordNet為語(yǔ)義知識(shí)庫(kù)著重計(jì)算機(jī)對(duì)泰文句子的語(yǔ)義分析技術(shù)。4.設(shè)計(jì)實(shí)現(xiàn)了一個(gè)基于泰語(yǔ)句子相似度計(jì)算的系統(tǒng),并用該系統(tǒng)設(shè)計(jì)實(shí)驗(yàn)驗(yàn)證了本文提出的泰語(yǔ)句子相似度計(jì)算方法的效率。
[Abstract]:The calculation of Thai sentence similarity is one of the problems in the field of information processing. With the implementation of the national "Belt and Road" strategy, the economic exchanges between China and Southeast Asian countries are getting closer and closer, and Thailand is one of the important countries in Southeast Asia. Therefore, the study of natural language processing based on Thai is very important. The calculation of Thai sentence similarity is widely used in many fields, especially in the field of Thai machine translation and expert system. In the course of studying the method of calculating the similarity of Thai sentences, this paper studies the features of the key words of Thai sentences and the semantic features of WordNet corpus, aiming at the above three aspects. In this paper, a method for calculating the similarity of Thai sentences with multiple features is proposed. Finally, we design and implement a Thai sentence similarity calculation application system. The main work of this paper is as follows: 1. This paper deeply analyzes Thai sentence similarity calculation and vector space model, designs the method of Thai word segmentation, and realizes the system of calculating Thai sentence similarity by using this method. The semantic similarity of Thai vocabulary and its calculation method are studied. Sentences are composed of words combined with specific grammatical rules, so the technology of word similarity calculation is the basis of sentence similarity calculation, so the study of word similarity calculation is of great significance. The existing text similarity computing techniques are studied and analyzed, in which WordNet is the semantic knowledge base and the computer semantic analysis technology for Thai sentences. A system based on Thai sentence similarity calculation is designed and implemented, and the efficiency of the proposed method is verified by the design of the system.
【學(xué)位授予單位】:昆明理工大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2017
【分類號(hào)】:TP391.1
【參考文獻(xiàn)】
相關(guān)期刊論文 前10條
1 邊振興;;WordNet中概念語(yǔ)義相似度IC參數(shù)模型研究[J];計(jì)算機(jī)工程與應(yīng)用;2011年19期
2 陳沈焰;吳軍華;;基于本體的概念語(yǔ)義相似度計(jì)算及其應(yīng)用[J];微電子學(xué)與計(jì)算機(jī);2008年12期
3 顏端武;成曉;甘利人;;基于領(lǐng)域本體和概念向量的中文文本相似性測(cè)度研究[J];中國(guó)圖書館學(xué)報(bào);2007年06期
4 楊憲澤;張上游;李建陽(yáng);;信息檢索的基本方法與發(fā)展研究[J];西南民族大學(xué)學(xué)報(bào)(自然科學(xué)版);2007年03期
5 李鵬;陶蘭;王弼佐;;一種改進(jìn)的本體語(yǔ)義相似度計(jì)算及其應(yīng)用[J];計(jì)算機(jī)工程與設(shè)計(jì);2007年01期
6 劉斌;陳樺;;向量空間模型信息檢索技術(shù)討論[J];情報(bào)雜志;2006年07期
7 張劍;李春平;;基于WordNet概念向量空間模型的文本分類[J];計(jì)算機(jī)工程與應(yīng)用;2006年04期
8 金博,史彥軍,滕弘飛;基于語(yǔ)義理解的文本相似度算法[J];大連理工大學(xué)學(xué)報(bào);2005年02期
9 劉曉義,王培東,周洪玉;基于知識(shí)處理重型切削數(shù)據(jù)庫(kù)的設(shè)計(jì)與實(shí)現(xiàn)[J];哈爾濱理工大學(xué)學(xué)報(bào);2004年01期
10 呂學(xué)強(qiáng),任飛亮,黃志丹,姚天順;句子相似模型和最相似句子查找算法[J];東北大學(xué)學(xué)報(bào);2003年06期
相關(guān)碩士學(xué)位論文 前1條
1 蔡剛山;中文自動(dòng)問(wèn)答系統(tǒng)研究[D];華中科技大學(xué);2007年
,本文編號(hào):1920178
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1920178.html