天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 社科論文 > 圖書檔案論文 >

基于知網(wǎng)的多關(guān)鍵字檢索研究

發(fā)布時(shí)間:2020-04-14 01:10
【摘要】: 隨著因特網(wǎng)信息的飛速膨脹,網(wǎng)絡(luò)成為人們獲取信息的主要渠道,而信息檢索也成為人們上網(wǎng)的主要目的之一。但是,如何從這樣一個(gè)龐大的信息資源庫(kù)中獲取需要的準(zhǔn)確信息,已成為人們面臨的一個(gè)重要問題,F(xiàn)有的搜索引擎往往采用機(jī)械式的字符串匹配的搜索技術(shù),在處理單一關(guān)鍵詞時(shí),基本可以滿足用戶要求,但在處理多關(guān)鍵詞時(shí),問題就出現(xiàn)了。首先,由于只是基于字符串匹配,使得位置靠后的關(guān)鍵詞很可能被忽略掉。再者,即使多個(gè)關(guān)鍵詞都匹配到,但沒有注重關(guān)鍵詞的各自的重要度,從而導(dǎo)致檢索結(jié)果與用戶意圖不符,降低查詢的準(zhǔn)確度。 在處理多關(guān)鍵詞時(shí),需要一個(gè)強(qiáng)大的知識(shí)庫(kù)的支持!吨W(wǎng)》是一個(gè)以漢語(yǔ)和英語(yǔ)的詞語(yǔ)所代表的概念為描述對(duì)象,以揭示概念與概念之間以及概念所具有的屬性之間的關(guān)系為基本內(nèi)容的常識(shí)知識(shí)庫(kù)。它為自然語(yǔ)言信息處理的研發(fā)提供了豐富的知識(shí)資源。因此,本文選定《知網(wǎng)》來實(shí)現(xiàn)多關(guān)鍵詞的處理,使得檢索不再是簡(jiǎn)單的基于關(guān)鍵詞的機(jī)械式匹配,而是注重關(guān)鍵詞間的語(yǔ)義關(guān)系,用以解決當(dāng)前搜索引擎查準(zhǔn)率低的問題。 本文認(rèn)真研究《知網(wǎng)》后提出了基于知網(wǎng)的多關(guān)鍵詞知曉模型,模型主要包括三大模塊的實(shí)現(xiàn):詞義消歧模塊、語(yǔ)義關(guān)系知曉模塊、復(fù)合詞處理模塊。詞義消歧模塊:一詞多義是制約語(yǔ)義關(guān)系知曉的重要因素。因此,本文提出了影響相關(guān)度的五種因素,并通過計(jì)算多關(guān)鍵詞的語(yǔ)義相關(guān)度進(jìn)行詞義消歧。語(yǔ)義關(guān)系知曉模塊:根據(jù)漢語(yǔ)的特點(diǎn),本文提出了八種多關(guān)鍵詞語(yǔ)義關(guān)系、核心關(guān)鍵詞與分級(jí)權(quán)重,并根據(jù)不同的語(yǔ)義關(guān)系設(shè)置不同的分級(jí)權(quán)重,以提高查詢的準(zhǔn)確度。復(fù)合詞處理模塊:對(duì)于《知網(wǎng)》中未出現(xiàn)的詞語(yǔ),即復(fù)合詞,本文基于語(yǔ)義關(guān)系知曉提出了概念組合法,以確定復(fù)合詞義原表示項(xiàng),并解決了復(fù)合詞無法參與語(yǔ)義關(guān)系判斷的難題。 為了驗(yàn)證模型的合理性,本文分別對(duì)三個(gè)模塊進(jìn)行了實(shí)驗(yàn),并結(jié)合多關(guān)鍵詞的知曉技術(shù)設(shè)計(jì)了一個(gè)元搜索引擎檢索模型。從實(shí)驗(yàn)結(jié)果來看,基于知網(wǎng)的多關(guān)鍵詞知曉模型在搜索引擎中的應(yīng)用是可行的,提高了搜索引擎的查準(zhǔn)率。
【圖文】:

知識(shí)架構(gòu),知網(wǎng)


圖 3.1 知網(wǎng)的知識(shí)架構(gòu)Fig.3.1 Knowledge frame of HowNet知網(wǎng)中有兩個(gè)主要的概念:“概念”與“義原”。“概念”是對(duì)詞匯語(yǔ)義的一種描述。每一個(gè)詞可以表達(dá)為幾個(gè)概念!案拍睢笔怯靡环N“知識(shí)表示語(yǔ)言”來描述的,這種“知識(shí)表示語(yǔ)言”所用的“詞匯”叫做“義原”。什么是義原,跟什么是詞一樣難以定義。但是也跟詞一樣并不因?yàn)樗y于定義人們就無法把握和利用它們。大體上說,義原是最基本的、不易于再分割的意義的最小單位。例如:“人”雖然是一個(gè)非常復(fù)雜的概念,它可以是多種屬性的集合體,但也可以把它看作為一個(gè)義原?梢赃@樣設(shè)想,所有的概念都可以分解成各種各樣的義原,同時(shí)也應(yīng)該有一個(gè)有限的義原集合,其中的義原組合成一個(gè)無限的概念集合。如果能夠把握這一有限的義原集合,并利用它來描述概念之間的關(guān)系以及屬性與屬性之間的關(guān)系,就有可能建立知識(shí)系統(tǒng)。利用中文來尋求這個(gè)有限的集合,應(yīng)該說是個(gè)捷徑。中文中的字(包括單純?cè)~)是有限的,并且它可以被用來表達(dá)各種各樣的單純的或復(fù)雜的概念,以及表達(dá)概念與概念之間、概念

知識(shí)網(wǎng)絡(luò),體系,知網(wǎng)


為過去、現(xiàn)在和未來。沒有一種事物只能是部件,,而不能是整體;也沒有一種事物只能是整體,而不會(huì)是部件。一個(gè)事物被視為是整體還是部件,可以因系統(tǒng)的不同,而不同對(duì)待。關(guān)于對(duì)屬性的認(rèn)識(shí)是:任何一個(gè)事物都一定包含著多種屬性事物之間的異或同是由屬性決定的,沒有了屬性就沒有了事物。知網(wǎng)中含有豐富的詞匯語(yǔ)義知識(shí)和世界知識(shí),為自然語(yǔ)言處理和機(jī)器翻譯等方面的研究提供了寶貴的資源。計(jì)算機(jī)化是知網(wǎng)的重要特色。知網(wǎng)是面向計(jì)算機(jī)的,是借助于計(jì)算機(jī)建立的,將來可能是計(jì)算機(jī)的智能構(gòu)件。知網(wǎng)是一個(gè)網(wǎng)而不是樹。它所著力要反映的是概念的共性和個(gè)性,例如:對(duì)于“醫(yī)生”和“患者”,“人”是它們的共性。知網(wǎng)在主要特性文件中描述了“人”所具有的共性,那么“醫(yī)生”的個(gè)性是他是“醫(yī)治”的施事,而“患者”的個(gè)性是他是“患病的經(jīng)驗(yàn)者。對(duì)于“富翁”和“窮人”,“美女”和“丑八怪”而言,“人”是它們的共性。而它們的個(gè)性,即:“貧”、“富”與“美”、“丑”等不同的屬性值,則是它們的個(gè)性。同時(shí)知網(wǎng)還著力要反映概念之間和概念的屬性之間的各種關(guān)系。知網(wǎng)把下面的一種知識(shí)網(wǎng)絡(luò)體系明確的教給了計(jì)算機(jī)進(jìn)而使知識(shí)對(duì)計(jì)算機(jī)而言是可操作的。
【學(xué)位授予單位】:重慶大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2008
【分類號(hào)】:G250.74;G354

【參考文獻(xiàn)】

相關(guān)期刊論文 前10條

1 許云,樊孝忠,張鋒;基于知網(wǎng)的語(yǔ)義相關(guān)度計(jì)算[J];北京理工大學(xué)學(xué)報(bào);2005年05期

2 金博,史彥軍,滕弘飛;基于語(yǔ)義理解的文本相似度算法[J];大連理工大學(xué)學(xué)報(bào);2005年02期

3 孫繼明;李舟軍;文健;;基于《知網(wǎng)》的漢語(yǔ)詞語(yǔ)詞義消歧方法[J];計(jì)算機(jī)與信息技術(shù);2007年03期

4 張曉剛,李明樹;智能搜索引擎技術(shù)的研究與發(fā)展[J];計(jì)算機(jī)工程與應(yīng)用;2001年24期

5 李素建;基于語(yǔ)義計(jì)算的語(yǔ)句相關(guān)度研究[J];計(jì)算機(jī)工程與應(yīng)用;2002年07期

6 陳偉雄,馬少平,步建華;基于元搜索引擎的多關(guān)鍵詞檢索技術(shù)[J];計(jì)算機(jī)工程與應(yīng)用;2004年24期

7 夏天;;漢語(yǔ)詞語(yǔ)語(yǔ)義相似度計(jì)算研究[J];計(jì)算機(jī)工程;2007年06期

8 龔永恩;袁春風(fēng);武港山;;基于語(yǔ)義的詞義消歧算法初探[J];計(jì)算機(jī)應(yīng)用研究;2006年03期

9 楊曉峰,李堂秋,洪青陽(yáng);基于實(shí)例的漢語(yǔ)句法結(jié)構(gòu)分析歧義消解[J];中文信息學(xué)報(bào);2001年03期

10 李峰;李芳;;中文詞語(yǔ)語(yǔ)義相似度計(jì)算——基于《知網(wǎng)》2000[J];中文信息學(xué)報(bào);2007年03期

相關(guān)碩士學(xué)位論文 前2條

1 王廣正;基于知網(wǎng)語(yǔ)義相關(guān)度計(jì)算的漢語(yǔ)自動(dòng)分詞方法的研究[D];云南師范大學(xué);2006年

2 李佳;基于知網(wǎng)的中文本體映射研究[D];北京郵電大學(xué);2007年



本文編號(hào):2626675

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/tushudanganlunwen/2626675.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶049fc***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com