天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 搜索引擎論文 >

從Web獲取部分整體關(guān)系語料的方法

發(fā)布時(shí)間:2019-12-02 05:09
【摘要】:部分整體關(guān)系獲取是知識獲取中的重要組成部分。Web逐步成為知識獲取的重要資源之一。搜索引擎是從Web中獲取部分整體關(guān)系知識的有效手段之一,我們將Web中包含部分整體關(guān)系的檢索結(jié)果集合稱為部分整體關(guān)系語料。由于目前主流搜索引擎尚不支持語義搜索,如何構(gòu)造有效的查詢以得到富含部分整體關(guān)系的語料,從而進(jìn)一步獲取部分整體關(guān)系,就成為一個重要的問題。該文提出了一種新的查詢構(gòu)造方法,目的在于從Web中獲取部分整體關(guān)系語料。該方法能夠構(gòu)造基于語境詞的查詢,進(jìn)而利用現(xiàn)有的搜索引擎從Web中獲取部分整體關(guān)系語料。該方法在兩個方面與人工構(gòu)造查詢方法和基于語料庫查詢構(gòu)造查詢方法所獲取的語料進(jìn)行對比,其一是語料中含有部分整體關(guān)系的語句數(shù)量;二是從語料中進(jìn)一步獲取部分整體關(guān)系的難易程度。實(shí)驗(yàn)結(jié)果表明,該方法遠(yuǎn)遠(yuǎn)優(yōu)于后兩者。
【圖文】:

信息圖,關(guān)系語,查詢方法,方法


詢串關(guān)鍵詞的部分標(biāo)記為紅字,我們用斜體黑體表示這些匹配的部分。圖1中比較三種不同方法中獲取的部分整體關(guān)系語料中,含有部分整體關(guān)系語句的數(shù)量。由于人工構(gòu)造查詢方法獲取的部分整體關(guān)系語料是一種完全非結(jié)構(gòu)化的,因此不能利用查詢串提供的信息自動獲取其中的部分整體關(guān)系。圖2對比基于語料庫構(gòu)造查詢方法和意圖查詢方法獲取的部分整體關(guān)系數(shù)量。4.3 實(shí)驗(yàn)分析從圖1可以看出,在由返回的Top100項(xiàng)、Top200項(xiàng)、Top300項(xiàng)、Top400項(xiàng)和Top500項(xiàng)檢索結(jié)果組成的部分整體關(guān)系語料中,人工構(gòu)造查詢方法所獲取的各個語料中蘊(yùn)含部分整體關(guān)系的語句數(shù)量最少,意圖查詢方法獲取數(shù)量最多,且部分整體關(guān)系語料的規(guī)模越大,意圖查詢方法的優(yōu)勢越明顯。圖1 三種不同方法獲取的語料中含有部分整體關(guān)系的語句的數(shù)量在部分整體關(guān)系抽取難易方面

語義圖,信息圖,查詢方法,關(guān)系語


對于這種語料,我們能很容易的利用查詢串本身提供的信息,從中抽取出符合我們查詢本意的部分整體關(guān)系。通過圖2中的實(shí)驗(yàn)數(shù)據(jù)可以看出,對比基于語料庫構(gòu)造查詢方法,意圖查詢方法從獲取的部分整體關(guān)系語料中可以多獲取大約兩倍的部分整體關(guān)系。5 結(jié)束語目前人們使用搜索引擎作為從Web獲取知識的有效手段,但網(wǎng)上絕大多數(shù)搜索引擎都使用基于關(guān)鍵詞匹配的全文檢索技術(shù),不支持語義搜索。因?yàn)椴灰讓z索對象本身做出處理[4],我們只能對查詢串本身做出某些改變,使其接近我們需要的語義。故本文提出了一種新的用于從Web獲取部分整體關(guān)系語料的基于意圖的查詢構(gòu)造方法即意圖查詢方法。在查詢中加入與部分整體相關(guān)度高的語境詞,構(gòu)造新的查詢

【共引文獻(xiàn)】

相關(guān)期刊論文 前8條

1 余正濤,樊孝忠,宋麗榮;基于特定問題類別的漢語問答系統(tǒng)查詢擴(kuò)展[J];北京理工大學(xué)學(xué)報(bào);2005年10期

2 陳麗,于浩,鄭德權(quán),趙鐵軍;基于文本內(nèi)容的超鏈接分類研究[J];哈爾濱商業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版);2004年02期

3 鄭慶華,王朝靜,孫霞;一種基于結(jié)構(gòu)化語料庫的概念語義網(wǎng)絡(luò)自動生成算法[J];計(jì)算機(jī)研究與發(fā)展;2005年03期

4 張虎,鄭家恒,劉江;語料庫詞性標(biāo)注一致性檢查方法研究[J];中文信息學(xué)報(bào);2004年05期

5 康海燕,李彥芳,林培光,樊孝忠;信息檢索策略性能的云模型評價(jià)方法[J];中文信息學(xué)報(bào);2005年01期

6 呂碧波;趙軍;;基于相關(guān)文檔池建模的查詢擴(kuò)展[J];中文信息學(xué)報(bào);2006年03期

7 左家莉,王明文,王希;基于Markov網(wǎng)絡(luò)的信息檢索擴(kuò)展模型[J];清華大學(xué)學(xué)報(bào)(自然科學(xué)版);2005年S1期

8 李智,李敏強(qiáng);基金項(xiàng)目評審管理中智能交互式文檔檢索[J];研究與發(fā)展管理;2005年03期

相關(guān)博士學(xué)位論文 前3條

1 李智;機(jī)器學(xué)習(xí)方法及其在基金項(xiàng)目評審中的應(yīng)用研究[D];天津大學(xué);2004年

2 潘旭偉;集成情境知識管理中幾個關(guān)鍵技術(shù)的研究[D];浙江大學(xué);2005年

3 王樹梅;信息檢索相關(guān)技術(shù)研究[D];南京理工大學(xué);2007年

相關(guān)碩士學(xué)位論文 前9條

1 代學(xué)武;基于神經(jīng)網(wǎng)絡(luò)的用戶建模和Web信息過濾研究[D];西南師范大學(xué);2003年

2 杭月芹;基于文檔查詢信息的檢索系統(tǒng)研究與實(shí)現(xiàn)[D];揚(yáng)州大學(xué);2005年

3 吳煒;基于用戶日志的信息檢索研究[D];同濟(jì)大學(xué);2006年

4 張波;個性化Web搜索系統(tǒng)研究[D];燕山大學(xué);2006年

5 謝翠華;基于概念格的Web文本管理研究[D];揚(yáng)州大學(xué);2006年

6 盛俊;潛在語義的Markov網(wǎng)絡(luò)檢索模型的研究[D];江西師范大學(xué);2006年

7 余超;基于知網(wǎng)的詞匯語義計(jì)算研究及應(yīng)用[D];沈陽航空工業(yè)學(xué)院;2007年

8 藕軍;Deep Web搜索引擎的關(guān)鍵技術(shù)[D];合肥工業(yè)大學(xué);2007年

9 馮運(yùn);信息檢索中的查詢算法研究[D];湖南大學(xué);2007年

【二級參考文獻(xiàn)】

相關(guān)期刊論文 前1條

1 袁毓林;計(jì)算語言學(xué)的理論方法和研究取向[J];中國社會科學(xué);2001年04期

,

本文編號:2568651

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2568651.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶aa029***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com