天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 搜索引擎論文 >

基于Ontology的個(gè)性化元搜索引擎研究.pdf

發(fā)布時(shí)間:2016-06-27 05:04

  本文關(guān)鍵詞:基于Ontology的個(gè)性化元搜索引擎研究,由筆耕文化傳播整理發(fā)布。


網(wǎng)友12344近日為您收集整理了關(guān)于基于Ontology的個(gè)性化元搜索引擎研究的文檔,,希望對(duì)您的工作和學(xué)習(xí)有所幫助。以下是文檔介紹:第!"卷第#期蘇州大學(xué)學(xué)報(bào)(工科版) $%&’!"(%’#!))"年*月!"#$%&’"()""*+", #%-./$)-01(/%2-%//$-%2)*-/%*//3-0-"%) +,-!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!’!))"文章編號(hào):./012)#03(!))"))#2)))/2)1基于 456%&%-7的個(gè)性化元搜索引擎研究"崔志明.,黃國(guó)景.,劉文杰!(.’蘇州大學(xué)智能信息處理及應(yīng)用研究所,江蘇蘇州!."))/;!’蘇州大學(xué)機(jī)電工程學(xué)院,江蘇蘇州!.")!.)摘要:文中提出了一種新的基于 456%&%-7的個(gè)性化元搜索引擎系統(tǒng)模型,包括基于 456%&%-7的用戶描述文件的表達(dá)方法和自動(dòng)隱式學(xué)習(xí)算法,以及基于 456%&%-7的查詢結(jié)果合成算法,全面地描述了系統(tǒng)三層結(jié)構(gòu)以及用戶個(gè)性化搜索處理過(guò)程。關(guān)鍵詞:456%&%-7;個(gè)性化;元搜索引擎;用戶描述文件;合成中圖分類號(hào):891:1 文獻(xiàn)標(biāo)識(shí)碼:+4 引言搜索引擎(;<=>?@A5-B5<,;A)已成為人們檢索信息的重要工具。新一代具有智能的搜索引擎已成為當(dāng)前研究的熱點(diǎn),它將更準(zhǔn)確、更全面地滿足不同要求、不同興趣的用戶需求,為用戶提供高質(zhì)量和高效率的個(gè)性化服務(wù)[.]。本文提出了一個(gè)基于456%&%-7的個(gè)性化元搜索引擎系統(tǒng)模型。模型以現(xiàn)有搜索引擎為基礎(chǔ),利用456%&%-7工具,結(jié)合元搜索引擎的較好的擴(kuò)展性和彌補(bǔ)單個(gè)搜索引擎缺陷等優(yōu)點(diǎn),可以很大程度上提高檢索的效率[!],更好地為用戶提供個(gè)性化智能檢索服務(wù)。4’5 456%&%-7C>,D<>把 456%&%-7定義為概念模型的明確的規(guī)范說(shuō)明。456%&%-7本質(zhì)上是概念模型,用來(lái)表達(dá)概念與概念之間的關(guān)系,獲得并提供領(lǐng)域知識(shí)的共同理解。456%&%-7作為元數(shù)據(jù)結(jié)構(gòu)(E<6=F=6=G?@<E=G),提供一種可控的概念辭典,其中每個(gè)概念都有清晰的形式化定義。456%&%-7由詞條描述和它們之間的關(guān)系組成(通過(guò)本體語(yǔ)言來(lái)描述),可以通過(guò)基于關(guān)鍵詞的推理和檢索456%&%-7來(lái)獲得更多的相關(guān)信息。大量的研究[1]活躍在該領(lǐng)域中,H1I為此推出了語(yǔ)義互聯(lián)網(wǎng)中本體描述語(yǔ)言推薦標(biāo)準(zhǔn) 4HJ(H<D45K6%&%-7J=5-,=-<)。4HJ采用面向?qū)ο蟮姆绞絹?lái)描述領(lǐng)域知識(shí),并通過(guò)公理(+LB%EG)來(lái)描述知識(shí)的特征和它們之間的關(guān)系。它能清晰地表達(dá)詞匯表中詞條(8<>E)的含義以及詞條之間的關(guān)系。本文的相關(guān)工作也將基于此進(jìn)行。4’6 元搜索引擎元搜索引擎是一種沒(méi)有自己的索引數(shù)據(jù)庫(kù),利用已有的搜索引擎的搜索結(jié)果,經(jīng)過(guò)信息處理,以友好的方式把搜索結(jié)果顯示給用戶的一種搜索引擎。即元搜索引擎向其他獨(dú)立搜索引擎發(fā)送處理過(guò)的用戶查詢請(qǐng)求,然后把它們的搜索結(jié)果按照一定的算法合成后返回給用戶。元搜索引擎的關(guān)鍵工作有:成員搜索引擎的選擇,結(jié)果合成算法,檢索結(jié)果的擴(kuò)展處理。5 系統(tǒng)基本結(jié)構(gòu)本系統(tǒng)模型設(shè)計(jì)為三層結(jié)構(gòu),最上層為用戶界面,中間層為查詢個(gè)性化處理,最底層為查詢分發(fā)收集,如圖.所示。下面分別對(duì)它們進(jìn)行詳細(xì)闡述。5’5 用戶界面" 收稿日期:!))"2)12)1作者簡(jiǎn)介:崔志明(.:/.2),男,教授,博士生導(dǎo)師,主要研究方向?yàn)橹悄芑畔⑻幚怼⒂?jì)算機(jī)網(wǎng)絡(luò)應(yīng)用與數(shù)據(jù)庫(kù)應(yīng)用。基金項(xiàng)目:教育部“高校博士學(xué)科點(diǎn)科研基金項(xiàng)目”(編號(hào)!))#)!*")./)。萬(wàn)方數(shù)據(jù)圖! 系統(tǒng)基本結(jié)構(gòu)用戶界面為用戶提供方便的查詢接口,用戶不需要對(duì)復(fù)雜的搜索引擎的語(yǔ)法進(jìn)行研究,只需使用最通用的邏輯表達(dá)式;提供用戶反饋區(qū),用戶可以檢查、修改或確認(rèn)系統(tǒng)對(duì)查詢請(qǐng)求的理解。用戶界面的另一主要功能用于顯示搜索結(jié)果。系統(tǒng)的用戶界面統(tǒng)一簡(jiǎn)單,而且系統(tǒng)還可以屏蔽成員搜索引擎結(jié)果中的廣告等冗余信息,提高用戶瀏覽的效率。!"" 查詢個(gè)性化處理查詢個(gè)性化處理是實(shí)現(xiàn)搜索個(gè)性化部分的核心層,主要包括查詢請(qǐng)求分析、合成及擴(kuò)展處理、學(xué)習(xí)、#$%&’&()管理接口等模塊。" 個(gè)性化處理及相關(guān)算法""! #$%&’&()和用戶描述文件(*+,-.-&/0’,)#$%&’&()的創(chuàng)建和管理[1]是一個(gè)費(fèi)時(shí)復(fù)雜的工作,但是#$%&’&()的準(zhǔn)確合理程度將直接影響到系統(tǒng)搜索的結(jié)果,是實(shí)現(xiàn)整個(gè)系統(tǒng)的基礎(chǔ)。用戶描述文件是用來(lái)刻畫用戶特征與用戶之間關(guān)系的。為了跟蹤用戶的興趣和行為,系統(tǒng)為每個(gè)用戶建立一個(gè)用戶描述文件。""" 學(xué)習(xí)本系統(tǒng)模型結(jié)合顯式方式,以自動(dòng)隱示學(xué)習(xí)方式為主。其中對(duì)用戶描述文件的自動(dòng)隱示學(xué)習(xí)算法描述如下:算法! 用戶描述文件自動(dòng)隱示學(xué)習(xí)算法。! 收集用戶訪問(wèn)過(guò)的歷史頁(yè)面及相關(guān)行為信息;" 對(duì)頁(yè)面進(jìn)行預(yù)處理,去除停用詞(2%&34&-5+),抽取頁(yè)面中的詞干(4&-52%,660$(),并生成文檔的特征向量,其中向量的每個(gè)元素表示一個(gè)帶有權(quán)值的詞條;# 采用基于向量空間模型的78!9:8算法參照#$%&’&()中的概念把文檔分類;$ 計(jì)算分類后的文檔和概念之間的余弦相似度(;&+0$,2060’<-0%)),把計(jì)算結(jié)果降冪排列;% 假設(shè)給出的用戶感興趣領(lǐng)域的設(shè)定值為=,則把計(jì)算結(jié)果的前=個(gè)概念添加到用戶描述文件中,已存在的則調(diào)整其權(quán)值。""# 查詢請(qǐng)求分析用戶搜索時(shí),首先提交查詢請(qǐng)求。查詢請(qǐng)求分析模塊參照#$%&’&()將該查詢請(qǐng)求與用戶描述文件(進(jìn)行相似性比較)進(jìn)行個(gè)性化分析,推理出用戶真正的查詢意圖。然后建議用戶進(jìn)行確認(rèn)或修改系統(tǒng)給出的推理結(jié)果,即進(jìn)行反饋交互(不是必須的),以幫助推理結(jié)果的優(yōu)化。再根據(jù)意圖推理的結(jié)果,產(chǎn)生個(gè)性化的任務(wù),提交給查詢?nèi)蝿?wù)分發(fā)模塊。""$ 合成及擴(kuò)展處理由于成員搜索引擎在網(wǎng)頁(yè)集上存在重疊,所以搜索出來(lái)的結(jié)果必然會(huì)出現(xiàn)相同,因此合成時(shí)有必要消除重復(fù)結(jié)果。如何判別結(jié)果是否重復(fù)呢?算法> 重復(fù)結(jié)果判別算法。! 如果查詢結(jié)果的*?@完全相同,可以肯定是重復(fù)結(jié)果;" 如果兩個(gè)*?@ 只是文件名不同,其他部分相同(例如“A%%3://+,-B,-/”和“A%%3://+,-B,-/0$5,C"A%6’”),則認(rèn)為是相同結(jié)果;# 如果*?@完全不同,但文檔的標(biāo)題和摘要相同或相似,則認(rèn)為是相同的。綜上所述,系統(tǒng)對(duì)查詢結(jié)果的合成及擴(kuò)展處理描述如下:D第>E卷崔志明,黃國(guó)景,劉文杰:基于#$%&’&()的個(gè)性化元搜索引擎研究萬(wàn)方數(shù)據(jù)算法! 查詢結(jié)果合成及擴(kuò)展處理算法。! 歸并所有重復(fù)結(jié)果;" 參照用戶描述文件和"#$%&%’(,分析檢索結(jié)果的標(biāo)題和摘要,提取其中用戶感興趣的領(lǐng)域概念;# 將各個(gè)檢索結(jié)果按"#$%&%’(分類,并計(jì)算各個(gè)檢索結(jié)果在用戶描述文件中對(duì)應(yīng)概念的平均權(quán)值)(檢索結(jié)果可能對(duì)應(yīng)多個(gè)分類);$ 結(jié)合成員搜索引擎的評(píng)價(jià)權(quán)值、系統(tǒng)對(duì)成員搜索引擎的評(píng)價(jià)權(quán)值和)值,計(jì)算出檢索結(jié)果和用戶查詢請(qǐng)求的相關(guān)度*;% 把*低于相關(guān)度閾值的所有檢索結(jié)果過(guò)濾掉;& 消除結(jié)果標(biāo)題鏈接為死鏈接的檢索結(jié)果;& 將得到的結(jié)果按*降冪排序,并提交給用戶界面。! 總結(jié)本文提出了一個(gè)基于"#$%&%’(的個(gè)性化元搜索引擎系統(tǒng)模型,而目前大多數(shù)元搜索引擎

12>



播放器加載中,請(qǐng)稍候...
系統(tǒng)無(wú)法檢測(cè)到您的Adobe Flash Player版本
建議您在線安裝最新版本的Flash Player 在線安裝


  本文關(guān)鍵詞:基于Ontology的個(gè)性化元搜索引擎研究,由筆耕文化傳播整理發(fā)布。



本文編號(hào):62171

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/62171.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶20ebd***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com