天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 管理論文 > 移動網絡論文 >

基于特征模型的主題搜索引擎研究

發(fā)布時間:2021-10-27 13:10
  隨著企業(yè)信息化建設的發(fā)展,企業(yè)信息資源日趨豐富,企業(yè)信息門戶網站逐漸成為企業(yè)信息管理的重要平臺,為了促進企業(yè)內部的信息共享和相互交流,我們針對油田企業(yè)信息開發(fā)了油田信息搜索引擎。然而,隨著信息量的增大,企業(yè)內部不同單位信息門戶網站網頁在內容上有一定的相似性,當用戶想查詢某一特定主題的信息時,現有的油田信息搜索引擎搜索結果中包含有許多與目標主題無關的信息,導致搜索結果混亂、信息主題不明確,降低了用戶的檢索效率。因此,如何識別網頁的特征,將網頁與企業(yè)主題進行關聯,提高檢索的準確性,是目前油田信息搜索引擎急需解決的問題。針對上述問題,本文提出了一種基于特征模型的主題搜索引擎解決方案。具體研究內容如下:第一、對現有的油田信息搜索引擎進行了研究,提出了基于特征模型的主題搜索引擎的解決方案。對特征模型在主題搜索引擎中的作用進行了研究,提出將網頁特征模型應用到主題搜索引擎的爬行器和搜索結果展示中,以提高用戶對搜索結果的主題辨識度。第二、研究了企業(yè)信息門戶網站的特點,提出了將網頁特征分為內部特征和外部特征,根據網頁特征的視覺和語義特性對網頁特征進行了歸納。研究了網頁特征對主題的作用,提出了將內部特征和... 

【文章來源】:東北石油大學黑龍江省

【文章頁數】:71 頁

【學位級別】:碩士

【部分圖文】:

基于特征模型的主題搜索引擎研究


一基于特征模型的主題搜索引擎系統(tǒng)框架

網頁,欄目,示例,外部特征


欄目型網頁示例

特征模,XML模式,網頁


特征模型標記詳細介紹,如表3-1所示:??表3-1網頁特征模耶標記的意義??標記?描述??表示特征模型的根標記,即代表一張JH文型網頁,它包含特征集合、特??Page??征N的關系兩個子標〖己:Features、Relation。??Features?表示特征的集合,它"J以包合?個或多個T標〖己Feature。??_表示一個特征,它包含特征的標識、類型、名稱、描述、特征提取規(guī)則、??Feature?權重,標記?Feature?有七個子標記:Identification、Type、Choose、Name、??Description、Rule、Weight。??Identification表示特征的唯一標識,用于標識特征。??Type?表示特征的類型,值為INTERNAL(內部特征)或EXTERNAL(外部特征)。??Choose?表示特征的可選性,true為選擇,false為不選擇。??Name?表示特征的名稱。??Description?表示特征的語義描述,可以根據特征的實際語義進行修改。??Rule?表示特征的提取規(guī)則,是可選的。??

【參考文獻】:
期刊論文
[1]企業(yè)信息門戶的建設與應用[J]. 劉占慶.  信息系統(tǒng)工程. 2011(06)
[2]基于超鏈接引導和鏈接圖分析的主題搜索引擎[J]. 唐蘇,劉循.  計算機技術與發(fā)展. 2011(02)
[3]探討油田信息化項目建設思路[J]. 于海燕.  數字石油和化工. 2008(09)
[4]向量空間模型中特征加權的研究[J]. 林永民,呂震宇,趙爽,朱衛(wèi)東.  情報雜志. 2008(03)
[5]基于語義的企業(yè)搜索引擎的研究與實現[J]. 李武裝.  電腦知識與技術(學術交流). 2007(08)
[6]綜合搜索引擎與垂直搜索引擎的比較研究[J]. 劉暢.  情報科學. 2007(01)
[7]利用分塊重要度進行中文網頁分類的研究[J]. 段昕,馬軍,宋玲.  山東大學學報(理學版). 2006(03)
[8]DF還是IDF?主特征模型在Web信息檢索中的使用[J]. 張敏,馬少平,宋睿華.  軟件學報. 2005(05)
[9]主題爬蟲的解決方案[J]. 劉林,汪濤,樊孝忠.  華南理工大學學報(自然科學版). 2004(S1)
[10]基于概念分析的主題爬蟲設計[J]. 汪濤,樊孝忠,顧益軍,劉林.  北京理工大學學報. 2004(10)

碩士論文
[1]基于聯邦模式的油田信息搜索引擎構建方法研究[D]. 彭成暉.東北石油大學 2012
[2]基于DOM樹信息抽取的移動網站開發(fā)研究[D]. 李景.中國海洋大學 2011
[3]基于網頁結構的信息抽取關鍵技術研究[D]. 王海潮.華南理工大學 2011
[4]基于頁面結構分析的網頁信息抽取方法研究[D]. 董娟.中國石油大學 2010
[5]基于標簽分析的網頁正文提取技術研究[D]. 常紅要.重慶大學 2010
[6]基于Agent的專業(yè)搜索引擎及在管道信息檢索中的應用研究[D]. 胡春娜.大慶石油學院 2010
[7]主題網絡爬蟲關鍵技術研究[D]. 王桂梅.哈爾濱工業(yè)大學 2009
[8]油田企業(yè)信息門戶平臺構建技術研究與應用[D]. 李勃.大慶石油學院 2009
[9]基于DOM的Web信息抽取技術的研究與實現[D]. 李猛.大連理工大學 2008
[10]面向石油的主題搜索引擎研究[D]. 李晗.中國石油大學 2008



本文編號:3461668

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/ydhl/3461668.html


Copyright(c)文論論文網All Rights Reserved | 網站地圖 |

版權申明:資料由用戶2e174***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com