Web信息檢索結構化排序函數(shù)與標引詞加權技術
[Abstract]:This paper analyzes on the present situation of Web information retrieval technology, and points out that the fundamental reason for the low retrieval efficiency lies in the sorting function and index word weighting technology used by the search engine. This paper introduces the traditional information retrieval sorting function and index word weighting technology. This paper analyzes the characteristics of Web documents, and points out that the main form of HTML documents is a structured document, the structure of which is explicitly defined by tags, and the contributions of different document structures to retrieval performance are different. The achievements of scholars at home and abroad in this field are compared and studied. Finally, the development direction of Web information retrieval sorting function and index word weighting technology is discussed.
【作者單位】: 海南大學信息科學技術學院通信與信息系統(tǒng)重點實驗室 海南大學信息科學技術學院通信與信息系統(tǒng)重點實驗室
【基金】:國家教育部科學技術重點研究項目(the Key Technologies Project of the Ministry of Education of China No.03144) 海南省自然科學基金(the Natural Science Foundation of Hainan Province of China under Grant No.60533)。
【分類號】:TP391.3
【參考文獻】
相關期刊論文 前1條
1 韓毅;基于文檔結構的向量空間檢索模型研究[J];情報學報;2004年02期
【共引文獻】
相關期刊論文 前10條
1 戴先宇,王明文,吳水秀,張石林;帶參數(shù)的搜索引擎[J];江西師范大學學報(自然科學版);2002年04期
2 陳治平,林亞平,童調生;基于N層向量空間模型的信息檢索算法[J];計算機研究與發(fā)展;2002年10期
3 王穎楠,滕飛,解莉,孫俏;Web挖掘技術[J];吉林工學院學報(自然科學版);2002年01期
4 胥桂仙,蘇筱蔚,陳淑艷;中文文本挖掘中的無詞典分詞的算法及其應用[J];吉林工學院學報(自然科學版);2002年01期
5 胥桂仙,許建潮,連遠鋒,李昱翠;文本挖掘中的特征表示及聚類方法[J];吉林工學院學報(自然科學版);2002年03期
6 許建潮,王穎楠,胥桂仙;Web文本信息抽取與挖掘方法[J];長春工業(yè)大學學報(自然科學版);2002年S1期
7 陳紅英,李衛(wèi)華;智能信息Agent的研究和實現(xiàn)[J];計算機工程與應用;2002年12期
8 張孝飛;黃河燕;陳肇雄;代六玲;;跨語言信息檢索中查詢語句翻譯轉換算法[J];計算機工程;2007年11期
9 夏詠梅;基于文本挖掘的分類與聚類技術[J];情報探索;2005年03期
10 劉斌;陳樺;;向量空間模型信息檢索技術討論[J];情報雜志;2006年07期
相關會議論文 前1條
1 張孝飛;代六玲;黃河燕;陳肇雄;;跨語言信息檢索中查詢關鍵詞翻譯轉換算法[A];全國網(wǎng)絡與信息安全技術研討會'2005論文集(下冊)[C];2005年
相關博士學位論文 前2條
1 胡燕;基于Web信息抽取的專業(yè)知識獲取方法研究[D];武漢理工大學;2007年
2 王樹梅;信息檢索相關技術研究[D];南京理工大學;2007年
相關碩士學位論文 前10條
1 崔得暄;Web文本自動分類技術研究[D];華中科技大學;2006年
2 宋玲玲;網(wǎng)絡搜索引擎中檢索器檢索方法研究[D];中國石油大學;2007年
3 謝江標;最優(yōu)搜索理論在元搜索引擎中的應用研究[D];電子科技大學;2007年
4 錢升華;基于支持向量機的手機垃圾短信過濾器的研究[D];河北工業(yè)大學;2006年
5 王慶濤;基于本體的Web信息采集研究[D];中南大學;2007年
6 程傳鵬;基于分類的智能信息檢索研究與實現(xiàn)[D];云南師范大學;2005年
7 李少輝;基于WEB的協(xié)同設計中的信息管理研究[D];山東師范大學;2006年
8 熊德蘭;中文網(wǎng)頁褒貶傾向性分類研究[D];鄭州大學;2006年
9 劉瑜;一種用于站內搜索的層次鏈接分析算法[D];大連理工大學;2006年
10 張瑩;基于自主學習的中文文本分類算法研究[D];哈爾濱工業(yè)大學;2006年
【二級參考文獻】
相關期刊論文 前1條
1 陸玉昌,魯明羽,李凡,周立柱;向量空間法中單詞權重函數(shù)的分析和構造[J];計算機研究與發(fā)展;2002年10期
【相似文獻】
相關期刊論文 前10條
1 陶志成;編譯組合理論[J];計算機學報;1980年01期
2 鄧自立 ,周永聲;RS算法及其在管理工程中的應用[J];華南理工大學學報(自然科學版);1984年03期
3 張亞南;一種實用的數(shù)值型偽Hash函數(shù)排序方法[J];計算機研究與發(fā)展;1993年10期
4 王永吉,,鄒德 ;Borland C~(++)2.0排序函數(shù)QSORT()的用法[J];計算機時代;1995年06期
5 王國安,王剛;用內碼轉換法解決按姓氏筆劃排序問題[J];現(xiàn)代電子技術;1998年07期
6 劉軍,王士俊;串聯(lián)系統(tǒng)精確置信下限計算和奇點消除[J];系統(tǒng)工程與電子技術;1999年04期
7 袁一林,李曉平;Delphi中多線程應用程序的編制[J];電子與電腦;1999年02期
8 ;擂臺賽1999年第16期點評[J];電腦愛好者;1999年22期
9 于海斌,薛勁松,王浩波,徐心和;基于遺傳算法的單機提前/拖期調度方法研究[J];控制理論與應用;2000年02期
10 董楊琴;淺談C語言中的復雜指針[J];南通職業(yè)大學學報;2000年03期
本文編號:2486203
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2486203.html