基于N層向量空間模型的信息檢索算法
本文選題:搜索引擎 切入點:向量空間模型 出處:《計算機研究與發(fā)展》2002年10期
【摘要】:N層向量空間模型是在傳統(tǒng)向量空間模型的基礎上提出的一種新的信息檢索算法模型 ,這種模型將一篇文檔從邏輯上劃分為 N個相對獨立的文本段 ,然后按照文本段的內容建立文本特征向量以及文本權值向量 .在此模型的基礎上 ,更為精確地定義了特征值向量和相似度的計算方法 ,使之能比較好地適應文檔集合的動態(tài)擴充 .理論分析和實驗結果表明 ,基于此模型實現的信息檢索算法具有較快的查找速度和較高的查準率
[Abstract]:The N-layer vector space model is a new information retrieval algorithm model based on the traditional vector space model. This model logically divides a document into N relatively independent text segments. Then the text feature vector and the text weight vector are established according to the content of the text segment. On the basis of this model, the method of calculating the eigenvalue vector and the similarity degree is defined more accurately. The theoretical analysis and experimental results show that the information retrieval algorithm based on this model has faster searching speed and higher precision.
【作者單位】: 湖南大學計算機科學系 湖南大學計算機科學系 湖南大學計算機科學系
【基金】:湖南省自然科學基金資助 ( 0 1 JJY1 0 0 7)
【分類號】:TP391.1
【共引文獻】
相關期刊論文 前10條
1 戴先宇,王明文,吳水秀,張石林;帶參數的搜索引擎[J];江西師范大學學報(自然科學版);2002年04期
2 王穎楠,滕飛,解莉,孫俏;Web挖掘技術[J];吉林工學院學報(自然科學版);2002年01期
3 胥桂仙,蘇筱蔚,陳淑艷;中文文本挖掘中的無詞典分詞的算法及其應用[J];吉林工學院學報(自然科學版);2002年01期
4 胥桂仙,許建潮,連遠鋒,李昱翠;文本挖掘中的特征表示及聚類方法[J];吉林工學院學報(自然科學版);2002年03期
5 許建潮,王穎楠,胥桂仙;Web文本信息抽取與挖掘方法[J];長春工業(yè)大學學報(自然科學版);2002年S1期
6 陳紅英,李衛(wèi)華;智能信息Agent的研究和實現[J];計算機工程與應用;2002年12期
7 劉斌;陳樺;;向量空間模型信息檢索技術討論[J];情報雜志;2006年07期
8 石冰,曹慧,盧軍;一種HTML文檔的樸素貝葉斯分類算法[J];山東大學學報(工學版);2003年03期
9 莊兵 ,曾子維 ,李國瑞;信息挖掘技術在信息搜索中的應用[J];微型機與應用;2003年09期
10 劉志為,何丕廉,孫越恒,鄭小慎;N層向量空間模型在Web信息檢索中的應用[J];微型機與應用;2004年12期
相關博士學位論文 前1條
1 胡燕;基于Web信息抽取的專業(yè)知識獲取方法研究[D];武漢理工大學;2007年
相關碩士學位論文 前10條
1 劉卓;基于KNN算法的中文文本自動分類[D];吉林大學;2004年
2 鐘敏娟;基于Web的文本信息檢索算法研究[D];湖南大學;2004年
3 尤眾喜;無邊界學習及其支持和引導研究[D];華東師范大學;2005年
4 程傳鵬;基于分類的智能信息檢索研究與實現[D];云南師范大學;2005年
5 熊德蘭;中文網頁褒貶傾向性分類研究[D];鄭州大學;2006年
6 劉瑜;一種用于站內搜索的層次鏈接分析算法[D];大連理工大學;2006年
7 張瑩;基于自主學習的中文文本分類算法研究[D];哈爾濱工業(yè)大學;2006年
8 謝江標;最優(yōu)搜索理論在元搜索引擎中的應用研究[D];電子科技大學;2007年
9 杜超華;基于本體的省情網垂直搜索引擎研究[D];華中師范大學;2007年
10 吳虎子;中文網頁獲取及自動分類技術研究[D];武漢理工大學;2007年
【相似文獻】
相關期刊論文 前10條
1 李虎;鄒鵬;賈焰;周斌;;一種基于MapReduce的分布式文本數據過濾模型研究[J];信息網絡安全;2011年09期
2 申瑩;徐東平;龐俊;;基于概念的中文博客情感極性聚類分析[J];計算機系統(tǒng)應用;2011年08期
3 潘正高;侯傳宇;談成訪;;基于命名實體的Web新聞文本分類方法[J];合肥工業(yè)大學學報(自然科學版);2011年08期
4 孫桂煌;;一種基于n-gram短語的文本聚類方法研究[J];現代計算機(專業(yè)版);2011年14期
5 孟佳娜;林鴻飛;李彥鵬;;基于特征貢獻度的特征選擇方法在文本分類中應用[J];大連理工大學學報;2011年04期
6 李志明;李善平;楊朝暉;林欣;;基于本體分割的本體映射算法[J];模式識別與人工智能;2011年02期
7 許志凱;徐志明;李棟;李生;;面向互聯網新聞的話題檢測與追蹤[J];智能計算機與應用;2011年03期
8 李e,
本文編號:1663539
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1663539.html