基于獨立分量分析的語義聚類技術在信息檢索中的應用研究.pdf
本文關鍵詞:基于獨立分量分析的語義聚類技術在信息檢索中的應用研究,,由筆耕文化傳播整理發(fā)布。
電子科技大學
博士學位論文
基于獨立分量分析的語義聚類技術在信息檢索中的應用研究
姓名:蒲強
申請學位級別:博士
專業(yè):計算機系統(tǒng)結構
指導教師:楊國緯;He Daqing
20100601摘要
摘要
隨著計算機技術及網絡技術的飛速發(fā)展,世界上的數(shù)據(jù)正以驚人的速度增長
著。面對現(xiàn)代紛繁復雜的海量信息資源,人們反而有了“淹沒在信息海洋中”的
困惑。如何快捷、準確地得到所需信息已成為人們關注的焦點問題。信息檢索技
術能夠幫助不同領域的人們從文本、圖像、聲音等龐大的數(shù)據(jù)資料中尋找其所需
的信息。以信息檢索技術為核心技術的搜索引擎已經成為人們從互聯(lián)網發(fā)現(xiàn)
所需信息的最依賴的工具,顯示出這一領域巨大的市場價值和經濟利益。在龐大
用戶需求的驅動下,信息檢索技術不斷發(fā)展和創(chuàng)新,成為近年來信息領域研究的
熱點。
本文的研究基于統(tǒng)計信號處理技術和信息檢索技術的結合,這是源于將文本
文檔看成不同主題信號混合的產物,利用統(tǒng)計信號領域中獨立分量分析,技術對文檔進行處理,分離的獨立分量能
很好地表示文檔的語義主題結構。基于這一認識,全文以概率模型、信息論、線
性代數(shù)及有關統(tǒng)計方法為理論基礎,配合大量詳實的實驗分別研究了基于的
語義聚類理論模型及其應用、基于語義聚類的相關模型和查詢模型的估計,
同時還對信息檢索領域最常用的查詢擴展技術進行了研究。論文主要的貢獻和創(chuàng)
新之處包括五個方面:
.提出語義聚類激活的概念,并在理論上證明了利用激活語義聚
類下文檔估計的語義主題在語義距離上比使用全部反饋文檔估計的語義主題更接
近于真實語義主題。以用戶查詢?yōu)閷虻募せ罘绞皆谡Z義上將聚類下的文檔與查
詢關聯(lián)起來,克服了反饋文檔主題分散同現(xiàn)帶來
本文關鍵詞:基于獨立分量分析的語義聚類技術在信息檢索中的應用研究,由筆耕文化傳播整理發(fā)布。
本文編號:194022
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/194022.html