一種基于形式概念分析的Web文檔標簽聚類方法
本文關(guān)鍵詞:一種基于形式概念分析的Web文檔標簽聚類方法
更多相關(guān)文章: Web搜索結(jié)果組織 文檔聚類 形式概念分析
【摘要】:針對現(xiàn)有搜索引擎的搜索結(jié)果數(shù)目龐大要從中找到有用信息十分困難的問題,基于將Web搜索結(jié)果進行聚類可以方便用戶快速瀏覽搜索結(jié)果的思想,提出了一種基于形式概念分析的Web搜索結(jié)果聚類方法。首先從搜索結(jié)果中集中提取關(guān)鍵短語和非關(guān)鍵短語,然后從搜索結(jié)果集到關(guān)鍵短語和非關(guān)鍵短語集上建立形式背景,采用一種較快概念格生成算法在該形式背景上生成概念格,概念格上的一個概念表達了具有確定意義的主題,即得到Web搜索結(jié)果的一個類:每個概念內(nèi)涵具有的關(guān)鍵短語或非關(guān)鍵短語作為類標記;概念的外延所包含的搜索結(jié)果文檔作為該類的內(nèi)容;搜索結(jié)果各個類之間的層次關(guān)系通過概念格上的層次關(guān)系得以體現(xiàn)。
【作者單位】: 西華大學(xué)檔案館;西華大學(xué)數(shù)學(xué)與計算機學(xué)院;77538部隊;
【關(guān)鍵詞】: Web搜索結(jié)果組織 文檔聚類 形式概念分析
【基金】:國家自然科學(xué)基金項目(61271413) 教育部“春暉計劃”項目(12226531) 四川省人事廳學(xué)術(shù)與技術(shù)帶頭人培養(yǎng)計劃(12226463)
【分類號】:TP391.1
【正文快照】: 0引言搜索引擎能夠幫助用戶在海量的互聯(lián)網(wǎng)資源中獲取有用信息。然而,現(xiàn)有搜索引擎返回的搜索結(jié)果文檔數(shù)目非常龐大,要從這么多的結(jié)果中找到有用信息,有時顯得很困難。如何滿足不同類型用戶的不同需要,辦法之一就是對搜索結(jié)果進行合理組織。Hearst等[1]的研究已經(jīng)證明了“聚
【參考文獻】
中國博士學(xué)位論文全文數(shù)據(jù)庫 前1條
1 杜亞軍;搜索引擎智能行為的研究及實現(xiàn)[D];西南交通大學(xué);2005年
【共引文獻】
中國期刊全文數(shù)據(jù)庫 前6條
1 劉煒;陳俊杰;;元搜索引擎中的推理技術(shù)[J];廣西師范大學(xué)學(xué)報(自然科學(xué)版);2007年04期
2 謝春芝;杜亞軍;;基于進化論觀點的概念格構(gòu)建算法[J];廣西師范大學(xué)學(xué)報(自然科學(xué)版);2010年01期
3 陳俊杰;劉煒;;一種基于本體的個性化模式庫建模方法[J];計算機研究與發(fā)展;2007年07期
4 劉煒;李舟軍;;一種基于移動服務(wù)器端的樹圖建模方法[J];計算機科學(xué);2011年04期
5 趙思佳;尹婷;;基于規(guī)則引擎的個性化主題網(wǎng)頁爬蟲的研究[J];計算機技術(shù)與發(fā)展;2011年03期
6 黃曉丹;王粉花;王志良;;情感決策的智能家居虛擬人路徑規(guī)劃[J];智能系統(tǒng)學(xué)報;2010年04期
中國博士學(xué)位論文全文數(shù)據(jù)庫 前2條
1 劉煒;智能元搜索引擎中個性化模式庫的研究[D];太原理工大學(xué);2007年
2 王春元;公共網(wǎng)絡(luò)信息系統(tǒng)安全管理的研究[D];合肥工業(yè)大學(xué);2009年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 陳文斐;基于形式概念分析的中文網(wǎng)頁分類研究[D];西華大學(xué);2011年
2 趙思佳;基于規(guī)則引擎的個性化網(wǎng)頁爬蟲研究[D];中南大學(xué);2010年
3 唐俊;基于概念格的個性化信息檢索研究[D];西華大學(xué);2006年
4 項磊;搜索引擎中初始URLS優(yōu)化研究[D];西華大學(xué);2007年
5 董占兵;基于形式概念分析的主題搜索策略研究[D];西華大學(xué);2007年
6 王競;基于形式概念分析的Web搜索結(jié)果聚類方法的研究[D];西華大學(xué);2008年
7 李新春;基于WordNet的概念格語義匹配算法及其在搜索引擎上的應(yīng)用[D];西華大學(xué);2008年
8 許威;基于概念格的查詢擴展系統(tǒng)及建格算法研究[D];北京郵電大學(xué);2008年
9 黃少林;基于用戶興趣分析的個性化搜索引擎研究[D];首都師范大學(xué);2009年
10 楊月奎;基于語義的主題爬行方向研究[D];西華大學(xué);2009年
【二級參考文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 何學(xué)鋒,彭超群,張曾榮;科技期刊7項重要計量指標間的相互關(guān)系[J];編輯學(xué)報;2003年06期
2 王紅梅,朱洪秀,王凌;對中文搜索引擎未來發(fā)展的探討[J];東北電力學(xué)院學(xué)報;2001年04期
3 張衛(wèi)豐,徐寶文;Web搜索引擎框架研究[J];計算機研究與發(fā)展;2000年03期
4 管惠維;基于Transputer的邏輯程序解釋器的設(shè)計與實現(xiàn)[J];計算機研究與發(fā)展;1995年02期
5 丁承,邵志清;集中式搜索引擎的設(shè)計與開發(fā)[J];計算機工程;2002年02期
6 肖詩源,葉俊,劉賢德;一種基于Agent的分布式搜索引擎[J];計算機工程;2002年07期
7 徐俊萍,翟玉慶;基于Agent的個性化信息服務(wù)技術(shù)的研究[J];計算機工程與科學(xué);2002年03期
8 張汛淶;搜索引擎的設(shè)計剖析[J];計算機工程與科學(xué);2002年04期
9 陳志忠,陳肇雄,高慶獅;通用的自然語言詞法分析機制[J];計算機學(xué)報;1991年02期
10 張廷華;Web元搜索引擎的改進[J];計算機應(yīng)用;2002年02期
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 苗茹;沈夏炯;;概念格經(jīng)典算法對比[J];福建電腦;2007年03期
2 蔣平;任勝兵;林鵑;;形式概念分析在軟件工程中的應(yīng)用[J];計算機技術(shù)與發(fā)展;2008年04期
3 鄭珂;李涵;;基于形式概念分析的本體構(gòu)建方法研究[J];福建電腦;2011年02期
4 苗茹;沈夏炯;;概念格中的規(guī)則提取[J];光盤技術(shù);2006年01期
5 柴玉梅;楊冉;王黎明;;基于快速形式概念集構(gòu)造的分類規(guī)則挖掘算法[J];煙臺大學(xué)學(xué)報(自然科學(xué)與工程版);2009年03期
6 曲開社;閻俊霞;翟巖慧;;GM偏序圖的構(gòu)建和基于GM偏序圖的規(guī)則提取[J];計算機工程與應(yīng)用;2007年36期
7 苗茹;沈夏炯;胡小華;;概念格上無冗余關(guān)聯(lián)規(guī)則的提取算法NARG[J];計算機工程;2009年22期
8 王u&菁;陳震;;一種基于概念格的關(guān)聯(lián)規(guī)則挖掘算法[J];計算機工程與應(yīng)用;2007年28期
9 高峰;何偉;;基于形式概念分析和本體的搜索引擎設(shè)計思考[J];中央民族大學(xué)學(xué)報(自然科學(xué)版);2009年S1期
10 馬駿;沈夏炯;劉宗田;;基于三維空間的概念格自動布局[J];計算機科學(xué);2006年05期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 唐國瑜;夏云慶;張民;鄭方;;基于跨語言廣義向量空間模型的跨語言文檔聚類方法[A];中國計算語言學(xué)研究前沿進展(2009-2011)[C];2011年
2 趙傳申;楊明;孫志揮;;基于概念格的分布多庫規(guī)則發(fā)現(xiàn)[A];第二十一屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(研究報告篇)[C];2004年
3 湯志鋼;胡學(xué)鋼;簡宋全;;量化概念格研究[A];全國第十四屆計算機科學(xué)及其在儀器儀表中的應(yīng)用學(xué)術(shù)交流會論文集[C];2001年
4 何超;程學(xué)旗;郭嘉豐;;基于層次概念格的分面導(dǎo)航[A];第六屆全國信息檢索學(xué)術(shù)會議論文集[C];2010年
5 周水庚;孫敬宇;胡運發(fā);;一種文檔聚類新方法[A];第十六屆全國數(shù)據(jù)庫學(xué)術(shù)會議論文集[C];1999年
6 伍賽;楊冬青;韓近強;張銘;王文清;馮英;;WCM:一種基于單詞相關(guān)度的文檔聚類新方法[A];第二十一屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(技術(shù)報告篇)[C];2004年
7 趙奕;施鵬飛;;一種快速的概念格構(gòu)造方法[A];中國體視學(xué)學(xué)會圖像分析專業(yè)、中國體視學(xué)學(xué)會仿真與虛擬現(xiàn)實專業(yè)、中國航空學(xué)會信號與信息處理專業(yè)第一屆聯(lián)合學(xué)術(shù)會議論文集[C];2000年
8 李勃;姚青;;一種基于概念格挖掘規(guī)則產(chǎn)生集的算法[A];第二十二屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(技術(shù)報告篇)[C];2005年
9 覃海生;韋海蘭;李新華;;基于概念格的Web測試在廉租住房系統(tǒng)中的應(yīng)用研究[A];廣西計算機學(xué)會2010年學(xué)術(shù)年會論文集[C];2010年
10 朱秋云;張琪;姬朝陽;陳亮;魏苑琦;朱紹文;;一種基于概念格的關(guān)聯(lián)規(guī)則對半查找算法設(shè)計[A];2005年中國智能自動化會議論文集[C];2005年
中國重要報紙全文數(shù)據(jù)庫 前1條
1 張德政;信息挖掘商業(yè)智能之“芯”[N];中國計算機報;2002年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 劉銘;大規(guī)模文檔聚類中若干關(guān)鍵問題的研究[D];哈爾濱工業(yè)大學(xué);2010年
2 師智斌;高性能數(shù)據(jù)立方體及其語義研究[D];北京交通大學(xué);2010年
3 王瑋;基于概念格的關(guān)聯(lián)規(guī)則挖掘及變化模式研究[D];山東大學(xué);2012年
4 秦昆;基于形式概念分析的圖像數(shù)據(jù)挖掘研究[D];武漢大學(xué);2004年
5 楊瑞龍;基于短語特征的Web文檔聚類方法研究[D];重慶大學(xué);2010年
6 陳湘;基于基集和概念格的數(shù)據(jù)挖掘方法研究[D];電子科技大學(xué);2011年
7 金陽;基于概念格模型的序列模式挖掘算法研究[D];吉林大學(xué);2007年
8 杜亞軍;搜索引擎智能行為的研究及實現(xiàn)[D];西南交通大學(xué);2005年
9 王德興;基于概念格模型關(guān)聯(lián)規(guī)則挖掘的關(guān)鍵問題研究[D];合肥工業(yè)大學(xué);2007年
10 余遠;基于形式概念分析分類規(guī)則挖掘的關(guān)鍵問題研究[D];中國礦業(yè)大學(xué)(北京);2009年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 趙虹;基于概念格的關(guān)聯(lián)規(guī)則挖掘研究[D];大連海事大學(xué);2007年
2 劉樹鵬;基于概念格的本體合并方法與技術(shù)的研究[D];大連海事大學(xué);2010年
3 王培培;基于區(qū)別度概念格的關(guān)聯(lián)規(guī)則挖掘算法設(shè)計[D];河南大學(xué);2010年
4 趙文兵;基于概念格及其擴展模型的數(shù)據(jù)挖掘研究[D];合肥工業(yè)大學(xué);2002年
5 臧國輕;一種基于深度優(yōu)先的概念格并行構(gòu)造模型[D];河南大學(xué);2008年
6 王德興;基于量化概念格的關(guān)聯(lián)規(guī)則挖掘模型研究[D];合肥工業(yè)大學(xué);2003年
7 張玉紅;基于概念格擴展模型的分類問題研究[D];合肥工業(yè)大學(xué);2004年
8 孟凡宇;軟件再工程中的類層次重構(gòu)與簡化[D];吉林大學(xué);2005年
9 李新春;基于WordNet的概念格語義匹配算法及其在搜索引擎上的應(yīng)用[D];西華大學(xué);2008年
10 安廣偉;形式背景核的有限性研究與算法實現(xiàn)[D];河南大學(xué);2006年
,本文編號:753308
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/753308.html