基于相似圖片聚類的Web文本特征算法
發(fā)布時間:2017-12-29 22:33
本文關鍵詞:基于相似圖片聚類的Web文本特征算法 出處:《計算機工程》2014年12期 論文類型:期刊論文
更多相關文章: Web文本特征 圖片搜索引擎 基于文本的圖像檢索 基于內容的圖像檢索 倒排索引 Web文本分析
【摘要】:對于圖文不符的低質量網(wǎng)頁,現(xiàn)有基于文本關鍵詞的圖片搜索引擎得到的結果相關性較差。針對該問題,將圖片的相似性聚類信息和網(wǎng)頁質量因素融入文本分析過程,提出一種基于相似圖片聚類的Web文本特征算法。根據(jù)網(wǎng)頁Page Rank值、關鍵詞HTML標簽類別和關鍵詞詞性類別的不同,分別賦予其不同的權重并代入計算公式,綜合計算得到整個聚類中全部關鍵詞的文本特征值,并通過設置閾值提取高相關文本。對隨機選取的15個圖片聚類進行實驗分析,結果表明,與百度和谷歌目前所用圖片搜索算法相比,該算法能夠準確地找到反映圖片內容的真實文本,提高圖片檢索的精度。
[Abstract]:......
【作者單位】: 武漢大學計算機學院;
【分類號】:TP391.1;TP391.41
【正文快照】: 中文引用格式:方爽,殷俊杰,徐武平.基于相似圖片聚類的Web文本特征算法[J].計算機工程,2014,40(12):161-165,171.英文引用格式:Fang Shuang,Yin Junjie,Xu Wuping.Web Text Feature Algorithm Based on Similar Image Clustering[J].Computer Engineering,2014,40(12):161-165
【共引文獻】
相關博士學位論文 前1條
1 劉鈺峰;異構信息網(wǎng)絡檢索技術研究[D];湖南大學;2014年
,本文編號:1352205
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1352205.html
最近更新
教材專著