基于相似圖片聚類的Web文本特征算法
發(fā)布時間:2017-12-29 22:33
本文關(guān)鍵詞:基于相似圖片聚類的Web文本特征算法 出處:《計算機(jī)工程》2014年12期 論文類型:期刊論文
更多相關(guān)文章: Web文本特征 圖片搜索引擎 基于文本的圖像檢索 基于內(nèi)容的圖像檢索 倒排索引 Web文本分析
【摘要】:對于圖文不符的低質(zhì)量網(wǎng)頁,現(xiàn)有基于文本關(guān)鍵詞的圖片搜索引擎得到的結(jié)果相關(guān)性較差。針對該問題,將圖片的相似性聚類信息和網(wǎng)頁質(zhì)量因素融入文本分析過程,提出一種基于相似圖片聚類的Web文本特征算法。根據(jù)網(wǎng)頁P(yáng)age Rank值、關(guān)鍵詞HTML標(biāo)簽類別和關(guān)鍵詞詞性類別的不同,分別賦予其不同的權(quán)重并代入計算公式,綜合計算得到整個聚類中全部關(guān)鍵詞的文本特征值,并通過設(shè)置閾值提取高相關(guān)文本。對隨機(jī)選取的15個圖片聚類進(jìn)行實驗分析,結(jié)果表明,與百度和谷歌目前所用圖片搜索算法相比,該算法能夠準(zhǔn)確地找到反映圖片內(nèi)容的真實文本,提高圖片檢索的精度。
[Abstract]:......
【作者單位】: 武漢大學(xué)計算機(jī)學(xué)院;
【分類號】:TP391.1;TP391.41
【正文快照】: 中文引用格式:方爽,殷俊杰,徐武平.基于相似圖片聚類的Web文本特征算法[J].計算機(jī)工程,2014,40(12):161-165,171.英文引用格式:Fang Shuang,Yin Junjie,Xu Wuping.Web Text Feature Algorithm Based on Similar Image Clustering[J].Computer Engineering,2014,40(12):161-165
【共引文獻(xiàn)】
相關(guān)博士學(xué)位論文 前1條
1 劉鈺峰;異構(gòu)信息網(wǎng)絡(luò)檢索技術(shù)研究[D];湖南大學(xué);2014年
,本文編號:1352205
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1352205.html
最近更新
教材專著