一種面向不確定圖的SimRank算法
本文關(guān)鍵詞:一種面向不確定圖的SimRank算法
更多相關(guān)文章: 搜索引擎 社會網(wǎng)絡(luò) 不確定圖 SimRank 相似度 抽樣策略
【摘要】:針對以往的搜索引擎日志分析都主要集中在用戶行為分析、查詢推薦及搜索引擎評價等方面,采用社會網(wǎng)絡(luò)分析法對搜索引擎進行日志分析。以不確定圖的方式邏輯表示搜索引擎的日志中查詢詞和網(wǎng)頁的鏈接關(guān)系,通過基于不確定圖的SimRank算法,計算查詢詞與網(wǎng)頁的相似度,最終以相似度和查詢詞的加權(quán)方式建立網(wǎng)頁描述庫。針對概率抽樣的3點基本要求,提出一種漸進式的抽樣策略,從而保證采用抽樣技術(shù)對于不確定圖中SimRank值計算的準(zhǔn)確性。實驗表明該算法具有較好的準(zhǔn)確率和可行性。
【作者單位】: 哈爾濱工程大學(xué)計算機科學(xué)與技術(shù)學(xué)院;
【基金】:國家自然科學(xué)基金資助項目(61272186,61100007) 黑龍江省基金資助項目(F200937,F201110) 中央高;究蒲袠I(yè)務(wù)費專項資金資助項目(HEUCF100608) 黑龍江省博士后基金資助項目(LBH-Z12068) 哈爾濱市基金資助項目(RC2009XK010003)
【分類號】:TP391.3
【正文快照】: 傳統(tǒng)搜索引擎在商用過程中,都設(shè)計一套日志系統(tǒng),記錄下用戶在搜索引擎上的使用信息。用戶每進行一次查詢及在查詢結(jié)果中的瀏覽信息,日志系統(tǒng)會將用戶查詢詞、點擊URL、用戶ID、查詢時間、瀏覽時間等信息記錄下來。搜索引擎的長期運行,使得日志文件中記錄信息極為豐富,龐大的日
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前5條
1 張應(yīng)龍;李翠平;陳紅;杜凌霞;;不確定圖上的kNN查詢處理[J];計算機研究與發(fā)展;2011年10期
2 劉凱鵬;方濱興;;一種基于社會性標(biāo)注的網(wǎng)頁排序算法[J];計算機學(xué)報;2010年06期
3 李亞楠;許晟;王斌;;基于加權(quán)SimRank的中文查詢推薦研究[J];中文信息學(xué)報;2010年03期
4 靳延安;李瑞軒;文坤梅;辜希武;盧正鼎;段東圣;;社會標(biāo)注及其在信息檢索中的應(yīng)用研究綜述[J];中文信息學(xué)報;2010年04期
5 馬云龍;林原;林鴻飛;;基于權(quán)重標(biāo)準(zhǔn)化SimRank方法的查詢擴展技術(shù)研究[J];中文信息學(xué)報;2011年01期
【共引文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 范憶慧;;網(wǎng)絡(luò)標(biāo)簽分析與個性化信息服務(wù)[J];重慶理工大學(xué)學(xué)報(自然科學(xué));2012年07期
2 姚佳;;基于快速排序算法的文獻檢索技術(shù)[J];電腦知識與技術(shù);2014年02期
3 馬宏遠(yuǎn);王斌;;基于日志分析的搜索引擎查詢結(jié)果緩存研究[J];計算機研究與發(fā)展;2012年S1期
4 李亞楠;王斌;李錦濤;;搜索引擎查詢推薦技術(shù)綜述[J];中文信息學(xué)報;2010年06期
5 王健;李志斌;林鴻飛;;一種基于社會化標(biāo)注的網(wǎng)頁檢索方法[J];計算機工程;2012年15期
6 文坤梅;徐帥;李瑞軒;辜希武;李玉華;;微博及中文微博信息處理研究綜述[J];中文信息學(xué)報;2012年06期
7 廖志芳;李玲;劉麗敏;李永周;;三部圖張量分解標(biāo)簽推薦算法[J];計算機學(xué)報;2012年12期
8 王桂華;秦湘清;陳黎;王亞強;于中華;;一種面向?qū)I(yè)搜索引擎的查詢推薦算法[J];計算機工程與應(yīng)用;2013年09期
9 張s,
本文編號:1213636
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1213636.html