天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 計算機應(yīng)用論文 >

融合用戶興趣和混合估計的微博檢索模型研究

發(fā)布時間:2021-10-24 20:16
  中國互聯(lián)網(wǎng)絡(luò)信息中心發(fā)布的第42次《中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計報告》顯示:截止2018年6月,中國微博用戶規(guī)模已達3.37億人,在整體網(wǎng)民數(shù)中微博用戶數(shù)占比已達42.1%。巨大的用戶數(shù)量使微博逐漸成為人們獲取和分享信息的重要途徑。為從龐大的微博數(shù)據(jù)中獲取有效信息,微博檢索已成為微博服務(wù)的重要組成部分。微博檢索雖屬文本檢索范疇,但卻不同于傳統(tǒng)文本檢索,兩者的區(qū)別主要體現(xiàn)在排序原則和搜索數(shù)據(jù)兩個方面。在排序原則方面,微博檢索除要考慮查詢與文檔的內(nèi)容相似度外,還應(yīng)考慮其它因素,如時間、興趣、博文質(zhì)量等;在搜索數(shù)據(jù)方面,微博檢索面向的是微博文檔,其典型特點是長度較短、內(nèi)容稀疏。結(jié)合微博檢索的特點,本文在查詢似然模型的基礎(chǔ)上提出一個融合用戶興趣和混合估計的微博檢索模型。新模型主要對傳統(tǒng)查詢似然模型中的文檔先驗概率和文檔語言模型估計進行改進,具體工作體現(xiàn)在兩個方面:(1)在文檔先驗概率方面,首先通過量化用戶對微博的興趣行為得到用戶的興趣博文庫,然后通過計算用戶興趣博文庫和微博之間的相似度對微博集中每條微博先驗概率的計算進行改進,最終使符合用戶興趣的微博具有較高的先驗概率,以在一定程度上滿足用戶的個性... 

【文章來源】:河北大學(xué)河北省

【文章頁數(shù)】:55 頁

【學(xué)位級別】:碩士

【部分圖文】:

融合用戶興趣和混合估計的微博檢索模型研究


論文組織結(jié)構(gòu)

信息檢索,基本流程,查詢表達式


的查詢請求,將用戶信息需求轉(zhuǎn)化成查詢表達式,然后對查詢表達式進行進一步的分析和擴展;③在文檔庫中匹配出相關(guān)的文擋,并通過特定的檢索模型對檢索到的文檔進行排序,最終將結(jié)果返回給用戶。信息檢索的基本流程如圖2-1所示:圖 2-1 信息檢索的基本流程信息檢索系統(tǒng)的主要功能包括:①對用戶的特定信息需求進行描述,即:根據(jù)用戶的輸入信息,生成一個查詢表達式,然后對查詢表達式進行進一步分析,以滿足檢索要求;②建立文檔索引,即:收集所要檢索的半結(jié)構(gòu)化或非結(jié)構(gòu)化文檔,并為其建立索引;③對文檔進行表示,即:如何來存儲文檔和表示文檔的內(nèi)容,建立供檢索用的文檔庫。④對查詢和文檔進行匹配,即:根據(jù)具體模型和算法從文檔庫中找出與用戶需求相關(guān)的文擋。⑤進行相關(guān)性反饋,即:把檢索的結(jié)果按照相關(guān)性反饋給用戶,用戶可以把自己對檢索結(jié)果的意見反饋給系統(tǒng),從而提高后續(xù)的檢索效果。微博檢索屬于信息檢索范疇

界面圖,搜索引擎,界面,相關(guān)性反饋


⑤進行相關(guān)性反饋,即:把檢索的結(jié)果按照相關(guān)性反饋給用戶,用戶可以把自己對檢索結(jié)果的意見反饋給系統(tǒng),從而提高后續(xù)的檢索效果。微博檢索屬于信息檢索范疇,其基本流程同樣可以依據(jù)上述過程進行實現(xiàn)。圖2-2展示了新浪類微博提供的微博搜索引擎界面,從圖中可以看出:微博搜索可以實現(xiàn)綜合、找人、文章、視頻、圖片、話題六種功能,F(xiàn)有研究大多主要針對微博文本信息進行研用戶信息需求查詢表達式相關(guān)反饋對檢索表達式分析和擴展檢索結(jié)果匹配并檢索 文檔表示 文檔索引文檔庫

【參考文獻】:
期刊論文
[1]中文關(guān)鍵短語自動提取方法研究[J]. 榮垂田,李銀銀,王琰.  計算機科學(xué)與探索. 2019(09)
[2]基于文本和公式的科技文檔相似度計算[J]. 徐建民,許彩云.  數(shù)據(jù)分析與知識發(fā)現(xiàn). 2018(10)
[3]面向微博短文本的社交與概念化語義擴展搜索方法[J]. 崔婉秋,杜軍平,寇菲菲,李志堅,Lee JangMyung.  計算機研究與發(fā)展. 2018(08)
[4]基于用戶擴展興趣的微博推薦方法[J]. 徐建民,劉明艷,王苗.  計算機應(yīng)用研究. 2019(06)
[5]基于潛在語義與圖結(jié)構(gòu)的微博語義檢索[J]. 肖寶,李璞,胡嬌嬌,蔣運承.  計算機工程. 2017(06)
[6]一種基于用戶動態(tài)興趣和社交網(wǎng)絡(luò)的微博推薦方法[J]. 陳杰,劉學(xué)軍,李斌,章瑋.  電子學(xué)報. 2017(04)
[7]基于維基語義擴展的微博話題追蹤模型研究[J]. 唐曉波,王中勤,鐘林霞.  情報科學(xué). 2017(02)
[8]呂蘇語口語標(biāo)注語料的自動分詞方法研究[J]. 于重重,操鐳,尹蔚彬,張澤宇,鄭雅.  計算機應(yīng)用研究. 2017(05)
[9]基于詞匯時間分布的微博查詢擴展[J]. 韓中元,楊沐昀,孔蕾蕾,齊浩亮,李生.  計算機學(xué)報. 2016(10)
[10]面向微博搜索的時間敏感的排序?qū)W習(xí)方法[J]. 王書鑫,衛(wèi)冰潔,魯驍,王斌.  中文信息學(xué)報. 2015(04)

博士論文
[1]基于時間特性的微博檢索和微博過濾研究[D]. 韓中元.哈爾濱工業(yè)大學(xué) 2016



本文編號:3455909

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3455909.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶d2c5a***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com