基于上下文與面向社會(huì)媒體的信息推薦方法研究
發(fā)布時(shí)間:2019-05-15 14:53
【摘要】:隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,人們使用網(wǎng)絡(luò)的方式發(fā)生了顯著的變化。由互聯(lián)網(wǎng)用戶自身行為產(chǎn)生的數(shù)據(jù)量呈現(xiàn)爆炸性的增長(zhǎng)。面對(duì)如此龐大的資源,使得想要為用戶準(zhǔn)確、快速地找到感興趣的內(nèi)容變得越來越有挑戰(zhàn)性。傳統(tǒng)的搜索引擎Yahoo! (www.yahoo.com), AltaVista (www.altavista.com)和Google (www.google.com)等是輔助人們獲取信息的最普遍的工具。但是仍然不能滿足不同背景、不同目的、不同時(shí)期的個(gè)性化信息需求。個(gè)性化服務(wù)技術(shù)就是針對(duì)這個(gè)問題而提出的,它為不同用戶提供不同的服務(wù),以滿足不同的需求。推薦系統(tǒng)作為個(gè)性化服務(wù)研究領(lǐng)域的重要分支,通過挖掘用戶與項(xiàng)目(user-item)的二元關(guān)系,幫助用戶從大量數(shù)據(jù)中發(fā)現(xiàn)其可能感興趣的項(xiàng)目,并生成個(gè)性化推薦以滿足個(gè)性化需求。在傳統(tǒng)的推薦系統(tǒng)研究中,人們往往只關(guān)注“用戶-項(xiàng)目”之間的關(guān)聯(lián)關(guān)系,很少考慮它們所處的上下文環(huán)境(如時(shí)間、地址、天氣狀況、情緒等等)。在許多應(yīng)用場(chǎng)景下,僅僅依靠“用戶-項(xiàng)目”二元關(guān)系并不能生成精確推薦。本文將上下文信息融入推薦系統(tǒng),針對(duì)基于上下文的信息推薦及面向社會(huì)媒體的信息推薦領(lǐng)域的一些方法進(jìn)行了研究,主要工作如下:1.提出一種基于查詢上下文模型提取支配集的方法,保留主要特征的同時(shí)移除不相關(guān)上下文信息;在協(xié)同標(biāo)記系統(tǒng)(folksonomy)中建立查詢上下文圖模型來提取用戶的偏好,以改善個(gè)性化搜索的性能。2.針對(duì)個(gè)性化推薦系統(tǒng)的數(shù)據(jù)具有高稀疏化的特性,提出了一種基于因式分解機(jī)(Fact-orization Machines, FMs)的上下文感知電影推薦的方法,將特征的真實(shí)值(real-value)作為因式分解機(jī)的輸入數(shù)據(jù),并將上下文信息融入FMs中,同時(shí)提出一種基于上下文感知最小均方根誤差的特征提取方法,旨在識(shí)別和獲取那些對(duì)推薦任務(wù)確有影響的有效上下文信息,即識(shí)別和獲取那些對(duì)提高推薦精確度的上下文信息。3.面對(duì)新聞?wù)臋n進(jìn)行公眾情感推薦,提出了面向在線新聞推薦系統(tǒng)的公眾情感檢測(cè)系統(tǒng)由三個(gè)部分組成,即:文檔選擇(Document selection)、詞性(Part-of-speech)標(biāo)注和公眾情感詞典的生成算法。我們將從新浪網(wǎng)站社會(huì)版塊收集的40,897篇文章組成在線新聞的集合,用來評(píng)估本章提出的公眾情感分析方法的性能。實(shí)驗(yàn)結(jié)果表明,該方法能夠有效地選擇一個(gè)符合語(yǔ)法規(guī)則的訓(xùn)練集,生成帶有POS信息的公眾情感詞典。另外,我們對(duì)公眾情感詞典樣本進(jìn)行了定性分析,其結(jié)果表明:詞典中的詞匯不僅僅可以顯式地表達(dá)情感,也可以隱含地表達(dá)出潛在的情感。同時(shí),詞典中的每個(gè)詞的詞性對(duì)于檢測(cè)那些具有多義性的情感或者需要依賴上下文信息才能確定的情感取向具有一定的作用。4.在新聞推薦系統(tǒng)中,我們提出了一種新的詞加權(quán)方法用于新事件檢測(cè)。我們將特征劃分為局部元素(Local element)、全局元素(Global element)和局部關(guān)聯(lián)(Topical association)三部分。局部元素(Local element)用來提取每一篇文檔具有識(shí)別能力的特征。全局元素(Global element)用來構(gòu)建整個(gè)語(yǔ)料庫(kù)的統(tǒng)計(jì)模型。此外,我們挖掘出潛在的主題用來建立局部關(guān)聯(lián)(Topical association)關(guān)系。該方法不僅可以表達(dá)每篇新聞報(bào)道的唯一特性,也可以減少一詞多義和多詞同義對(duì)新事件檢測(cè)帶來的影響。另外,在我們提出的詞加權(quán)方法中應(yīng)用了兩種特征降維的方法。實(shí)驗(yàn)結(jié)果表明,我們的方法不僅減少了冗余的特征,同時(shí)也提高了新事件檢測(cè)的性能。
[Abstract]:......
【學(xué)位授予單位】:復(fù)旦大學(xué)
【學(xué)位級(jí)別】:博士
【學(xué)位授予年份】:2014
【分類號(hào)】:TP391.3
本文編號(hào):2477582
[Abstract]:......
【學(xué)位授予單位】:復(fù)旦大學(xué)
【學(xué)位級(jí)別】:博士
【學(xué)位授予年份】:2014
【分類號(hào)】:TP391.3
【參考文獻(xiàn)】
相關(guān)期刊論文 前1條
1 許海玲;吳瀟;李曉東;閻保平;;互聯(lián)網(wǎng)推薦系統(tǒng)比較研究[J];軟件學(xué)報(bào);2009年02期
,本文編號(hào):2477582
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2477582.html
最近更新
教材專著