基于改良LDA模型的微博用戶信息推薦機理研究
發(fā)布時間:2021-07-03 17:14
隨著微博信息海量化的迅速增長,網(wǎng)絡(luò)信息生態(tài)面臨挑戰(zhàn)。面對微博信息總量的巨大和用戶矩陣稀疏的問題,目前主流的微博信息推薦主題模型LDA及其改良模型已難以實現(xiàn)海量非結(jié)構(gòu)化數(shù)據(jù)的主題提取,從而使LDA模型在微博信息推薦過程中短文本處理能力差的缺點被放大,致使微博用戶信息個性化推薦精準(zhǔn)度不足,用戶體驗度與滿意度下降,阻礙了微博的深入推廣,也給輿情管控帶來了不確定性。借助大數(shù)據(jù)處理技術(shù)的快速數(shù)據(jù)處理與非結(jié)構(gòu)化數(shù)據(jù)處理優(yōu)勢,筆者將其作為微博信息預(yù)處理手段,以LDA主題模型為微博信息再次過濾方式,構(gòu)建出了相對完善的微博信息推薦模型并予以了實證驗證,并在此基礎(chǔ)上提出微博信息管控的策略。論文首先論述了選題來源及背景和意義,詳細闡述了國內(nèi)外學(xué)者對于LDA主題模型的研究現(xiàn)狀,分析出目前對于LDA主題模型的研究尚存在的主要問題,提出了未來個性化推薦主題模型LDA研究的三個主要方向,描述了本選題的主要研究內(nèi)容和研究的技術(shù)路線,并且還介紹了本選題研究主要使用的研究方法和選題的主要創(chuàng)新點。同時,筆者還論述了社會網(wǎng)絡(luò)、數(shù)據(jù)采集技術(shù)、數(shù)據(jù)預(yù)處理技術(shù)、大數(shù)據(jù)技術(shù)等相關(guān)基礎(chǔ)理論。在上述研究的基礎(chǔ)之上,筆者利用大數(shù)據(jù)技術(shù)處理...
【文章來源】:東北電力大學(xué)吉林省
【文章頁數(shù)】:56 頁
【學(xué)位級別】:碩士
【部分圖文】:
Hadoop集群環(huán)境與配置
第 4 章 實證分析與研究100000 條,Data3:1000000 條。筆者通過分析與研究發(fā)現(xiàn),大數(shù)據(jù)技術(shù)對于微博信息的處理結(jié)果及效率主要會受到兩方面因素的影響,一方面是分布式節(jié)點的多少,而另一方面是數(shù)據(jù)量大小的影響,下面筆者將著重分析這兩方面因素對于微博信息處理結(jié)果及效率的影響程度。
Hadoop微博數(shù)據(jù)處理過程
【參考文獻】:
期刊論文
[1]一種結(jié)合主題模型的推薦算法[J]. 曹占偉,胡曉鵬. 計算機應(yīng)用研究. 2019(06)
[2]基于LDA主題模型的標(biāo)簽混合推薦研究[J]. 熊回香,竇燕. 圖書情報工作. 2018(03)
[3]大數(shù)據(jù)下微博推薦算法[J]. 張磊,吾守爾·斯拉木,買買提依明·哈斯木,于清. 激光雜志. 2016(06)
[4]基于Folksonmy和本體融合的微博信息推薦方法研究[J]. 崔金棟,孫遙遙,王欣,于圓美,王新媛. 情報科學(xué). 2015(10)
[5]基于RBLDA模型和交互關(guān)系的微博標(biāo)簽推薦算法[J]. 余勇,郭躬德. 計算機系統(tǒng)應(yīng)用. 2015(08)
[6]大數(shù)據(jù)背景下微博輿情信息交互模型研究[J]. 蘭月新,董希琳,蘇國強,瞿志凱. 現(xiàn)代圖書情報技術(shù). 2015(05)
[7]信息管理技術(shù)視角下微博研究綜述與趨勢分析[J]. 崔金棟,于圓美,王新媛,孫遙遙. 圖書館論壇. 2015(04)
[8]基于隱含狄利克雷分配的微博推薦模型研究[J]. 唐曉波,房小可. 情報科學(xué). 2015(02)
[9]基于加權(quán)動態(tài)興趣度的微博個性化推薦[J]. 陶永才,何宗真,石磊,衛(wèi)琳,曹仰杰. 計算機應(yīng)用. 2014(12)
[10]基于MapReduce的并行聚類算法設(shè)計與實現(xiàn)[J]. 劉向東,劉奎,胡飛翔,王翠榮. 計算機應(yīng)用與軟件. 2014(11)
本文編號:3263010
【文章來源】:東北電力大學(xué)吉林省
【文章頁數(shù)】:56 頁
【學(xué)位級別】:碩士
【部分圖文】:
Hadoop集群環(huán)境與配置
第 4 章 實證分析與研究100000 條,Data3:1000000 條。筆者通過分析與研究發(fā)現(xiàn),大數(shù)據(jù)技術(shù)對于微博信息的處理結(jié)果及效率主要會受到兩方面因素的影響,一方面是分布式節(jié)點的多少,而另一方面是數(shù)據(jù)量大小的影響,下面筆者將著重分析這兩方面因素對于微博信息處理結(jié)果及效率的影響程度。
Hadoop微博數(shù)據(jù)處理過程
【參考文獻】:
期刊論文
[1]一種結(jié)合主題模型的推薦算法[J]. 曹占偉,胡曉鵬. 計算機應(yīng)用研究. 2019(06)
[2]基于LDA主題模型的標(biāo)簽混合推薦研究[J]. 熊回香,竇燕. 圖書情報工作. 2018(03)
[3]大數(shù)據(jù)下微博推薦算法[J]. 張磊,吾守爾·斯拉木,買買提依明·哈斯木,于清. 激光雜志. 2016(06)
[4]基于Folksonmy和本體融合的微博信息推薦方法研究[J]. 崔金棟,孫遙遙,王欣,于圓美,王新媛. 情報科學(xué). 2015(10)
[5]基于RBLDA模型和交互關(guān)系的微博標(biāo)簽推薦算法[J]. 余勇,郭躬德. 計算機系統(tǒng)應(yīng)用. 2015(08)
[6]大數(shù)據(jù)背景下微博輿情信息交互模型研究[J]. 蘭月新,董希琳,蘇國強,瞿志凱. 現(xiàn)代圖書情報技術(shù). 2015(05)
[7]信息管理技術(shù)視角下微博研究綜述與趨勢分析[J]. 崔金棟,于圓美,王新媛,孫遙遙. 圖書館論壇. 2015(04)
[8]基于隱含狄利克雷分配的微博推薦模型研究[J]. 唐曉波,房小可. 情報科學(xué). 2015(02)
[9]基于加權(quán)動態(tài)興趣度的微博個性化推薦[J]. 陶永才,何宗真,石磊,衛(wèi)琳,曹仰杰. 計算機應(yīng)用. 2014(12)
[10]基于MapReduce的并行聚類算法設(shè)計與實現(xiàn)[J]. 劉向東,劉奎,胡飛翔,王翠榮. 計算機應(yīng)用與軟件. 2014(11)
本文編號:3263010
本文鏈接:http://sikaile.net/xinwenchuanbolunwen/3263010.html
最近更新
教材專著