天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

文本表示方法對微博Hashtag推薦影響研究——以Twitter上H7N9微博為例

發(fā)布時間:2017-07-31 20:22

  本文關(guān)鍵詞:文本表示方法對微博Hashtag推薦影響研究——以Twitter上H7N9微博為例


  更多相關(guān)文章: Hashtag推薦 K最近鄰 文本表示 深度學(xué)習(xí)


【摘要】:在總結(jié)國內(nèi)外Hashtag推薦方法和短文本表示方法的基礎(chǔ)上,文章利用基于K最近鄰(KNN)的Hashtag推薦方法,將微博文本表示為向量然后計算相似度,從語料中選出與目標(biāo)微博最相似的微博文本,然后抽取候選Hashtag。文章比較了向量空間模型(VSM)、潛在語義分析模型(LSA)、隱含狄利克雷分布模型(LDA)、深度學(xué)習(xí)(DL)等四種文本表示方法對基于KNN的Hashtag推薦效果的影響。以Twitter上H7N9微博為測試數(shù)據(jù),實驗結(jié)果表明深度學(xué)習(xí)的文本表示方法在基于KNN的Hashtag推薦中取得最好的效果。
【作者單位】: 南京理工大學(xué)信息管理系;江蘇省數(shù)據(jù)工程與知識服務(wù)重點實驗室(南京大學(xué));
【關(guān)鍵詞】Hashtag推薦 K最近鄰 文本表示 深度學(xué)習(xí)
【基金】:國家社會科學(xué)基金重大項目“面向突發(fā)事件應(yīng)急決策的快速響應(yīng)情報體系研究”(項目編號:13&ZD174);國家社會科學(xué)基金項目“在線社交網(wǎng)絡(luò)中基于用戶的知識組織模式研究”(項目編號:14BTQ033) 江蘇省數(shù)據(jù)工程與知識服務(wù)重點實驗室開放課題“在線社交網(wǎng)絡(luò)上交叉學(xué)科用戶知識結(jié)構(gòu)發(fā)現(xiàn)及其興趣演變研究”(項目編號:DEKS2014KT006)研究成果之一
【分類號】:TP391.1;TP393.092
【正文快照】: 1引言當(dāng)前,各種主流微博平臺都提供Hashtag標(biāo)注功能,如關(guān)于馬航墜機事件的Hashtag在Twitter中為“#MH370”,在新浪微博中為“#MH370#”,雖然不同微博平臺中Hashtag的具體標(biāo)記形式可能不同,但功能基本相同,都具有主題標(biāo)注和話題參與的功能[1-3]。主題標(biāo)注功能指Hashtag能夠表達(dá)

【參考文獻(xiàn)】

中國期刊全文數(shù)據(jù)庫 前1條

1 邸亮;杜永萍;;LDA模型在微博用戶推薦中的應(yīng)用[J];計算機工程;2014年05期

【共引文獻(xiàn)】

中國期刊全文數(shù)據(jù)庫 前10條

1 馬寧;劉怡君;;基于超網(wǎng)絡(luò)中超邊排序算法的網(wǎng)絡(luò)輿論領(lǐng)袖識別[J];系統(tǒng)工程;2013年09期

2 馬寶君;張楠;孫濤;;智慧城市背景下公眾反饋大數(shù)據(jù)分析:概率主題建模的視角[J];電子政務(wù);2013年12期

3 易軍凱;田立康;;基于類別區(qū)分度的文本特征選擇算法研究[J];北京化工大學(xué)學(xué)報(自然科學(xué)版);2013年S1期

4 代寬;趙輝;韓冬;宋天勇;;基于向量空間模型的中文網(wǎng)頁主題特征項抽取[J];吉林大學(xué)學(xué)報(信息科學(xué)版);2014年01期

5 吳瑞紅;呂學(xué)強;;基于互聯(lián)網(wǎng)的術(shù)語定義辨析[J];北京大學(xué)學(xué)報(自然科學(xué)版);2014年01期

6 羅琦;;一種最大分類間隔SVDD的多類文本分類算法[J];電訊技術(shù);2014年04期

7 方躍勝;姚宏亮;;基于電力公司的多格式文檔智能信息檢索系統(tǒng)的設(shè)計與實現(xiàn)[J];重慶科技學(xué)院學(xué)報(自然科學(xué)版);2014年04期

8 李超;李昂;朱耿良;;基于限制性玻爾茲曼機的微博主題分類[J];電信網(wǎng)技術(shù);2014年07期

9 黃永鋒;李奇;;基于特征項聚合的古典詩歌分類模型[J];東華大學(xué)學(xué)報(自然科學(xué)版);2014年05期

10 徐曉彤;胡松筠;;社交網(wǎng)站用戶興趣模型研究[J];科技和產(chǎn)業(yè);2014年11期

中國重要會議論文全文數(shù)據(jù)庫 前1條

1 劉權(quán);郭武;;基于核主成分分析的話題跟蹤系統(tǒng)[A];第十二屆全國人機語音通訊學(xué)術(shù)會議(NCMMSC'2013)論文集[C];2013年

中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條

1 王寶勛;面向網(wǎng)絡(luò)社區(qū)問答對的語義挖掘研究[D];哈爾濱工業(yè)大學(xué);2013年

2 張俊三;Web中相關(guān)實體發(fā)現(xiàn)研究[D];北京交通大學(xué);2013年

3 張乃靜;基于林業(yè)科學(xué)數(shù)據(jù)的語義檢索研究[D];中國林業(yè)科學(xué)研究院;2013年

4 劉瀏;基于內(nèi)容的重排列視頻檢索技術(shù)研究[D];上海交通大學(xué);2013年

5 呂英杰;網(wǎng)絡(luò)健康社區(qū)中的文本挖掘方法研究[D];上海交通大學(xué);2013年

6 張琦;基于聚合場模型的數(shù)據(jù)競爭算法及其應(yīng)用研究[D];哈爾濱工程大學(xué);2013年

7 譚琦;面向跨領(lǐng)域文檔分類的異構(gòu)遷移學(xué)習(xí)算法研究[D];華南理工大學(xué);2013年

8 張琳;基于引用聚類的多文檔自動文摘技術(shù)研究[D];大連海事大學(xué);2013年

9 蕭箏;客戶需求信息處理理論和方法研究[D];武漢理工大學(xué);2013年

10 張瑩;在線新聞評論的情感分析研究[D];南開大學(xué);2013年

中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條

1 謝娜娜;基于不均衡數(shù)據(jù)集的文本分類算法研究[D];重慶大學(xué);2013年

2 王強;非均衡文本分類的特征選擇研究[D];南京師范大學(xué);2013年

3 項峻求;文本分類在電子政務(wù)平臺中的應(yīng)用與研究[D];南昌大學(xué);2013年

4 余峰;項目評審專家推薦方法研究[D];昆明理工大學(xué);2013年

5 張睿;基于SVM的中文文本分類相關(guān)算法研究與實現(xiàn)[D];昆明理工大學(xué);2013年

6 張健飛;子空間分類算法研究及應(yīng)用[D];福建師范大學(xué);2013年

7 杜娟娟;主題爬蟲算法的研究與實現(xiàn)[D];蘭州交通大學(xué);2013年

8 許鈺;基于半監(jiān)督SVM主動學(xué)習(xí)的文本分類算法研究[D];蘭州交通大學(xué);2013年

9 陳華城;基于本體的文檔敏感信息檢測關(guān)鍵技術(shù)研究[D];解放軍信息工程大學(xué);2013年

10 陳永光;基于OPAC的高校圖書館個性化圖書推薦算法研究[D];南京理工大學(xué);2013年

【二級參考文獻(xiàn)】

中國期刊全文數(shù)據(jù)庫 前3條

1 張晨逸;孫建伶;丁軼群;;基于MB-LDA模型的微博主題挖掘[J];計算機研究與發(fā)展;2011年10期

2 張曉艷;王挺;梁曉波;;LDA模型在話題追蹤中的應(yīng)用[J];計算機科學(xué);2011年S1期

3 孫昌年;鄭誠;夏青松;;基于LDA的中文文本相似度計算[J];計算機技術(shù)與發(fā)展;2013年01期

,

本文編號:600999

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/ydhl/600999.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶cc987***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com