文本表示方法對(duì)微博Hashtag推薦影響研究——以Twitter上H7N9微博為例
本文關(guān)鍵詞:文本表示方法對(duì)微博Hashtag推薦影響研究——以Twitter上H7N9微博為例
更多相關(guān)文章: Hashtag推薦 K最近鄰 文本表示 深度學(xué)習(xí)
【摘要】:在總結(jié)國(guó)內(nèi)外Hashtag推薦方法和短文本表示方法的基礎(chǔ)上,文章利用基于K最近鄰(KNN)的Hashtag推薦方法,將微博文本表示為向量然后計(jì)算相似度,從語(yǔ)料中選出與目標(biāo)微博最相似的微博文本,然后抽取候選Hashtag。文章比較了向量空間模型(VSM)、潛在語(yǔ)義分析模型(LSA)、隱含狄利克雷分布模型(LDA)、深度學(xué)習(xí)(DL)等四種文本表示方法對(duì)基于KNN的Hashtag推薦效果的影響。以Twitter上H7N9微博為測(cè)試數(shù)據(jù),實(shí)驗(yàn)結(jié)果表明深度學(xué)習(xí)的文本表示方法在基于KNN的Hashtag推薦中取得最好的效果。
【作者單位】: 南京理工大學(xué)信息管理系;江蘇省數(shù)據(jù)工程與知識(shí)服務(wù)重點(diǎn)實(shí)驗(yàn)室(南京大學(xué));
【關(guān)鍵詞】: Hashtag推薦 K最近鄰 文本表示 深度學(xué)習(xí)
【基金】:國(guó)家社會(huì)科學(xué)基金重大項(xiàng)目“面向突發(fā)事件應(yīng)急決策的快速響應(yīng)情報(bào)體系研究”(項(xiàng)目編號(hào):13&ZD174);國(guó)家社會(huì)科學(xué)基金項(xiàng)目“在線社交網(wǎng)絡(luò)中基于用戶(hù)的知識(shí)組織模式研究”(項(xiàng)目編號(hào):14BTQ033) 江蘇省數(shù)據(jù)工程與知識(shí)服務(wù)重點(diǎn)實(shí)驗(yàn)室開(kāi)放課題“在線社交網(wǎng)絡(luò)上交叉學(xué)科用戶(hù)知識(shí)結(jié)構(gòu)發(fā)現(xiàn)及其興趣演變研究”(項(xiàng)目編號(hào):DEKS2014KT006)研究成果之一
【分類(lèi)號(hào)】:TP391.1;TP393.092
【正文快照】: 1引言當(dāng)前,各種主流微博平臺(tái)都提供Hashtag標(biāo)注功能,如關(guān)于馬航墜機(jī)事件的Hashtag在Twitter中為“#MH370”,在新浪微博中為“#MH370#”,雖然不同微博平臺(tái)中Hashtag的具體標(biāo)記形式可能不同,但功能基本相同,都具有主題標(biāo)注和話(huà)題參與的功能[1-3]。主題標(biāo)注功能指Hashtag能夠表達(dá)
【參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前1條
1 邸亮;杜永萍;;LDA模型在微博用戶(hù)推薦中的應(yīng)用[J];計(jì)算機(jī)工程;2014年05期
【共引文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 馬寧;劉怡君;;基于超網(wǎng)絡(luò)中超邊排序算法的網(wǎng)絡(luò)輿論領(lǐng)袖識(shí)別[J];系統(tǒng)工程;2013年09期
2 馬寶君;張楠;孫濤;;智慧城市背景下公眾反饋大數(shù)據(jù)分析:概率主題建模的視角[J];電子政務(wù);2013年12期
3 易軍凱;田立康;;基于類(lèi)別區(qū)分度的文本特征選擇算法研究[J];北京化工大學(xué)學(xué)報(bào)(自然科學(xué)版);2013年S1期
4 代寬;趙輝;韓冬;宋天勇;;基于向量空間模型的中文網(wǎng)頁(yè)主題特征項(xiàng)抽取[J];吉林大學(xué)學(xué)報(bào)(信息科學(xué)版);2014年01期
5 吳瑞紅;呂學(xué)強(qiáng);;基于互聯(lián)網(wǎng)的術(shù)語(yǔ)定義辨析[J];北京大學(xué)學(xué)報(bào)(自然科學(xué)版);2014年01期
6 羅琦;;一種最大分類(lèi)間隔SVDD的多類(lèi)文本分類(lèi)算法[J];電訊技術(shù);2014年04期
7 方躍勝;姚宏亮;;基于電力公司的多格式文檔智能信息檢索系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J];重慶科技學(xué)院學(xué)報(bào)(自然科學(xué)版);2014年04期
8 李超;李昂;朱耿良;;基于限制性玻爾茲曼機(jī)的微博主題分類(lèi)[J];電信網(wǎng)技術(shù);2014年07期
9 黃永鋒;李奇;;基于特征項(xiàng)聚合的古典詩(shī)歌分類(lèi)模型[J];東華大學(xué)學(xué)報(bào)(自然科學(xué)版);2014年05期
10 徐曉彤;胡松筠;;社交網(wǎng)站用戶(hù)興趣模型研究[J];科技和產(chǎn)業(yè);2014年11期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前1條
1 劉權(quán);郭武;;基于核主成分分析的話(huà)題跟蹤系統(tǒng)[A];第十二屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議(NCMMSC'2013)論文集[C];2013年
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 王寶勛;面向網(wǎng)絡(luò)社區(qū)問(wèn)答對(duì)的語(yǔ)義挖掘研究[D];哈爾濱工業(yè)大學(xué);2013年
2 張俊三;Web中相關(guān)實(shí)體發(fā)現(xiàn)研究[D];北京交通大學(xué);2013年
3 張乃靜;基于林業(yè)科學(xué)數(shù)據(jù)的語(yǔ)義檢索研究[D];中國(guó)林業(yè)科學(xué)研究院;2013年
4 劉瀏;基于內(nèi)容的重排列視頻檢索技術(shù)研究[D];上海交通大學(xué);2013年
5 呂英杰;網(wǎng)絡(luò)健康社區(qū)中的文本挖掘方法研究[D];上海交通大學(xué);2013年
6 張琦;基于聚合場(chǎng)模型的數(shù)據(jù)競(jìng)爭(zhēng)算法及其應(yīng)用研究[D];哈爾濱工程大學(xué);2013年
7 譚琦;面向跨領(lǐng)域文檔分類(lèi)的異構(gòu)遷移學(xué)習(xí)算法研究[D];華南理工大學(xué);2013年
8 張琳;基于引用聚類(lèi)的多文檔自動(dòng)文摘技術(shù)研究[D];大連海事大學(xué);2013年
9 蕭箏;客戶(hù)需求信息處理理論和方法研究[D];武漢理工大學(xué);2013年
10 張瑩;在線新聞評(píng)論的情感分析研究[D];南開(kāi)大學(xué);2013年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 謝娜娜;基于不均衡數(shù)據(jù)集的文本分類(lèi)算法研究[D];重慶大學(xué);2013年
2 王強(qiáng);非均衡文本分類(lèi)的特征選擇研究[D];南京師范大學(xué);2013年
3 項(xiàng)峻求;文本分類(lèi)在電子政務(wù)平臺(tái)中的應(yīng)用與研究[D];南昌大學(xué);2013年
4 余峰;項(xiàng)目評(píng)審專(zhuān)家推薦方法研究[D];昆明理工大學(xué);2013年
5 張睿;基于SVM的中文文本分類(lèi)相關(guān)算法研究與實(shí)現(xiàn)[D];昆明理工大學(xué);2013年
6 張健飛;子空間分類(lèi)算法研究及應(yīng)用[D];福建師范大學(xué);2013年
7 杜娟娟;主題爬蟲(chóng)算法的研究與實(shí)現(xiàn)[D];蘭州交通大學(xué);2013年
8 許鈺;基于半監(jiān)督SVM主動(dòng)學(xué)習(xí)的文本分類(lèi)算法研究[D];蘭州交通大學(xué);2013年
9 陳華城;基于本體的文檔敏感信息檢測(cè)關(guān)鍵技術(shù)研究[D];解放軍信息工程大學(xué);2013年
10 陳永光;基于OPAC的高校圖書(shū)館個(gè)性化圖書(shū)推薦算法研究[D];南京理工大學(xué);2013年
【二級(jí)參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前3條
1 張晨逸;孫建伶;丁軼群;;基于MB-LDA模型的微博主題挖掘[J];計(jì)算機(jī)研究與發(fā)展;2011年10期
2 張曉艷;王挺;梁曉波;;LDA模型在話(huà)題追蹤中的應(yīng)用[J];計(jì)算機(jī)科學(xué);2011年S1期
3 孫昌年;鄭誠(chéng);夏青松;;基于LDA的中文文本相似度計(jì)算[J];計(jì)算機(jī)技術(shù)與發(fā)展;2013年01期
,本文編號(hào):600999
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/600999.html