基于詞向量語義分類的微博實體鏈接方法
本文關(guān)鍵詞:基于詞向量語義分類的微博實體鏈接方法,由筆耕文化傳播整理發(fā)布。
【摘要】:微博實體鏈接是把微博中給定的指稱鏈接到知識庫的過程,廣泛應用于信息抽取、自動問答等自然語言處理任務(Natural language processing,NLP).由于微博內(nèi)容簡短,傳統(tǒng)長文本實體鏈接的算法并不能很好地用于微博實體鏈接任務.以往研究大都基于實體指稱及其上下文構(gòu)建模型進行消歧,難以識別具有相似詞匯和句法特征的候選實體.本文充分利用指稱和候選實體本身所含有的語義信息,提出在詞向量層面對任務進行抽象建模,并設(shè)計一種基于詞向量語義分類的微博實體鏈接方法.首先通過神經(jīng)網(wǎng)絡訓練詞向量模板,然后通過實體聚類獲得類別標簽作為特征,再通過多分類模型預測目標實體的主題類別來完成實體消歧.在NLPCC2014公開評測數(shù)據(jù)集上的實驗結(jié)果表明,本文方法的準確率和召回率均高于此前已報道的最佳結(jié)果,特別是實體鏈接準確率有顯著提升.
【作者單位】: 北京理工大學計算機學院;北京市海量語言信息處理與云計算應用工程技術(shù)研究中心;
【關(guān)鍵詞】: 詞向量 實體鏈接 社會媒體處理 神經(jīng)網(wǎng)絡 多分類
【基金】:國家重點基礎(chǔ)研究發(fā)展計劃(973計劃)(2013CB329303) 國家高技術(shù)研究發(fā)展計劃(863計劃)(2015AA015404) 國家自然科學基金(61502035) 高等學校博士學科點專項科研基金(20121101120026)資助~~
【分類號】:TP391.1;TP393.092
【正文快照】: 微博是一種通過關(guān)注機制分享簡短實時信息的廣播式的社交網(wǎng)絡平臺,已成為目前最流行的社交 平臺之一.截至2014年9月30日,微博的月活躍用戶已經(jīng)達到1.67億,用戶每天產(chǎn)生的微博數(shù)目達到2億[1].如何從海量微博中自動地及時分析、獲得信息已成為研究和應用熱點問題,微博實體鏈接
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 奚偉鵬,李昕,武港山;超鏈語義分類系統(tǒng)的設(shè)計與實現(xiàn)[J];計算機應用研究;2004年11期
2 左云存;宗成慶;;基于語義分類樹的漢語口語理解方法[J];中文信息學報;2006年02期
3 喬榮華;周明全;耿國華;;基于語義分類的文物圖像標注研究[J];計算機技術(shù)與發(fā)展;2007年07期
4 邢玲;賀梅;馬強;朱敏;;基于張量神經(jīng)網(wǎng)絡的音頻多語義分類方法[J];計算機應用;2012年10期
5 朱虹;吳云芳;;基于語義分類體系的信息分類編碼標準分類框架研究[J];標準科學;2011年10期
6 魏維;徐建;劉鳳玉;許滿武;;具有多峰正態(tài)分布屬性的視頻語義分類研究[J];計算機科學;2006年04期
7 許天兵;基于Bayes算法實現(xiàn)圖像語義分類[J];微型機與應用;2004年11期
8 李旭明;戴青云;曹江中;曹璐;;基于語義分類的外觀專利圖像快速檢索系統(tǒng)[J];計算機工程與應用;2012年16期
9 印勇;呂軼超;;圖像語義分類的樹結(jié)構(gòu)SVM方法[J];計算機工程與應用;2012年12期
10 羅安;王勇;張福浩;劉紀平;;基于角色標注的中文POI名稱語義分類方法[J];測繪通報;2012年S1期
中國重要會議論文全文數(shù)據(jù)庫 前9條
1 陳潔;畢玉德;李琳;;現(xiàn)代韓國語“控制”類動詞下位語義分類研究[A];第五屆全國青年計算語言學研討會論文集[C];2010年
2 閆丹輝;;越南語動詞語義分類研究[A];第十一屆全國人機語音通訊學術(shù)會議論文集(一)[C];2011年
3 海銀花;那順烏日圖;;面向“蒙古語語義信息詞典”的名詞語義分類體系[A];中國計算機語言學研究前沿進展(2007-2009)[C];2009年
4 馬永騰;亢世勇;;新編同義詞詞林語義分類體系[A];第三屆學生計算語言學研討會論文集[C];2006年
5 管芳;劉志洪;顧寧;宗宇偉;丁志剛;張紹華;張泉;;船舶工程圖紙的語義分類與查詢[A];第二十二屆中國數(shù)據(jù)庫學術(shù)會議論文集(技術(shù)報告篇)[C];2005年
6 孫季豐;邱衛(wèi)東;余衛(wèi)宇;余英林;;基于神經(jīng)網(wǎng)絡的圖像語義分類的研究[A];第十三屆全國圖象圖形學學術(shù)會議論文集[C];2006年
7 高鳳榮;杜小勇;王珊;;數(shù)字圖書館環(huán)境下一種基于語義分類的個性化推薦算法[A];第二十屆全國數(shù)據(jù)庫學術(shù)會議論文集(研究報告篇)[C];2003年
8 羅安;王勇;張福浩;劉紀平;;基于角色標注的中文POI名稱語義分類方法[A];第四屆“測繪科學前沿技術(shù)論壇”論文精選[C];2012年
9 易綿竹;姚愛鋼;劉萬義;;從計算語義學角度看俄語形容詞的語義分類問題[A];中國計算機語言學研究前沿進展(2007-2009)[C];2009年
中國碩士學位論文全文數(shù)據(jù)庫 前7條
1 高彥;語義分類方法在淘寶評論文本中應用研究[D];河北大學;2015年
2 曾雪強;潛在語義分類模型的研究[D];江西師范大學;2005年
3 桑小川;基于語義的圖像檢索技術(shù)研究[D];西安電子科技大學;2007年
4 何婕;二叉樹多分類SVM及其在圖像語義分類中的應用[D];重慶師范大學;2012年
5 袁樹明;基于自然語言理解的車輛行駛指令抽取[D];北京郵電大學;2013年
6 杜騫;深度學習在圖像語義分類中的應用[D];華中師范大學;2014年
7 扎西草;藏語藻飾詞信息庫構(gòu)建研究[D];西北民族大學;2014年
本文關(guān)鍵詞:基于詞向量語義分類的微博實體鏈接方法,由筆耕文化傳播整理發(fā)布。
,本文編號:463272
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/463272.html