天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于潛在語義與圖結(jié)構(gòu)的微博語義檢索

發(fā)布時(shí)間:2019-02-13 20:13
【摘要】:微博文本短小、特征稀疏、與用戶查詢之間存在語義鴻溝的特點(diǎn)會(huì)降低語義檢索效率。針對(duì)該問題,結(jié)合文本特征和知識(shí)庫語義,構(gòu)建基于潛在語義與圖結(jié)構(gòu)的語義檢索模型。通過Tversky算法計(jì)算基于Hashtag的特征相關(guān)度;利用隱含狄利克雷分布算法對(duì)Wikipedia語料庫訓(xùn)練主題模型,基于JSD距離計(jì)算映射到該模型的文本主題相關(guān)度;抽取DBpedia中實(shí)體及其網(wǎng)絡(luò)關(guān)系連接圖,使用SimRank算法計(jì)算圖中實(shí)體間的相關(guān)度。綜合以上3個(gè)結(jié)果得到最終相關(guān)度。通過短文本和長文本檢索對(duì)Twitter子集進(jìn)行實(shí)驗(yàn),結(jié)果表明,與基于開放關(guān)聯(lián)數(shù)據(jù)和圖論的方法相比,該模型在評(píng)估指標(biāo)MAP,P@30,R-Prec上分別提高了2.98%,6.40%,5.16%,具有較好的檢索性能。
[Abstract]:The semantic gap between Weibo text and user query will reduce the efficiency of semantic retrieval. To solve this problem, a semantic retrieval model based on latent semantics and graph structure is constructed by combining text features and knowledge base semantics. The feature correlation degree based on Hashtag is calculated by Tversky algorithm, the topic model of Wikipedia corpus is trained by implicit Dirichlet distribution algorithm, and the relevance degree of text topic mapped to the model is calculated based on JSD distance. The connection graph of entities and their networks in DBpedia is extracted, and the correlation between entities in the graph is calculated by using SimRank algorithm. Combined with the above three results, the final correlation was obtained. The experiment on Twitter subset by short text retrieval and long text retrieval shows that compared with the method based on open association data and graph theory, the model increases 2.98% 6.40% in MAP,P@30,R-Prec, respectively. 5.16, with better retrieval performance.
【作者單位】: 欽州學(xué)院電子與信息工程學(xué)院;華南師范大學(xué)計(jì)算機(jī)學(xué)院;鄭州輕工業(yè)學(xué)院軟件學(xué)院;
【基金】:國家自然科學(xué)基金(61272066) 廣西高校中青年教師基礎(chǔ)能力提升項(xiàng)目(KY2016LX431) 廣州市科技計(jì)劃項(xiàng)目(2014J4100031) 欽州市科學(xué)研究與技術(shù)開發(fā)計(jì)劃項(xiàng)目(20164407)
【分類號(hào)】:TP391.1;TP393.092

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 張慧;蔣開偉;馮玉珉;;圖像和視頻的語義檢索[J];科技信息;2006年10期

2 李晨光;;基于本體的網(wǎng)絡(luò)問答式語義檢索系統(tǒng)[J];科技情報(bào)開發(fā)與經(jīng)濟(jì);2008年32期

3 黃敏;賴茂生;;語義檢索研究綜述[J];圖書情報(bào)工作;2008年06期

4 胡哲;鄭誠;王艷玲;;語義檢索關(guān)鍵技術(shù)研究[J];計(jì)算機(jī)技術(shù)與發(fā)展;2008年10期

5 劉珊慧;萬韻;楊樂;;基于本體的農(nóng)業(yè)信息資源語義檢索過程研究[J];安徽農(nóng)業(yè)科學(xué);2009年23期

6 楚書來;張瑞;;基于本體的語義檢索技術(shù)研究[J];黑龍江科技信息;2010年24期

7 付苓;崔新春;謝娟;連慧平;;基于語義信息鏈的語義檢索研究[J];山東圖書館學(xué)刊;2010年04期

8 張世勇;陳運(yùn)啟;;基于概念匹配的語義檢索模型研究[J];重慶工商大學(xué)學(xué)報(bào)(自然科學(xué)版);2010年05期

9 馬中杰;鄭誠;蘇喻;;一種基于知識(shí)庫的語義檢索系統(tǒng)模型[J];微型機(jī)與應(yīng)用;2010年20期

10 李林;王紅;付宇;楊璇;王靜;;民航突發(fā)事件應(yīng)急案例語義檢索方法研究[J];計(jì)算機(jī)工程與設(shè)計(jì);2011年03期

相關(guān)會(huì)議論文 前7條

1 王洪俊 ;沈水榮 ;黃,

本文編號(hào):2421826


資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/ydhl/2421826.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶26ef5***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com