天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 搜索引擎論文 >

社交網(wǎng)絡(luò)跨媒體國民安全語義學習與微博話題搜索的研究

發(fā)布時間:2020-07-01 11:05
【摘要】:隨著社交網(wǎng)絡(luò)的普及,越來越多的用戶通過社交平臺傳遞信息,使得大量數(shù)據(jù)在社交網(wǎng)絡(luò)上快速、廣泛傳播。社交網(wǎng)絡(luò)中數(shù)據(jù)的存在形式不單是文本,還存在著圖像、視頻等多種類型。因此提取跨媒體數(shù)據(jù)中的語義信息,完成數(shù)據(jù)在統(tǒng)一語義空間中的特征表達具有重大意義。同時,用戶在社交平臺上的信息搜索需求日益增加。對于微博等平臺上文本字數(shù)的限制問題,研究查詢擴展的方法來滿足用戶搜索需求成為熱點。本文完成的主要工作如下:(1)通過對原始AlexNet 網(wǎng)絡(luò)結(jié)構(gòu)進行改進,提出了一個針對社交網(wǎng)絡(luò)數(shù)據(jù)特征提取的新型AlexNet-Social神經(jīng)網(wǎng)絡(luò)模型。AlexNet-Social神經(jīng)網(wǎng)絡(luò)模型可以更為有效地提取社交網(wǎng)絡(luò)數(shù)據(jù)的深度語義信息,并減少模型參數(shù)計算量。在社交網(wǎng)絡(luò)圖像數(shù)據(jù)集上進行實驗,AlexNet-Social神經(jīng)網(wǎng)絡(luò)模型的分類準確度指標比改進前的模型提升約5.6%,AlexNet-Social模型的訓(xùn)練效率比改進前的模型提升約36%。(2)提出了一個針對社交網(wǎng)絡(luò)國民安全類事件的跨媒體語義模型CSMBA(Cross-modal Semantic Model Based on AlexNet-Social),模型采用深度神經(jīng)網(wǎng)絡(luò)分別提取文本與圖像數(shù)據(jù)的特征,并采用注意力機制完成了兩種語義特征的統(tǒng)一表達。在社交網(wǎng)絡(luò)文本與圖像數(shù)據(jù)集上,CSMBA模型對相關(guān)事件識別任務(wù)的精確率、召回值、F值評價指標相比對比模型均有較大提升。(3)提出了一個結(jié)合社交特性與時間因素的微博搜索算法WSAST(Weibo Searching Algorithm Combining Social and Time Factors)。在查詢詞拓展方面,提出了結(jié)合語義相似度與時間相似度進行查詢詞擴展的方法,不但利用了微博文本中的語義信息,而且考慮詞語的時間分布狀況。在搜索結(jié)果重排方面,采用結(jié)合文本詞頻與微博熱度的重排,充分利用微博用戶參與的社交特性來優(yōu)化搜索結(jié)果。實驗表明WSAST算法在搜索準確率指標上相比其他對比算法有最好的表現(xiàn)。WSAST算法有效地提高了微博搜索的表現(xiàn),較好地滿足用戶的搜索需求。(4)設(shè)計實現(xiàn)了微博國民安全事件識別與話題搜索系統(tǒng)。通過需求分析確定系統(tǒng)的五個功能模塊:數(shù)據(jù)預(yù)處理功能模塊、國民安全事件數(shù)據(jù)庫建立模塊、國民安全事件類別擴展模塊、微博話題搜索模塊與系統(tǒng)可視化模塊。對系統(tǒng)功能進行了測試,測試結(jié)果表明系統(tǒng)可以滿足識別微博中國民安全事件以及優(yōu)化用戶搜索的需求。
【學位授予單位】:北京郵電大學
【學位級別】:碩士
【學位授予年份】:2019
【分類號】:TP391.1;TP183
【圖文】:

操作原理,全連接,卷積


卷積操作之后,可以用來降低卷積操作后數(shù)據(jù)的維度,并完成圖像特征的融合。逡逑池化操作主要包括最大池化、平均池化和重疊池化等。在AlexNet中池化操作使逡逑用的是最大池化操作。池化操作原理圖如圖2-1所示。逡逑輸入數(shù)據(jù)逡逑^邐逡逑19?^逡逑__:_____I___邐使川〕2邋大'J、的迪邋r—j—,逡逑3邐4邐8邐1邐化窗||處#邋4邐8逡逑3邐3邐4邐7邐3邐9逡逑12邐9邐6逡逑邐^逡逑圖2-1池化操作原理圖逡逑卷積神經(jīng)網(wǎng)絡(luò)中的全連接層的主要作用是將圖像的二維特征轉(zhuǎn)化成一維的逡逑特征向量。通過使用與輸入數(shù)據(jù)的尺寸大小一致的卷積核進行卷積操作來完成特逡逑征向量的生成。以AlexNet第六層全連接層為例,輸入數(shù)據(jù)大小為(6,邋6,邋256),逡逑使用相同尺寸大小的濾波器完成卷積操作,最終的結(jié)果使用一個神經(jīng)元輸出,濾逡逑波器數(shù)目為4096,生成向量的大小同樣為4096。逡逑2.2跨媒體分析相關(guān)技術(shù)逡逑在計算機領(lǐng)域媒體的含義可以大致分為兩種。第一種是指媒介,即數(shù)據(jù)存儲逡逑的實體比如:硬盤、光盤、半導(dǎo)體存儲材質(zhì)等。第二種則是指信息的載體,數(shù)據(jù)逡逑以何種形式傳播分析,較為常見的載體有文字數(shù)據(jù)、圖像數(shù)據(jù)、語音數(shù)

分析圖,跨媒體,模態(tài)數(shù),模型應(yīng)用


重復(fù)以一定概率選擇一個詞的操作,最后就生成了一篇文檔。而LDA逡逑模型的形成過程是文檔生成的逆過程,即首先得到一篇文檔,然后去獲取文檔的逡逑主題,最后確定主題中有哪些詞。LDA模型跨模態(tài)數(shù)據(jù)分析圖如圖2-2所不。逡逑I邐邐!邋|邐嗣涵-系D邐;逡逑!邐'邐;邐!邋isii邐!逡逑語義關(guān)系丨丨呦..邐最大化:丨逡逑!邐:邐雕入;▲丨.n牛у危赍義希海掊宀凡?邋e潁核荊計義希卞宥喝憾殄澹???逦P(陀嫭_邋i辶x希懾鍑緬澹翦錝肧肧謾跺?邋*邋?雄v|邋I邋卜I邋I邐>邋…逡逑.邐詞嵌入邐;*邐人———丨邋i邐j逡逑^邐f邋*邋?邋?邋f邐f邋f邋.邋.邋.邋f邐^逡逑語料庫詞匯邋|邋|邐深度視覺模指邐|邋!邐涵涵

本文編號:2736675

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2736675.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶4e8c9***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com