天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 社科論文 > 圖書檔案論文 >

多領(lǐng)域跨媒體科技大數(shù)據(jù)高效檢索查詢研究

發(fā)布時(shí)間:2024-05-16 00:10
  經(jīng)過(guò)學(xué)者和科研人員的不懈努力以及信息化技術(shù)的不斷發(fā)展和普及,互聯(lián)網(wǎng)上迅速積累了海量的科技大數(shù)據(jù)。不同于互聯(lián)網(wǎng)上爆發(fā)式增長(zhǎng)的新聞、社交等信息,科技大數(shù)據(jù)有其獨(dú)特的一面?萍紨(shù)據(jù)主要以論文和學(xué)者信息等具有學(xué)術(shù)風(fēng)格的資源為主體構(gòu)成,其數(shù)量龐大但數(shù)據(jù)的冗余信息少,具有專業(yè)性強(qiáng)但不同領(lǐng)域間差異性大的特點(diǎn)。在對(duì)科技資源進(jìn)行檢索查詢時(shí),一方面由于科技大數(shù)據(jù)的獨(dú)特?cái)?shù)據(jù)特性導(dǎo)致了傳統(tǒng)的檢索算法難以滿足學(xué)者用戶的需求。另一方面,科技大數(shù)據(jù)的多模態(tài)以及異構(gòu)性對(duì)科技資源的獲取與處理提出了更高的要求;谶@樣的背景,針對(duì)多領(lǐng)域跨媒體科技大數(shù)據(jù)的高效檢索查詢研究具有非常重要的意義。本文完成的主要工作如下:(1)提出了多模態(tài)科技大數(shù)據(jù)深度特征提取與表示方法。針對(duì)科技大數(shù)據(jù)中的文本資源,提出了基于密集卷積注意力的特征表示(FR-DCA)算法,利用密集卷積結(jié)構(gòu)結(jié)合雙向LSTM循環(huán)神經(jīng)網(wǎng)絡(luò)進(jìn)行文本特征的深度提取;針對(duì)科技大數(shù)據(jù)中的圖像資源,從圖像輸入尺寸的不一致問(wèn)題出發(fā),提出了利用含有空間金字塔池化的卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行圖像特征深度提取。實(shí)驗(yàn)結(jié)果表明,所提出的兩種科技資源特征表示方法在精確率、召回率和F1值等指標(biāo)上普遍優(yōu)于對(duì)...

【文章頁(yè)數(shù)】:100 頁(yè)

【學(xué)位級(jí)別】:碩士

【部分圖文】:

圖3-1多領(lǐng)域跨媒體科技大數(shù)據(jù)的獲取與特征表示總體架構(gòu)??3.1多領(lǐng)域跨媒體科技大數(shù)據(jù)的獲取與處理??科技資源不同于社交、新聞等數(shù)據(jù),科技資源由于天然具有的專業(yè)性,因此??數(shù)據(jù)的分布呈現(xiàn)比較強(qiáng)的集中性

圖3-1多領(lǐng)域跨媒體科技大數(shù)據(jù)的獲取與特征表示總體架構(gòu)??3.1多領(lǐng)域跨媒體科技大數(shù)據(jù)的獲取與處理??科技資源不同于社交、新聞等數(shù)據(jù),科技資源由于天然具有的專業(yè)性,因此??數(shù)據(jù)的分布呈現(xiàn)比較強(qiáng)的集中性

?第三章多領(lǐng)域跨媒體科技大數(shù)據(jù)的獲取與特征表示???第三章多領(lǐng)域跨媒體科技大數(shù)據(jù)的獲取與特征表示??本章給出了多領(lǐng)域跨媒體科技大數(shù)據(jù)的獲取與特征表示方法。針對(duì)海量的多??模態(tài)科技資源,設(shè)計(jì)出一種基于發(fā)布-訂閱模式的科技大數(shù)據(jù)采集、處理與持久??化體系。針對(duì)科技大數(shù)據(jù)中文本資源在不....


圖3-2多領(lǐng)域跨媒體科技資源實(shí)時(shí)采集系統(tǒng)架構(gòu)??釆集系統(tǒng)主要包含以下幾個(gè)組件:采集引擎、爬蟲、調(diào)度器、下載器、管道、??中間件

圖3-2多領(lǐng)域跨媒體科技資源實(shí)時(shí)采集系統(tǒng)架構(gòu)??釆集系統(tǒng)主要包含以下幾個(gè)組件:采集引擎、爬蟲、調(diào)度器、下載器、管道、??中間件

北京郵電大學(xué)工學(xué)碩士學(xué)位論文??的跨學(xué)科特點(diǎn),對(duì)于不同的數(shù)據(jù)在后續(xù)的研究中需要做不同的預(yù)處理和持久化,??因此需要一種靈活的數(shù)據(jù)處理體系。本節(jié)設(shè)計(jì)了一種針對(duì)科技大數(shù)據(jù)的采集、處??理與存儲(chǔ)流水線式處理體系。??3.1.1科技大數(shù)據(jù)的實(shí)時(shí)采集??本文所用到的數(shù)據(jù)主要取自AMiner....


圖3-3?—般數(shù)據(jù)處理架構(gòu)??為了解決上述問(wèn)題,引入了發(fā)布-訂閱模式

圖3-3?—般數(shù)據(jù)處理架構(gòu)??為了解決上述問(wèn)題,引入了發(fā)布-訂閱模式

????I??—采集方式1?—>處理邏輯1?—^?存儲(chǔ)方式1??d?L??L_???L?一丨??I??["業(yè)務(wù)功能2?1??I「*;?m????????J??—采集方式2?—處理邏輯2?+?存儲(chǔ)方式2?|??1_1:二..-二二????L?士二?L????I??J"業(yè)務(wù)功能n?|....


圖3-4基于發(fā)布-訂閱模式的跨媒體科技大數(shù)據(jù)處理架構(gòu)圖??3.2科技大數(shù)據(jù)文本資源特征提取與表示??

圖3-4基于發(fā)布-訂閱模式的跨媒體科技大數(shù)據(jù)處理架構(gòu)圖??3.2科技大數(shù)據(jù)文本資源特征提取與表示??

?數(shù)據(jù)源1?處理方式????i??rch???Lj?|?數(shù)據(jù)訪問(wèn)接口^^??數(shù)據(jù)源2???數(shù)據(jù)采集層一?數(shù)據(jù)處理層—?麵雜M?^??^MysqT??數(shù)據(jù)源n?|?進(jìn)應(yīng)??I?,?'?|??|????1?|處理方式和訂閱者關(guān)系維護(hù)1??|處理方式1??處理方式n?|?|?|??|?....



本文編號(hào):3974415

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/tushudanganlunwen/3974415.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶2d6c6***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com