多領(lǐng)域跨媒體科技大數(shù)據(jù)高效檢索查詢研究
【文章頁(yè)數(shù)】:100 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖3-1多領(lǐng)域跨媒體科技大數(shù)據(jù)的獲取與特征表示總體架構(gòu)??3.1多領(lǐng)域跨媒體科技大數(shù)據(jù)的獲取與處理??科技資源不同于社交、新聞等數(shù)據(jù),科技資源由于天然具有的專業(yè)性,因此??數(shù)據(jù)的分布呈現(xiàn)比較強(qiáng)的集中性
?第三章多領(lǐng)域跨媒體科技大數(shù)據(jù)的獲取與特征表示???第三章多領(lǐng)域跨媒體科技大數(shù)據(jù)的獲取與特征表示??本章給出了多領(lǐng)域跨媒體科技大數(shù)據(jù)的獲取與特征表示方法。針對(duì)海量的多??模態(tài)科技資源,設(shè)計(jì)出一種基于發(fā)布-訂閱模式的科技大數(shù)據(jù)采集、處理與持久??化體系。針對(duì)科技大數(shù)據(jù)中文本資源在不....
圖3-2多領(lǐng)域跨媒體科技資源實(shí)時(shí)采集系統(tǒng)架構(gòu)??釆集系統(tǒng)主要包含以下幾個(gè)組件:采集引擎、爬蟲、調(diào)度器、下載器、管道、??中間件
北京郵電大學(xué)工學(xué)碩士學(xué)位論文??的跨學(xué)科特點(diǎn),對(duì)于不同的數(shù)據(jù)在后續(xù)的研究中需要做不同的預(yù)處理和持久化,??因此需要一種靈活的數(shù)據(jù)處理體系。本節(jié)設(shè)計(jì)了一種針對(duì)科技大數(shù)據(jù)的采集、處??理與存儲(chǔ)流水線式處理體系。??3.1.1科技大數(shù)據(jù)的實(shí)時(shí)采集??本文所用到的數(shù)據(jù)主要取自AMiner....
圖3-3?—般數(shù)據(jù)處理架構(gòu)??為了解決上述問(wèn)題,引入了發(fā)布-訂閱模式
????I??—采集方式1?—>處理邏輯1?—^?存儲(chǔ)方式1??d?L??L_???L?一丨??I??["業(yè)務(wù)功能2?1??I「*;?m????????J??—采集方式2?—處理邏輯2?+?存儲(chǔ)方式2?|??1_1:二..-二二????L?士二?L????I??J"業(yè)務(wù)功能n?|....
圖3-4基于發(fā)布-訂閱模式的跨媒體科技大數(shù)據(jù)處理架構(gòu)圖??3.2科技大數(shù)據(jù)文本資源特征提取與表示??
?數(shù)據(jù)源1?處理方式????i??rch???Lj?|?數(shù)據(jù)訪問(wèn)接口^^??數(shù)據(jù)源2???數(shù)據(jù)采集層一?數(shù)據(jù)處理層—?麵雜M?^??^MysqT??數(shù)據(jù)源n?|?進(jìn)應(yīng)??I?,?'?|??|????1?|處理方式和訂閱者關(guān)系維護(hù)1??|處理方式1??處理方式n?|?|?|??|?....
本文編號(hào):3974415
本文鏈接:http://sikaile.net/tushudanganlunwen/3974415.html