大數(shù)據(jù)技術(shù)開展學(xué)生評教的研究與應(yīng)用
【文章頁數(shù)】:60 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖2.1系統(tǒng)架構(gòu)流程
92.2系統(tǒng)架構(gòu)設(shè)計本章采用多源數(shù)據(jù)融合技術(shù),在貼吧、學(xué)信網(wǎng)等網(wǎng)頁檢索有關(guān)學(xué)生評教的關(guān)鍵詞組信息。其主要章節(jié)分布如下所述:第2.1節(jié)引言,介紹了在現(xiàn)有技術(shù)基礎(chǔ)所做的相關(guān)工作及關(guān)鍵創(chuàng)新點(diǎn);第2.2系統(tǒng)架構(gòu)設(shè)計,對本章內(nèi)容進(jìn)行規(guī)劃說明;第2.3節(jié)關(guān)鍵技術(shù)及核心處理算法,包含本章采用的....
圖2.2主題網(wǎng)絡(luò)爬蟲框架
12信息作為儲存的鏡像備份,而采用通用爬蟲的搜索引擎所返回的網(wǎng)頁里90%的內(nèi)容均為無效信息,對信息占有量和覆蓋率范圍存在局限性。主題爬蟲不同于通用爬蟲,首先要依據(jù)用戶需求準(zhǔn)確定義爬取的目標(biāo)并對其進(jìn)行相關(guān)描述,其采集數(shù)據(jù)的起始點(diǎn)必須是與定義范圍內(nèi)高度相關(guān)的網(wǎng)頁,運(yùn)行過程中也不會存在....
圖2.3PR值與網(wǎng)站信息分析值對照圖
14圖2.3PR值與網(wǎng)站信息分析值對照圖Fig.2.3ComparisonchartofPRvalueandwebsiteinformationanalysisvalue一般的爬蟲系統(tǒng)缺乏一定的智能性,使其在網(wǎng)站上檢索用戶需求信息時,瀏覽的網(wǎng)頁對于需求信息的含金量各異,不僅耗時繁....
圖2.4各類屬性網(wǎng)站所占比例圖
14圖2.3PR值與網(wǎng)站信息分析值對照圖Fig.2.3ComparisonchartofPRvalueandwebsiteinformationanalysisvalue一般的爬蟲系統(tǒng)缺乏一定的智能性,使其在網(wǎng)站上檢索用戶需求信息時,瀏覽的網(wǎng)頁對于需求信息的含金量各異,不僅耗時繁....
本文編號:3913965
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3913965.html