科技事件的個(gè)性化推薦及可視化展示系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)
【文章頁(yè)數(shù)】:64 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖2.1網(wǎng)絡(luò)數(shù)據(jù)獲取流程
i(Bk\頓士學(xué)位論文??MASTER’S?THESIS??2.1.2推薦內(nèi)容的獲取??推薦內(nèi)容的獲取關(guān)鍵分為數(shù)據(jù)采集和數(shù)據(jù)處理兩步。??推薦信息的采集主要從Google、百度和維基幾大流行搜索門戶爬取信息。據(jù)目標(biāo)從網(wǎng)站上抓取網(wǎng)頁(yè)文本,執(zhí)行腳本將會(huì)獲取整個(gè)網(wǎng)頁(yè)的HTML信息,然對(duì)....
圖2.2基于內(nèi)容推薦??基于內(nèi)容的推薦優(yōu)點(diǎn)在于:(1)保證用戶的獨(dú)立性,推薦的內(nèi)容只與目標(biāo)用??
對(duì)HTML信息進(jìn)行解析,生成文本文檔,將無(wú)關(guān)的標(biāo)簽舍棄。對(duì)于頁(yè)面的抓取流??程,廣度優(yōu)先搜索方式更容易控制數(shù)據(jù)抓取的過(guò)程并且處理效率更高,具體流程??如圖2.1。首先按照給定的初始目標(biāo)網(wǎng)頁(yè)url進(jìn)行解析爬取,在對(duì)種子頁(yè)面抓取過(guò)??程中,由于網(wǎng)頁(yè)包含了超鏈接,因此可以提取出新的ur....
圖2.3?wordle效果圖??針對(duì)文本數(shù)據(jù)可視化,“Wordle?(標(biāo)簽云)”是目前使用頻率較高且最為出色??
\?丄―??\文章B??類型:歷史、故事??圖2.2基于內(nèi)容推薦??基于內(nèi)容的推薦優(yōu)點(diǎn)在于:(1)保證用戶的獨(dú)立性,推薦的內(nèi)容只與目標(biāo)用??戶當(dāng)前的偏好模型有關(guān),與其他用戶信息無(wú)關(guān),這樣可以屏蔽掉通過(guò)不正當(dāng)手段??獲得排名的項(xiàng)目;(2)推薦的內(nèi)容根據(jù)用戶之前的查看記錄產(chǎn)生,具有較....
圖2.4可視化分析流程圖??圖2.4展現(xiàn)了一個(gè)經(jīng)典的可視化分析的流程圖,參照歐洲學(xué)者DanielKeim等??
?圖2.4可視化分析流程圖??圖2.4展現(xiàn)了一個(gè)經(jīng)典的可視化分析的流程圖,參照歐洲學(xué)者DanielKeim等??人提出的可視化分析學(xué)標(biāo)準(zhǔn)流程[38]所畫。最初數(shù)據(jù)的輸入,對(duì)數(shù)據(jù)進(jìn)行去噪、修??正等一系列轉(zhuǎn)換處理,然后通過(guò)可視化的途徑或者建立數(shù)據(jù)挖掘模型自動(dòng)數(shù)據(jù)分??析的方式,最后....
本文編號(hào):3982999
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3982999.html