基于P2P網(wǎng)絡、社交網(wǎng)絡的Web 2.0應用的采集與分析
發(fā)布時間:2021-02-24 00:35
Web 2.0的出現(xiàn)和興起,是一次從核心內(nèi)容到外部應用的革命,徹底地改變了用戶使用互聯(lián)網(wǎng)的模式。P2P網(wǎng)絡和社交網(wǎng)絡作為Web 2.0的典型應用,發(fā)揮著越來越關(guān)鍵的作用,包含的信息和數(shù)據(jù)也越來越重要。其中,基于P2P網(wǎng)絡的文件共享、流媒體及搜索引擎占據(jù)了絕大多數(shù)的互聯(lián)網(wǎng)流量,而使用各種社交網(wǎng)絡則逐漸成為互聯(lián)網(wǎng)用戶最主要的上網(wǎng)習慣。對P2P網(wǎng)絡和社交網(wǎng)絡進行數(shù)據(jù)采集是分析網(wǎng)絡性能、優(yōu)化用戶體驗、強化網(wǎng)絡安全的一項基礎性工作。目前針對P2P網(wǎng)絡和社交網(wǎng)絡的數(shù)據(jù)采集都是以主動采集為主,即從網(wǎng)絡的某些點開始主動爬取相關(guān)信息。主動采集具有采集目的性強、數(shù)據(jù)解析能力強、采集環(huán)境要求低的優(yōu)點。然而,一方面,由于主動采集必須逐個遍歷節(jié)點,隨著網(wǎng)絡的增長,主動采集在時效性、信息有效性方面受到一定制約;另一方面,由主動采集的采集方式?jīng)Q定了無法獲得用戶登陸等實時行為信息。針對主動采集的缺點,本文提出了針對P2P網(wǎng)絡和社交網(wǎng)絡的被動采集方式;诰W(wǎng)絡監(jiān)聽原理、數(shù)據(jù)包拼包和協(xié)議還原技術(shù),使用Libpcap庫作為采集接口,分別針對P2P網(wǎng)絡中的BT協(xié)議和社交網(wǎng)絡中的Twitter,設計實現(xiàn)了被動采集系統(tǒng),并部署實...
【文章來源】:北京郵電大學北京市 211工程院校 教育部直屬院校
【文章頁數(shù)】:67 頁
【學位級別】:碩士
【部分圖文】:
圖1-1?Web?2.?0主要特征及應用??1)用戶參與到網(wǎng)站內(nèi)容制造而不僅僅瀏覽網(wǎng)站:與Web?1.0網(wǎng)站信息只是由??
'''''Y'Prn、???A?。??/?peer?j??圖1-2?BT協(xié)議的工作原理??首先,擁有共享文件的客戶端上傳種子文件,即.torrent文件到服務器。種子??文件很小,通常只有幾十KB,然而種子文件中包含著下載共享文件所需的Tracker??服務器地址和相應的一些配置信息。此外,共享文件被虛擬分成若千大小相等的??2KB的整數(shù)次方塊,塊的索引信息和哈希驗證碼同樣保存在.torrent文件中。因??此,.torrent文件也下載中同樣發(fā)揮著文件索引的作用。??隨后,下載者Peer得到.torrent文件后,Peer?qū)模拢钥蛻舳送ㄟ^解析.torrent??文件得到下載文件Tracker服務器的地址。通過連接Tracker服務器,從Tracker服??務器獲得其他下載者或者擁有者的IP之后與其他下載者建立連接。根據(jù).torrent??文件
全球有超過12億的用戶每月至少一次使用社交網(wǎng)絡網(wǎng)站。eMarketei?預計,??到2014年,全球?qū)⒂谐^1.8億用戶每月至少使用一次社交網(wǎng)絡.同時,預計2011??年至2014年社交網(wǎng)絡用戶數(shù)量將保持兩位數(shù)增長[7]。如圖1-4所示:??20〗】-2014年全球社交網(wǎng)絡用戶數(shù)重??35???19.^????2S????二;?1B.5??16-6?r—■?"I??14,3?|?■? ̄—1??i?4?t2??7?,?????o? ̄L——一——j?L—???—-J?li- ̄^?—??201)?2012e?2013e?2014&??[=3社交網(wǎng)絡用戶笑:m?(憶)?-^一墦長卒(%)??圖1-4?社交網(wǎng)絡用戶數(shù)量預測??社交網(wǎng)絡用戶急劇增長,得益于社交網(wǎng)絡自身信
本文編號:3048492
【文章來源】:北京郵電大學北京市 211工程院校 教育部直屬院校
【文章頁數(shù)】:67 頁
【學位級別】:碩士
【部分圖文】:
圖1-1?Web?2.?0主要特征及應用??1)用戶參與到網(wǎng)站內(nèi)容制造而不僅僅瀏覽網(wǎng)站:與Web?1.0網(wǎng)站信息只是由??
'''''Y'Prn、???A?。??/?peer?j??圖1-2?BT協(xié)議的工作原理??首先,擁有共享文件的客戶端上傳種子文件,即.torrent文件到服務器。種子??文件很小,通常只有幾十KB,然而種子文件中包含著下載共享文件所需的Tracker??服務器地址和相應的一些配置信息。此外,共享文件被虛擬分成若千大小相等的??2KB的整數(shù)次方塊,塊的索引信息和哈希驗證碼同樣保存在.torrent文件中。因??此,.torrent文件也下載中同樣發(fā)揮著文件索引的作用。??隨后,下載者Peer得到.torrent文件后,Peer?qū)模拢钥蛻舳送ㄟ^解析.torrent??文件得到下載文件Tracker服務器的地址。通過連接Tracker服務器,從Tracker服??務器獲得其他下載者或者擁有者的IP之后與其他下載者建立連接。根據(jù).torrent??文件
全球有超過12億的用戶每月至少一次使用社交網(wǎng)絡網(wǎng)站。eMarketei?預計,??到2014年,全球?qū)⒂谐^1.8億用戶每月至少使用一次社交網(wǎng)絡.同時,預計2011??年至2014年社交網(wǎng)絡用戶數(shù)量將保持兩位數(shù)增長[7]。如圖1-4所示:??20〗】-2014年全球社交網(wǎng)絡用戶數(shù)重??35???19.^????2S????二;?1B.5??16-6?r—■?"I??14,3?|?■? ̄—1??i?4?t2??7?,?????o? ̄L——一——j?L—???—-J?li- ̄^?—??201)?2012e?2013e?2014&??[=3社交網(wǎng)絡用戶笑:m?(憶)?-^一墦長卒(%)??圖1-4?社交網(wǎng)絡用戶數(shù)量預測??社交網(wǎng)絡用戶急劇增長,得益于社交網(wǎng)絡自身信
本文編號:3048492
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/3048492.html
最近更新
教材專著