基于SVM與Hilbert R-樹的定向引擎研究與實(shí)現(xiàn)
本文關(guān)鍵詞:基于SVM與Hilbert R-樹的定向引擎研究與實(shí)現(xiàn),由筆耕文化傳播整理發(fā)布。
【摘要】:隨著Internet的飛速發(fā)展,互聯(lián)網(wǎng)上的各種信息應(yīng)有盡有。然而,人們所感興趣的信息不盡相同。每個(gè)人在從網(wǎng)絡(luò)獲取自己所需信息的同時(shí),每天也在被那些對自己毫無價(jià)值的信息所騷擾。因此,如何實(shí)時(shí)精準(zhǔn)地向用戶投放信息(如廣告、新聞等)是研究人員面臨的一個(gè)緊迫問題。所謂定向,指的是對受眾的篩選。本文主要研究了實(shí)現(xiàn)一個(gè)精準(zhǔn)實(shí)時(shí)的定向引擎所需的相關(guān)技術(shù),主要包括:數(shù)據(jù)挖掘技術(shù)、分布式存儲(chǔ)相關(guān)的技術(shù)、分布式計(jì)算相關(guān)的技術(shù)、空間索引算法、分布式消息系統(tǒng)相關(guān)技術(shù)等。在此基礎(chǔ)上,本文設(shè)計(jì)并實(shí)現(xiàn)了一個(gè)支持多維度用戶屬性的實(shí)時(shí)定向服務(wù)框架。本文的所做的工作主要有:(1)對定向引擎發(fā)展現(xiàn)狀、當(dāng)前行業(yè)中已經(jīng)使用的定向引擎所存在的問題進(jìn)行了相關(guān)研究,提出了高效實(shí)時(shí)的定向引擎必須具有的特征。(2)研究了基于用戶信息的數(shù)據(jù)挖掘技術(shù)的原理和方法,設(shè)計(jì)并實(shí)現(xiàn)了一個(gè)SVM分類器來對用戶部分屬性進(jìn)行分類。(3)研究了用戶屬性的特點(diǎn),對用戶屬性進(jìn)行分類,利用分而治之的思想,設(shè)計(jì)并實(shí)現(xiàn)了各類用戶屬性對應(yīng)的子引擎。(4)研究了分布式key/value存儲(chǔ)系統(tǒng)中所使用的相關(guān)技術(shù),改進(jìn)了基于一致性hash算法的開源分布式key/value結(jié)構(gòu)的存儲(chǔ)系統(tǒng),并用其作為固定屬性子引擎的存儲(chǔ)層,以提高固定屬性所圈中用戶名單的計(jì)算效率。(5)研究了當(dāng)前成熟的各類空間索引算法,設(shè)計(jì)并實(shí)現(xiàn)了基于Hilbert R-樹的地理位置屬性子引擎,用于支持基于用戶位置屬性的定向服務(wù)。本文最后對基于上述技術(shù)而設(shè)計(jì)實(shí)現(xiàn)的定向引擎進(jìn)行了功能與性能實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果表明,本文設(shè)計(jì)的定向引擎在精準(zhǔn)性與實(shí)時(shí)性方面都表現(xiàn)較好。
【關(guān)鍵詞】:信息定向 支持向量機(jī) 分布式存儲(chǔ) R-樹
【學(xué)位授予單位】:華南理工大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類號(hào)】:TP391.3;TP18
【目錄】:
- 摘要5-6
- Abstract6-12
- 第一章 緒論12-20
- 1.1 引言12-13
- 1.1.1 課題研究背景12
- 1.1.2 信息定向的相關(guān)概念12-13
- 1.1.3 信息定向引擎的研究意義13
- 1.2 定向引擎研究現(xiàn)狀13-17
- 1.2.1 信息定向算法研究13-14
- 1.2.2 相關(guān)數(shù)據(jù)挖掘算法的研究14-16
- 1.2.3 定向引擎的架構(gòu)設(shè)計(jì)及研究16-17
- 1.3 課題的貢獻(xiàn)與創(chuàng)新點(diǎn)17
- 1.4 本文的主要內(nèi)容17-18
- 1.5 論文組織結(jié)構(gòu)18-19
- 1.6 本章小結(jié)19-20
- 第二章 定向引擎相關(guān)技術(shù)研究20-40
- 2.1 分布式計(jì)算框架介紹20-24
- 2.1.1 分布式計(jì)算框架Hadoop20-22
- 2.1.2 實(shí)時(shí)流計(jì)算框架Storm22-24
- 2.2 支持向量機(jī)相關(guān)研究24-29
- 2.2.1 線性可分與線性不可分24-25
- 2.2.2 最優(yōu)分類超平面25-27
- 2.2.3 結(jié)構(gòu)風(fēng)險(xiǎn)最小化27-28
- 2.2.4 核函數(shù)28-29
- 2.2.5 SVM相關(guān)算法研究29
- 2.3 分布式存儲(chǔ)相關(guān)研究29-34
- 2.3.1 一致性哈希算法30-33
- 2.3.2 Tair介紹33-34
- 2.4 空間索引算法相關(guān)研究34-38
- 2.4.1 網(wǎng)格索引34-35
- 2.4.2 基于R-樹空間索引35-36
- 2.4.3 基于四叉樹空間索引算法36-38
- 2.5 分布式消息中間件相關(guān)研究38-39
- 2.5.1 Kafka相關(guān)技術(shù)研究38-39
- 2.6 本章小結(jié)39-40
- 第三章 基于SVM與Hilbert R-樹的定向引擎總體設(shè)計(jì)40-48
- 3.1 引擎設(shè)計(jì)目標(biāo)40
- 3.2 用戶屬性分類40-41
- 3.3 引擎整體框架設(shè)計(jì)41-42
- 3.4 各子引擎介紹42-46
- 3.4.1 FC_Managment_service架構(gòu)設(shè)計(jì)42-43
- 3.4.2 Query_service介紹43-44
- 3.4.3 數(shù)據(jù)更新模塊介紹44
- 3.4.4 固定屬性子引擎介紹44-45
- 3.4.5 時(shí)間平移屬性子引擎介紹45
- 3.4.6 位置屬性子引擎介紹45-46
- 3.4.7 易變屬性子引擎介紹46
- 3.5 定向引擎對外接.介紹46-47
- 3.6 本章小結(jié)47-48
- 第四章 基于SVM與Hilbert R-樹的定向引擎實(shí)現(xiàn)48-74
- 4.1 RPC協(xié)議與Protobuf48-49
- 4.1.1 RPC協(xié)議48
- 4.1.2 Protobuf48-49
- 4.2 FC_Managment_service具體實(shí)現(xiàn)49-54
- 4.2.1 用戶屬性分類的實(shí)現(xiàn)49-52
- 4.2.2 創(chuàng)建篩選條件接. Create_FC實(shí)現(xiàn)52-53
- 4.2.3 修改篩選條件接. Modify_FC實(shí)現(xiàn)53-54
- 4.2.4 刪除篩選條件接. Delete_FC實(shí)現(xiàn)54
- 4.3 Query_service實(shí)現(xiàn)54-58
- 4.3.1 Query_service內(nèi)部架構(gòu)54-56
- 4.3.2 Query Users接.實(shí)現(xiàn)56
- 4.3.3 Compute Node實(shí)現(xiàn)56-58
- 4.4 固定屬性子引擎實(shí)現(xiàn)58-61
- 4.4.1 固定屬性子引擎的內(nèi)部架構(gòu)58-59
- 4.4.2 固定屬性子引擎接.實(shí)現(xiàn)59-60
- 4.4.3 定向引擎中Tair的集群部署以及改進(jìn)60-61
- 4.5 時(shí)間平移屬性子引擎實(shí)現(xiàn)61-65
- 4.5.1 時(shí)間平移屬性子引擎的內(nèi)部架構(gòu)61-63
- 4.5.2 時(shí)間平移屬性子引擎接.實(shí)現(xiàn)63
- 4.5.3 Users List實(shí)現(xiàn)63-65
- 4.5.4 用戶數(shù)據(jù)更新65
- 4.6 易變屬性子引擎實(shí)現(xiàn)65-68
- 4.6.1 易變屬性子引擎的內(nèi)部架構(gòu)65-67
- 4.6.2 易變屬性子引擎接.實(shí)現(xiàn)67-68
- 4.6.3 Data Block實(shí)現(xiàn)68
- 4.6.4 用戶數(shù)據(jù)更新68
- 4.7 位置屬性子引擎實(shí)現(xiàn)68-73
- 4.7.1 位置屬性子引擎的內(nèi)部架構(gòu)69-70
- 4.7.2 位置屬性子引擎接.實(shí)現(xiàn)70-71
- 4.7.3 基于R-樹空間索引算法實(shí)現(xiàn)71-72
- 4.7.4 Location Block實(shí)現(xiàn)72-73
- 4.7.5 位置信息更新73
- 4.8 本章小結(jié)73-74
- 第五章 定向引擎測試與分析74-82
- 5.1 測試工具介紹74
- 5.2 測試環(huán)境74
- 5.3 引擎功能測試74-77
- 5.3.1 Query_service功能測試74-75
- 5.3.2 固定屬性子引擎功能測試75-76
- 5.3.3 時(shí)間平移屬性子引擎功能測試76-77
- 5.3.4 易變屬性子引擎功能測試77
- 5.3.5 位置屬性子引擎以及FC_Management_service功能測試77
- 5.4 引擎性能測試77-81
- 5.4.1 Query_service性能測試78
- 5.4.2 固定屬性子引擎性能測試78
- 5.4.3 易變屬性子引擎性能測試78-79
- 5.4.4 時(shí)間平移屬性子引擎性能測試79
- 5.4.5 位置屬性子引擎性能測試79-80
- 5.4.6 FC_Management_service性能測試80-81
- 5.5 本章小結(jié)81-82
- 總結(jié)與展望82-84
- 參考文獻(xiàn)84-88
- 攻讀碩士學(xué)位期間取得的研究成果88-89
- 致謝89-90
- 附件90
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前5條
1 黃夢龍,胡鵬;一種改進(jìn)的網(wǎng)格索引生成方法[J];測繪科學(xué);2004年06期
2 楊_g劍;林波;;分布式存儲(chǔ)系統(tǒng)中一致性哈希算法的研究[J];電腦知識(shí)與技術(shù);2011年22期
3 陸鋒,周成虎;一種基于Hilbert排列碼的GIS空間索引方法[J];計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào);2001年05期
4 肖偉器,,馮玉才,繆勇武;空間對象數(shù)據(jù)庫的網(wǎng)格索引機(jī)制[J];計(jì)算機(jī)學(xué)報(bào);1994年10期
5 郭晶;劉廣軍;董緒榮;郭磊;;基于空間網(wǎng)格和Hilbert R-tree的二級(jí)R-tree空間索引[J];武漢大學(xué)學(xué)報(bào)(信息科學(xué)版);2005年12期
中國博士學(xué)位論文全文數(shù)據(jù)庫 前1條
1 周綺鳳;基于支持向量機(jī)的若干分類問題研究[D];廈門大學(xué);2007年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前2條
1 高蘭蘭;基于行為定向的精準(zhǔn)廣告投放系統(tǒng)的研究與實(shí)現(xiàn)[D];北京郵電大學(xué);2012年
2 孫朝華;基于Storm的數(shù)據(jù)分析系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D];北京郵電大學(xué);2014年
本文關(guān)鍵詞:基于SVM與Hilbert R-樹的定向引擎研究與實(shí)現(xiàn),由筆耕文化傳播整理發(fā)布。
本文編號(hào):509287
本文鏈接:http://sikaile.net/wenyilunwen/guanggaoshejilunwen/509287.html