面向移動用戶數(shù)據(jù)的情境識別與挖掘
發(fā)布時間:2017-08-01 06:19
本文關(guān)鍵詞:面向移動用戶數(shù)據(jù)的情境識別與挖掘
更多相關(guān)文章: 移動設(shè)備 情境建模 情境識別 關(guān)鍵地點 情境挖掘
【摘要】:隨著移動互聯(lián)網(wǎng)的興起,移動設(shè)備成為用戶使用互聯(lián)網(wǎng)服務(wù)的新途徑。通過挖掘移動設(shè)備上的情境數(shù)據(jù)對用戶建模是一種新穎的理解用戶需求的方案,從而能為互聯(lián)網(wǎng)服務(wù)方提供個性化、情境感知化的服務(wù)奠定基礎(chǔ)。這里的情境數(shù)據(jù)指移動設(shè)備上的眾多傳感器探測到的環(huán)境和用戶行為信息。本文的研究主題是面向移動用戶數(shù)據(jù)的情境識別與挖掘,主要成果如下: 1.提出了使用非監(jiān)督學(xué)習(xí)模型對用戶情境建模的技術(shù)方案:對于用戶情境建模問題,由于難以獲取情境標(biāo)識,因而監(jiān)督學(xué)習(xí)模型難以適用。鑒于此,本文使用非監(jiān)督學(xué)習(xí)模型通過情境數(shù)據(jù)自身性質(zhì)挖掘用戶的情境。本文提出的方案包括兩個步驟。在數(shù)據(jù)預(yù)處理步驟中,對用戶情境數(shù)據(jù)日志提取情境會話,由于情境會話間沒有明顯的分界標(biāo)識,本文使用了一種最小熵算法來切分情境數(shù)據(jù)日志;在數(shù)據(jù)建模步驟中,本文使用了聚類和概率主題模型來挖掘用戶情境。通過聚類模型挖掘用戶情境的方式為,首先將情境會話映射到情境特征-值組合空間上,然后對情境會話使用K-means算法聚類,最后從聚類結(jié)果提取用戶情境。通過概率主題模型挖掘用戶情境的方式為,首先對其進行擴展從而適應(yīng)情境數(shù)據(jù)的結(jié)構(gòu)化特性,然后將情境會話表示成概率主題模型中的變量,最后通過Gibbs采樣算法求解模型從而學(xué)習(xí)用戶情境。在真實用戶情境數(shù)據(jù)集上的實驗分析表明了該技術(shù)方案的有效性。 2.提出了通過基站標(biāo)識數(shù)據(jù)挖掘用戶關(guān)鍵地點的技術(shù)方案:關(guān)鍵地點是用戶最重要的情境。以往的研究工作主要集中于通過GPS數(shù)據(jù)挖掘關(guān)鍵地點,然而由于常時間開啟GPS傳感器會比較耗電,從而影響設(shè)備續(xù)航時間。鑒于此,本文提出通過基站標(biāo)識數(shù)據(jù)挖掘用戶關(guān)鍵地點。根據(jù)基站的地理位置信息,以及利用基站覆蓋范圍彼此重疊的特性,本文提出了一個兩階段的關(guān)鍵地點挖掘算法。在在線階段,檢測用戶的停留狀態(tài),并計算停留區(qū)域以及更新停留區(qū)域中的地理格柵的熱度值;在離線階段,通過一個遞歸方法挖掘出用戶關(guān)鍵地點。為驗證該技術(shù)方案的實際應(yīng)用性,本文還開發(fā)了一個演示系統(tǒng)。最后,實驗結(jié)果表明該方案在用戶關(guān)鍵地點的查全率和查準(zhǔn)率均高于基準(zhǔn)方法。 3.監(jiān)督式情境識別方案的難點在于難以獲得大量高質(zhì)量的情境標(biāo)識數(shù)據(jù)。本文提出了結(jié)合時間管理軟件實現(xiàn)用戶情境識別的技術(shù)方案。時間管理用戶經(jīng)常面臨記錄反復(fù)發(fā)生的情境狀態(tài)的情況,很多用戶厭煩這種重復(fù)操作因而放棄了時間管理。本文提出了一種半監(jiān)督學(xué)習(xí)方案,通過結(jié)合用戶時間管理應(yīng)用中的情境狀態(tài)記錄數(shù)據(jù),使用HMM模型來實現(xiàn)用戶情境識別,并提出了DP-MUC模型來自動化確定用戶情境數(shù)目和加速HMM模型的訓(xùn)練時間。最后,同基準(zhǔn)算法相比,在真實用戶的情境狀態(tài)記錄數(shù)據(jù)上的實驗結(jié)果表明該方法具有較好的效果和較高的效率。
【關(guān)鍵詞】:移動設(shè)備 情境建模 情境識別 關(guān)鍵地點 情境挖掘
【學(xué)位授予單位】:中國科學(xué)技術(shù)大學(xué)
【學(xué)位級別】:博士
【學(xué)位授予年份】:2013
【分類號】:TP311.13
【目錄】:
- 摘要5-7
- ABSTRACT7-9
- 目錄9-13
- 表格13-14
- 插圖14-16
- 算法16-17
- 第一章 緒論17-33
- 1.1 引言17-19
- 1.2 研究背景19-27
- 1.2.1 移動設(shè)備成為用戶情境信息的載體19-22
- 1.2.2 通過移動設(shè)備為用戶提供情境感知的服務(wù)22-25
- 1.2.3 用戶情境數(shù)據(jù)挖掘25-27
- 1.3 研究內(nèi)容27-28
- 1.4 數(shù)據(jù)收集平臺28-30
- 1.5 組織結(jié)構(gòu)30-33
- 第二章 相關(guān)研究工作概述33-53
- 2.1 引言33-34
- 2.2 普適計算中的情境定義回顧34-35
- 2.3 情境數(shù)據(jù)挖掘的研究項目35-41
- 2.3.1 麻省理工學(xué)院的現(xiàn)實挖掘項目36-39
- 2.3.2 微軟亞洲研究院的地理人生項目39-41
- 2.4 情境數(shù)據(jù)挖掘的研究應(yīng)用41-50
- 2.4.1 通過地理位置數(shù)據(jù)理解用戶41-48
- 2.4.2 通過傳感器數(shù)據(jù)理解用戶48-50
- 2.5 本章小結(jié)50-53
- 第三章 使用非監(jiān)督學(xué)習(xí)模型對用戶情境建模53-81
- 3.1 引言53-54
- 3.2 相關(guān)工作54-56
- 3.3 方法概述56-57
- 3.4 情境會話分割57-60
- 3.5 通過聚類模型學(xué)習(xí)用戶情境60-64
- 3.5.1 情境會話相似度定義60-61
- 3.5.2 情境會話聚類61-62
- 3.5.3 從情境會話簇中提取情境描述62
- 3.5.4 確定情境會話聚類簇的數(shù)目62-64
- 3.6 通過概率主題模型學(xué)習(xí)用戶情境64-70
- 3.6.1 基于單主題模型的情境模型64-67
- 3.6.2 基于多主題模型的情境模型67-69
- 3.6.3 確定用戶情境的數(shù)目69-70
- 3.7 實驗分析70-79
- 3.7.1 數(shù)據(jù)集與數(shù)據(jù)預(yù)處理70-71
- 3.7.2 計算效率比較71-74
- 3.7.3 建模效果比較74-79
- 3.8 本章小結(jié)79-81
- 第四章 通過基站標(biāo)識數(shù)據(jù)挖掘用戶關(guān)鍵地點81-99
- 4.1 引言81-83
- 4.2 停留區(qū)域檢測83-86
- 4.2.1 停留片段提取84-86
- 4.2.2 計算停留區(qū)域?qū)?yīng)的地理柵格86
- 4.3 用戶關(guān)鍵地點挖掘86-89
- 4.4 實驗分析89-95
- 4.4.1 數(shù)據(jù)集89-90
- 4.4.2 基準(zhǔn)方法90-91
- 4.4.3 標(biāo)注結(jié)果與評價指標(biāo)91-93
- 4.4.4 實驗結(jié)果93-95
- 4.4.5 案例分析95
- 4.5 演示系統(tǒng)95-96
- 4.6 本章小結(jié)96-99
- 第五章 結(jié)合時間管理軟件實現(xiàn)用戶情境識別99-121
- 5.1 引言99-101
- 5.2 相關(guān)工作101-102
- 5.3 通過HMM模型實現(xiàn)情境識別102-110
- 5.3.1 Bayesian HMM模型104-107
- 5.3.2 Bayesian HMM on Context模型107-110
- 5.4 通過DPM模型確定情境數(shù)目110-112
- 5.5 實驗分析112-118
- 5.5.1 數(shù)據(jù)說明112-114
- 5.5.2 用戶情境數(shù)目114-115
- 5.5.3 HMMC模型訓(xùn)練效率115-116
- 5.5.4 情境識別效果116-118
- 5.6 本章小結(jié)118-121
- 第六章 結(jié)束語121-125
- 6.1 研究工作總結(jié)121-123
- 6.2 對未來工作的展望123-125
- 參考文獻125-133
- 致謝133-135
- 在讀期間發(fā)表的學(xué)術(shù)論文與取得的研究成果135-136
【引證文獻】
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前1條
1 梁欽沛;基于移動終端的群智感知中情境識別方法的研究與實現(xiàn)[D];華南理工大學(xué);2013年
,本文編號:602876
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/602876.html
最近更新
教材專著