一種基于軌跡分段的軌跡數據隱私保護算法
發(fā)布時間:2021-01-23 00:04
隨著基于位置服務應用的普及,應用提供商積累了大量的用戶軌跡數據。通過數據分析,研究者從發(fā)布的軌跡數據集中提取出許多有用的信息,這些信息在交通監(jiān)控、城市規(guī)劃、移動性管理等領域有著廣泛的應用前景。然而,直接發(fā)布蘊含豐富隱私信息的軌跡數據存在泄漏用戶隱私的風險,為此需要在發(fā)布前對軌跡數據進行處理。由于軌跡數據具有規(guī)模大、維度高、背景知識豐富等特點,面向移動設備軌跡數據發(fā)布的隱私保護技術研究面臨著嚴峻的挑戰(zhàn)。本文針對軌跡數據發(fā)布中的隱私保護問題開展研究,提出了一種基于軌跡分段的軌跡數據隱私保護算法,該算法包含兩個子算法。首先,針對傳統(tǒng)方法丟棄時空點數目過多、劃分后的等價類包含軌跡數目可能過少的問題,提出了一種基于軌跡分段填充的等價類劃分子算法。算法將原始軌跡數據集劃分為若干等價類,如果原始等價類大小小于閾值,便進行軌跡分段填充:選出若干等價類作為被分割的等價類(這些等價類的時間區(qū)間為當前等價類時間區(qū)間的超集),然后將從被分割等價類中截取的軌跡分段填充到當前等價類。其次,針對傳統(tǒng)方法時空點擾動距離過大以及刪除的軌跡數目過多的問題,提出了一種基于軌跡分段聚類的聚類組構建子算法。算法的作用是將每個等...
【文章來源】:廣州大學廣東省
【文章頁數】:83 頁
【學位級別】:碩士
【部分圖文】:
不確定軌跡定義3.2(可能移動曲線PMC)軌跡的可能移動曲線為:
廣州大學碩士學位論文22類集合,否則返回空集(13到16行)。該算法的功能其實就是在兩個數組中找到所有相等的數,如果采用暴力解法需要循環(huán)m*n次,時間復雜度為O(mn),其中m和n分別為兩個數組的長度。如果先將數組排好序,再按照算法3.2的邏輯只需循環(huán)m+n次,時間復雜度為O(m+n)。下面有一個示例。下圖中每個矩形代表一個等價類,矩形左上方和右上方數字分別代表等價類的開始時間、結束時間,矩形右側的花括號內包含的數字都是軌跡ID。圖3.2處理等價類[1,8]前開始時間為1的等價類集合圖3.3處理等價類[1,8]前開始時間為9的等價類集合進入算法3.1,假設minEquivalence為12,當遍歷到等價類ES1,8時,由于|ES1,8|=5<12,所以嘗試在此刻獲取候選等價類集合。調用算法3.2,傳入第一個等價類集合ES1,H(8+1)={ES1,10,ES1,12,ES1,14,ES1,15},傳入第二個等價類集合ES9,={ES9,11,ES9,12,ES9,14,ES9,15},傳入閾值為minEquivalence|ES1,8|=62=4。算法3.2的處理
廣州大學碩士學位論文22類集合,否則返回空集(13到16行)。該算法的功能其實就是在兩個數組中找到所有相等的數,如果采用暴力解法需要循環(huán)m*n次,時間復雜度為O(mn),其中m和n分別為兩個數組的長度。如果先將數組排好序,再按照算法3.2的邏輯只需循環(huán)m+n次,時間復雜度為O(m+n)。下面有一個示例。下圖中每個矩形代表一個等價類,矩形左上方和右上方數字分別代表等價類的開始時間、結束時間,矩形右側的花括號內包含的數字都是軌跡ID。圖3.2處理等價類[1,8]前開始時間為1的等價類集合圖3.3處理等價類[1,8]前開始時間為9的等價類集合進入算法3.1,假設minEquivalence為12,當遍歷到等價類ES1,8時,由于|ES1,8|=5<12,所以嘗試在此刻獲取候選等價類集合。調用算法3.2,傳入第一個等價類集合ES1,H(8+1)={ES1,10,ES1,12,ES1,14,ES1,15},傳入第二個等價類集合ES9,={ES9,11,ES9,12,ES9,14,ES9,15},傳入閾值為minEquivalence|ES1,8|=62=4。算法3.2的處理
本文編號:2994157
【文章來源】:廣州大學廣東省
【文章頁數】:83 頁
【學位級別】:碩士
【部分圖文】:
不確定軌跡定義3.2(可能移動曲線PMC)軌跡的可能移動曲線為:
廣州大學碩士學位論文22類集合,否則返回空集(13到16行)。該算法的功能其實就是在兩個數組中找到所有相等的數,如果采用暴力解法需要循環(huán)m*n次,時間復雜度為O(mn),其中m和n分別為兩個數組的長度。如果先將數組排好序,再按照算法3.2的邏輯只需循環(huán)m+n次,時間復雜度為O(m+n)。下面有一個示例。下圖中每個矩形代表一個等價類,矩形左上方和右上方數字分別代表等價類的開始時間、結束時間,矩形右側的花括號內包含的數字都是軌跡ID。圖3.2處理等價類[1,8]前開始時間為1的等價類集合圖3.3處理等價類[1,8]前開始時間為9的等價類集合進入算法3.1,假設minEquivalence為12,當遍歷到等價類ES1,8時,由于|ES1,8|=5<12,所以嘗試在此刻獲取候選等價類集合。調用算法3.2,傳入第一個等價類集合ES1,H(8+1)={ES1,10,ES1,12,ES1,14,ES1,15},傳入第二個等價類集合ES9,={ES9,11,ES9,12,ES9,14,ES9,15},傳入閾值為minEquivalence|ES1,8|=62=4。算法3.2的處理
廣州大學碩士學位論文22類集合,否則返回空集(13到16行)。該算法的功能其實就是在兩個數組中找到所有相等的數,如果采用暴力解法需要循環(huán)m*n次,時間復雜度為O(mn),其中m和n分別為兩個數組的長度。如果先將數組排好序,再按照算法3.2的邏輯只需循環(huán)m+n次,時間復雜度為O(m+n)。下面有一個示例。下圖中每個矩形代表一個等價類,矩形左上方和右上方數字分別代表等價類的開始時間、結束時間,矩形右側的花括號內包含的數字都是軌跡ID。圖3.2處理等價類[1,8]前開始時間為1的等價類集合圖3.3處理等價類[1,8]前開始時間為9的等價類集合進入算法3.1,假設minEquivalence為12,當遍歷到等價類ES1,8時,由于|ES1,8|=5<12,所以嘗試在此刻獲取候選等價類集合。調用算法3.2,傳入第一個等價類集合ES1,H(8+1)={ES1,10,ES1,12,ES1,14,ES1,15},傳入第二個等價類集合ES9,={ES9,11,ES9,12,ES9,14,ES9,15},傳入閾值為minEquivalence|ES1,8|=62=4。算法3.2的處理
本文編號:2994157
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2994157.html