基于語(yǔ)義軌跡挖掘的選址問題研究和實(shí)現(xiàn)
發(fā)布時(shí)間:2021-04-05 11:30
近年來隨著人們對(duì)選址重要性的認(rèn)知提升,選址問題成為當(dāng)今的研究熱點(diǎn)之一。而選址中最重要的一點(diǎn)就是識(shí)別區(qū)域內(nèi)人們是否有相關(guān)需求。目前區(qū)域內(nèi)興趣點(diǎn)需求分析大部分基于人工調(diào)查或者軌跡數(shù)據(jù)。但傳統(tǒng)的時(shí)空軌跡只有地理信息,無(wú)法精準(zhǔn)獲得人們的目的地的興趣點(diǎn)分類。隨著位置共享服務(wù)的激增以及社交平臺(tái)的流行,語(yǔ)義豐富的軌跡的出現(xiàn)改進(jìn)了傳統(tǒng)軌跡需要推斷目的地興趣點(diǎn)分類的缺點(diǎn)。然而目前沒有專門利用語(yǔ)義軌跡挖掘區(qū)域性興趣點(diǎn)分類需求以及推薦選址的算法;凇坝媚_投票”理論,人們跨區(qū)域的移動(dòng)行為可以推斷人們的興趣點(diǎn)分類需求。頻繁模式挖掘也基于該理論間接挖掘區(qū)域興趣點(diǎn)分類需求,然而因?yàn)轭l繁閾值的設(shè)定會(huì)導(dǎo)致部分需求被忽略并且遞歸式搜尋太過耗時(shí)。此外,研究者們主要圍繞特定興趣點(diǎn)分析特征,缺少適用性強(qiáng)的選址框架。針對(duì)上述不足,本文在“用腳投票”理論下利用語(yǔ)義軌跡構(gòu)建了一套基于區(qū)域性興趣點(diǎn)分類需求挖掘的選址系統(tǒng),提高選址準(zhǔn)確率的同時(shí)滿足高效性及高適用性的要求。本文將該系統(tǒng)分成了四個(gè)子模塊,分別為社交媒體數(shù)據(jù)預(yù)處理、跨區(qū)域移動(dòng)模式抽取、區(qū)域性興趣點(diǎn)分類需求識(shí)別及選址推薦。在社交媒體預(yù)處理模塊,聚合簽到并基于最大時(shí)間間隔限制切分...
【文章來源】:華東師范大學(xué)上海市 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:77 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
興趣點(diǎn)示例
華東師范大學(xué)研究生碩士學(xué)位論文第一章緒論圖1.2全局空間下人們移動(dòng)軌跡假設(shè)個(gè)區(qū)域中人們對(duì)于不同興趣點(diǎn)分類的需求,以及需求強(qiáng)度如何衡量。也就是說,如果能夠從簽到記錄中抽取出跨區(qū)域移動(dòng)模式,根據(jù)“用腳投票”理論發(fā)現(xiàn)并準(zhǔn)確識(shí)別出當(dāng)中隱含的該區(qū)域用戶對(duì)于某些類型興趣點(diǎn)的需求,那么就能按照需求強(qiáng)度量化后的區(qū)域性興趣點(diǎn)分類需求向該區(qū)域用戶推薦合適的興趣點(diǎn)分類或者對(duì)特定興趣點(diǎn)分類推薦合適的安置位置。因此對(duì)于選址系統(tǒng)而言,只要能夠首先構(gòu)建兩個(gè)子模塊來分別解決以上問題,那將兩個(gè)模塊整合后便可以解決選址的核心問題。換而言之,一旦選址系統(tǒng)被像這樣拆分后,拆解出的每個(gè)模塊都可以把更多注意力放在當(dāng)前需要處理的子問題上。本文根據(jù)這個(gè)拆解思路,將選址系統(tǒng)進(jìn)一步拆成了四個(gè)部分,分別為社交媒體數(shù)據(jù)預(yù)處理模塊、關(guān)鍵的跨區(qū)域移動(dòng)模式抽取模塊以及區(qū)域性興趣點(diǎn)分類需求識(shí)別模塊和最終的選址推薦模塊。對(duì)于每一個(gè)模塊,本文都對(duì)其特點(diǎn)和模型展開詳細(xì)介紹。在社交媒體數(shù)據(jù)預(yù)處理模塊中,本文對(duì)數(shù)據(jù)主要做了以下幾種處理。第一步便是將社交媒體平臺(tái)上的簽到記錄聚合成語(yǔ)義軌跡。接著便是軌跡切分!坝媚_投票”理論表明人們有能力去遷移到任何可以滿足自己需求的地方。從現(xiàn)實(shí)角度考慮,如果一個(gè)人越是需要一種特定興趣點(diǎn)類型那么他前往具有該種類型興5
?畹敝?經(jīng)常使用的百度、谷歌等。當(dāng)人們使用帶有GPS定位功能的手機(jī)進(jìn)行搜索時(shí),搜索引擎就在持續(xù)收集這些搜索記錄,這些記錄顯而易見也帶有時(shí)間戳和位置屬性。但這些數(shù)據(jù)并不對(duì)外公開。另一種質(zhì)量更高的數(shù)據(jù)來源便是人工采集數(shù)據(jù),代表性的數(shù)據(jù)集包括MIT的RealityMining1、美國(guó)人時(shí)間利用調(diào)查2等。這些調(diào)查數(shù)據(jù)除了描述人們的行為目的以外還包含了被調(diào)查人的人口數(shù)據(jù)(如性別、年齡等),給人的行為行動(dòng)提供了更豐富的解釋,但獲取這些數(shù)據(jù)并不便宜。所以最為公開、廣泛使用的還是用戶自主產(chǎn)生、發(fā)布在社交平臺(tái)上的內(nèi)容。圖2.1一條帶有地理位置標(biāo)簽的tweet示例語(yǔ)義時(shí)空數(shù)據(jù)作為時(shí)空數(shù)據(jù)挖掘領(lǐng)域熱門的數(shù)據(jù)表示方式之一,它的出現(xiàn)使得研究者可以更加直觀得對(duì)人們的行為有一個(gè)統(tǒng)一的認(rèn)識(shí)。與傳統(tǒng)的GPS軌跡或者RFID數(shù)據(jù)相比,它蘊(yùn)含更多維度的信息,時(shí)間、空間以及文本。有了語(yǔ)義時(shí)空數(shù)據(jù),相當(dāng)于人們不僅知道了人們行為的發(fā)生地點(diǎn)和發(fā)生時(shí)間,也知道了具體的行為內(nèi)容,對(duì)行為有了一個(gè)聯(lián)合的認(rèn)識(shí)。以行為理解為例,傳統(tǒng)的軌跡數(shù)據(jù)只能揭示一個(gè)人如何從一個(gè)地方移動(dòng)到另一個(gè)地方,是坐公交巴士、地鐵還是搭乘出租車。而語(yǔ)義軌跡可以幫助科學(xué)家們理解人們?cè)诓煌恢孟滤故镜男袨,比如該人是出于什么目的進(jìn)行移動(dòng)。圖2.2以圖的形式展示了語(yǔ)義時(shí)空數(shù)據(jù)的表達(dá)形式。在圖中用地理信息通過興趣點(diǎn)的經(jīng)緯度來表示,而時(shí)間反映在訪問記錄的時(shí)間戳屬性上,用戶、訪問記錄和興趣點(diǎn)則都和一些語(yǔ)義文本相關(guān)聯(lián)。用戶的語(yǔ)義相關(guān)信息可以是用戶的興趣或者職業(yè)等人口統(tǒng)計(jì)數(shù)據(jù)。對(duì)于興趣點(diǎn)來說,它的語(yǔ)義信息則包含它的興趣點(diǎn)1http://realitycommons.media.mit.edu/index.html2www.bls.gov/tus/11
本文編號(hào):3119551
【文章來源】:華東師范大學(xué)上海市 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:77 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
興趣點(diǎn)示例
華東師范大學(xué)研究生碩士學(xué)位論文第一章緒論圖1.2全局空間下人們移動(dòng)軌跡假設(shè)個(gè)區(qū)域中人們對(duì)于不同興趣點(diǎn)分類的需求,以及需求強(qiáng)度如何衡量。也就是說,如果能夠從簽到記錄中抽取出跨區(qū)域移動(dòng)模式,根據(jù)“用腳投票”理論發(fā)現(xiàn)并準(zhǔn)確識(shí)別出當(dāng)中隱含的該區(qū)域用戶對(duì)于某些類型興趣點(diǎn)的需求,那么就能按照需求強(qiáng)度量化后的區(qū)域性興趣點(diǎn)分類需求向該區(qū)域用戶推薦合適的興趣點(diǎn)分類或者對(duì)特定興趣點(diǎn)分類推薦合適的安置位置。因此對(duì)于選址系統(tǒng)而言,只要能夠首先構(gòu)建兩個(gè)子模塊來分別解決以上問題,那將兩個(gè)模塊整合后便可以解決選址的核心問題。換而言之,一旦選址系統(tǒng)被像這樣拆分后,拆解出的每個(gè)模塊都可以把更多注意力放在當(dāng)前需要處理的子問題上。本文根據(jù)這個(gè)拆解思路,將選址系統(tǒng)進(jìn)一步拆成了四個(gè)部分,分別為社交媒體數(shù)據(jù)預(yù)處理模塊、關(guān)鍵的跨區(qū)域移動(dòng)模式抽取模塊以及區(qū)域性興趣點(diǎn)分類需求識(shí)別模塊和最終的選址推薦模塊。對(duì)于每一個(gè)模塊,本文都對(duì)其特點(diǎn)和模型展開詳細(xì)介紹。在社交媒體數(shù)據(jù)預(yù)處理模塊中,本文對(duì)數(shù)據(jù)主要做了以下幾種處理。第一步便是將社交媒體平臺(tái)上的簽到記錄聚合成語(yǔ)義軌跡。接著便是軌跡切分!坝媚_投票”理論表明人們有能力去遷移到任何可以滿足自己需求的地方。從現(xiàn)實(shí)角度考慮,如果一個(gè)人越是需要一種特定興趣點(diǎn)類型那么他前往具有該種類型興5
?畹敝?經(jīng)常使用的百度、谷歌等。當(dāng)人們使用帶有GPS定位功能的手機(jī)進(jìn)行搜索時(shí),搜索引擎就在持續(xù)收集這些搜索記錄,這些記錄顯而易見也帶有時(shí)間戳和位置屬性。但這些數(shù)據(jù)并不對(duì)外公開。另一種質(zhì)量更高的數(shù)據(jù)來源便是人工采集數(shù)據(jù),代表性的數(shù)據(jù)集包括MIT的RealityMining1、美國(guó)人時(shí)間利用調(diào)查2等。這些調(diào)查數(shù)據(jù)除了描述人們的行為目的以外還包含了被調(diào)查人的人口數(shù)據(jù)(如性別、年齡等),給人的行為行動(dòng)提供了更豐富的解釋,但獲取這些數(shù)據(jù)并不便宜。所以最為公開、廣泛使用的還是用戶自主產(chǎn)生、發(fā)布在社交平臺(tái)上的內(nèi)容。圖2.1一條帶有地理位置標(biāo)簽的tweet示例語(yǔ)義時(shí)空數(shù)據(jù)作為時(shí)空數(shù)據(jù)挖掘領(lǐng)域熱門的數(shù)據(jù)表示方式之一,它的出現(xiàn)使得研究者可以更加直觀得對(duì)人們的行為有一個(gè)統(tǒng)一的認(rèn)識(shí)。與傳統(tǒng)的GPS軌跡或者RFID數(shù)據(jù)相比,它蘊(yùn)含更多維度的信息,時(shí)間、空間以及文本。有了語(yǔ)義時(shí)空數(shù)據(jù),相當(dāng)于人們不僅知道了人們行為的發(fā)生地點(diǎn)和發(fā)生時(shí)間,也知道了具體的行為內(nèi)容,對(duì)行為有了一個(gè)聯(lián)合的認(rèn)識(shí)。以行為理解為例,傳統(tǒng)的軌跡數(shù)據(jù)只能揭示一個(gè)人如何從一個(gè)地方移動(dòng)到另一個(gè)地方,是坐公交巴士、地鐵還是搭乘出租車。而語(yǔ)義軌跡可以幫助科學(xué)家們理解人們?cè)诓煌恢孟滤故镜男袨,比如該人是出于什么目的進(jìn)行移動(dòng)。圖2.2以圖的形式展示了語(yǔ)義時(shí)空數(shù)據(jù)的表達(dá)形式。在圖中用地理信息通過興趣點(diǎn)的經(jīng)緯度來表示,而時(shí)間反映在訪問記錄的時(shí)間戳屬性上,用戶、訪問記錄和興趣點(diǎn)則都和一些語(yǔ)義文本相關(guān)聯(lián)。用戶的語(yǔ)義相關(guān)信息可以是用戶的興趣或者職業(yè)等人口統(tǒng)計(jì)數(shù)據(jù)。對(duì)于興趣點(diǎn)來說,它的語(yǔ)義信息則包含它的興趣點(diǎn)1http://realitycommons.media.mit.edu/index.html2www.bls.gov/tus/11
本文編號(hào):3119551
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3119551.html
最近更新
教材專著