AP聚類(lèi)算法在商圈挖掘中的應(yīng)用研究
發(fā)布時(shí)間:2020-05-15 15:23
【摘要】:城市商圈是現(xiàn)實(shí)世界中經(jīng)濟(jì)網(wǎng)絡(luò)的一種基本結(jié)構(gòu)。通過(guò)挖掘城市中的商圈數(shù)據(jù),擴(kuò)展新的應(yīng)用場(chǎng)景,可以使終端用戶(hù)受益。用戶(hù)在訪問(wèn)商圈后產(chǎn)生的基于位置的簽到數(shù)據(jù)可以被用于挖掘商圈,并提供數(shù)據(jù)支持。然而,基于簽到數(shù)據(jù)的商圈挖掘工作面臨幾方面的問(wèn)題。(1)在傳統(tǒng)的商圈挖掘模型和方法中,存在參數(shù)難以設(shè)置的問(wèn)題;(2)標(biāo)準(zhǔn)AP聚類(lèi)算法的計(jì)算復(fù)雜度較高且只能發(fā)現(xiàn)球形狀商圈,不適合用于大規(guī)模數(shù)據(jù)聚類(lèi)問(wèn)題和挖掘商圈呈非球形狀的情況。針對(duì)以上問(wèn)題,為了有效地挖掘城市商圈,本文提出了改進(jìn)的AP聚類(lèi)商圈挖掘算法,主要研究?jī)?nèi)容如下:首先,提出并設(shè)計(jì)了基于簽到數(shù)據(jù)的AP聚類(lèi)商圈挖掘算法。將標(biāo)準(zhǔn)AP聚類(lèi)算法引入城市商圈挖掘領(lǐng)域中,并通過(guò)利用位置簽到數(shù)據(jù)中的簽到量特征來(lái)合理地設(shè)置AP算法的偏向參數(shù)值,使得在聚類(lèi)實(shí)施的信息更新過(guò)程中,增加了類(lèi)代表點(diǎn)的約束條件。通過(guò)使用Yelp數(shù)據(jù)集為實(shí)驗(yàn)數(shù)據(jù),對(duì)比標(biāo)準(zhǔn)的AP聚類(lèi)算法以及貪心搜索算法,實(shí)驗(yàn)結(jié)果證明了所提出的算法的有效性。其次,提出并設(shè)計(jì)了改進(jìn)的AP聚類(lèi)商圈挖掘算法。首先通過(guò)分析標(biāo)準(zhǔn)AP聚類(lèi)算法的信息傳播過(guò)程,利用密度最大值聚類(lèi)算法挖掘出潛在商圈中心,從而壓縮了算法的輸入相似度矩陣,進(jìn)而提升了算法計(jì)算效率;然后對(duì)經(jīng)過(guò)標(biāo)準(zhǔn)AP聚類(lèi)算法處理而得到的初始商圈集合,分析其內(nèi)部的距離屬性,設(shè)計(jì)了與類(lèi)內(nèi)距離和類(lèi)間距離相關(guān)的合并策略,提高了挖掘結(jié)果的準(zhǔn)確性;最后使用Yelp數(shù)據(jù)集為實(shí)驗(yàn)數(shù)據(jù),對(duì)比標(biāo)準(zhǔn)的AP聚類(lèi)算法,所得實(shí)驗(yàn)結(jié)果證明了算法在基本保留全部信息的基礎(chǔ)上,提升了算法執(zhí)行效率。本研究具有重要的應(yīng)用價(jià)值:(1)通過(guò)對(duì)標(biāo)準(zhǔn)AP聚類(lèi)算法的改進(jìn),使其具有有效分析、處理數(shù)據(jù)的能力,為數(shù)據(jù)科學(xué)的發(fā)展提供了新的工具;(2)從給定的簽到數(shù)據(jù)中挖掘出城市商圈的分布,可以為探測(cè)商圈內(nèi)的熱點(diǎn)、分析商圈的動(dòng)態(tài)變化提供數(shù)據(jù)支持。
【圖文】:
因素干擾挖掘準(zhǔn)確性的缺陷。采用商圈的簽到數(shù)據(jù)作為數(shù)據(jù)基礎(chǔ),并利用簽到數(shù)據(jù)的簽逡逑到量特征更加合理地來(lái)設(shè)置輸入矩陣的偏好度,避免了數(shù)據(jù)信息缺失,進(jìn)而完成挖掘任逡逑務(wù),圖3.2展示了模擬數(shù)據(jù)的挖掘結(jié)果。逡逑邐[邐:逡逑圖3.2商圈挖掘結(jié)果示意圖逡逑接下來(lái)的內(nèi)容,本章節(jié)首先提出基于AP聚類(lèi)的商圈挖掘問(wèn)題的相關(guān)定義。然后介逡逑紹標(biāo)準(zhǔn)AP聚類(lèi)算法的理論與算法實(shí)現(xiàn)過(guò)程。最后設(shè)計(jì)對(duì)比實(shí)驗(yàn)來(lái)驗(yàn)證該算法的有效性。逡逑3.2相關(guān)定義與問(wèn)題描述逡逑本節(jié)主要涉及的知識(shí)有:城市商圈相關(guān)概念的定義以及城市商圈挖掘需要解決的問(wèn)逡逑題和AP算法的理論基礎(chǔ)描述。逡逑3.2.1商圈相關(guān)定義逡逑定義3.1商業(yè)網(wǎng)點(diǎn)(Venue)商業(yè)網(wǎng)點(diǎn)?般是指代進(jìn)行商業(yè)經(jīng)營(yíng)交易、城市居民進(jìn)行逡逑消費(fèi)活動(dòng),提供產(chǎn)品或者服務(wù)的場(chǎng)所,記作商業(yè)網(wǎng)點(diǎn)組成的集合記為T/。一般來(lái)說(shuō),逡逑城幣主城IX里的商業(yè)網(wǎng)點(diǎn)呈現(xiàn)聚集的狀態(tài),向城K外的方向輻射擴(kuò)散。逡逑定義3.2商圈(Business邋District)商圈是由商業(yè)網(wǎng)點(diǎn)所組成的集合,記為A,它是逡逑整個(gè)城市商圈的子集/)=丨叢,認(rèn),...,^丨,其中iV表示城市商圈的個(gè)數(shù)。如圖3.3所示,逡逑圈內(nèi)分布的商業(yè)網(wǎng)點(diǎn)構(gòu)成了一個(gè)商業(yè)圈。商業(yè)網(wǎng)點(diǎn)構(gòu)成商業(yè)圈的形狀會(huì)根據(jù)現(xiàn)實(shí)情況的逡逑交通路況和政府規(guī)劃呈現(xiàn)不同的形狀,如規(guī)則狀的圓形或不規(guī)則的形狀。逡逑19逡逑
定義3.4城市商圈挖掘問(wèn)題(Business邋Districts邋Mining邋Problem)給定商業(yè)網(wǎng)點(diǎn)集合逡逑F,使用標(biāo)準(zhǔn)AP聚類(lèi)算法從集合中挖掘出城市商圈中心點(diǎn),然后將歸屬于該商圈中逡逑心點(diǎn)的商業(yè)網(wǎng)點(diǎn)聚集在一起得到城市商圈A,完成城市商圈挖掘任務(wù)。如圖3.2所示,給逡逑定模擬的商業(yè)網(wǎng)點(diǎn)集合,經(jīng)過(guò)對(duì)集合使用AP聚類(lèi)算法聚類(lèi)后,找到了聚類(lèi)中心(中間的逡逑大點(diǎn)),然后將周?chē)狞c(diǎn)中分配給所屬的聚類(lèi)中心點(diǎn),類(lèi)中心點(diǎn)與所屬的點(diǎn)組成了族,即逡逑城市商圈。逡逑3.2.2問(wèn)題描述與分析逡逑在對(duì)城市商圈分布測(cè)定的傳統(tǒng)方法中,,一般由下面幾個(gè)方面組成[53]:逡逑(1)預(yù)測(cè)分析逡逑首先對(duì)城市商圈這一對(duì)象附近的消費(fèi)者環(huán)境、經(jīng)濟(jì)環(huán)境、公共交通設(shè)施、以及政府逡逑對(duì)該商業(yè)區(qū)域的未來(lái)規(guī)劃等信息進(jìn)行收集,再對(duì)商圈內(nèi)的商業(yè)網(wǎng)點(diǎn)的經(jīng)營(yíng)范圍、經(jīng)營(yíng)品逡逑20逡逑
【學(xué)位授予單位】:杭州電子科技大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2019
【分類(lèi)號(hào)】:F713;TP311.13
【圖文】:
因素干擾挖掘準(zhǔn)確性的缺陷。采用商圈的簽到數(shù)據(jù)作為數(shù)據(jù)基礎(chǔ),并利用簽到數(shù)據(jù)的簽逡逑到量特征更加合理地來(lái)設(shè)置輸入矩陣的偏好度,避免了數(shù)據(jù)信息缺失,進(jìn)而完成挖掘任逡逑務(wù),圖3.2展示了模擬數(shù)據(jù)的挖掘結(jié)果。逡逑邐[邐:逡逑圖3.2商圈挖掘結(jié)果示意圖逡逑接下來(lái)的內(nèi)容,本章節(jié)首先提出基于AP聚類(lèi)的商圈挖掘問(wèn)題的相關(guān)定義。然后介逡逑紹標(biāo)準(zhǔn)AP聚類(lèi)算法的理論與算法實(shí)現(xiàn)過(guò)程。最后設(shè)計(jì)對(duì)比實(shí)驗(yàn)來(lái)驗(yàn)證該算法的有效性。逡逑3.2相關(guān)定義與問(wèn)題描述逡逑本節(jié)主要涉及的知識(shí)有:城市商圈相關(guān)概念的定義以及城市商圈挖掘需要解決的問(wèn)逡逑題和AP算法的理論基礎(chǔ)描述。逡逑3.2.1商圈相關(guān)定義逡逑定義3.1商業(yè)網(wǎng)點(diǎn)(Venue)商業(yè)網(wǎng)點(diǎn)?般是指代進(jìn)行商業(yè)經(jīng)營(yíng)交易、城市居民進(jìn)行逡逑消費(fèi)活動(dòng),提供產(chǎn)品或者服務(wù)的場(chǎng)所,記作商業(yè)網(wǎng)點(diǎn)組成的集合記為T/。一般來(lái)說(shuō),逡逑城幣主城IX里的商業(yè)網(wǎng)點(diǎn)呈現(xiàn)聚集的狀態(tài),向城K外的方向輻射擴(kuò)散。逡逑定義3.2商圈(Business邋District)商圈是由商業(yè)網(wǎng)點(diǎn)所組成的集合,記為A,它是逡逑整個(gè)城市商圈的子集/)=丨叢,認(rèn),...,^丨,其中iV表示城市商圈的個(gè)數(shù)。如圖3.3所示,逡逑圈內(nèi)分布的商業(yè)網(wǎng)點(diǎn)構(gòu)成了一個(gè)商業(yè)圈。商業(yè)網(wǎng)點(diǎn)構(gòu)成商業(yè)圈的形狀會(huì)根據(jù)現(xiàn)實(shí)情況的逡逑交通路況和政府規(guī)劃呈現(xiàn)不同的形狀,如規(guī)則狀的圓形或不規(guī)則的形狀。逡逑19逡逑
定義3.4城市商圈挖掘問(wèn)題(Business邋Districts邋Mining邋Problem)給定商業(yè)網(wǎng)點(diǎn)集合逡逑F,使用標(biāo)準(zhǔn)AP聚類(lèi)算法從集合中挖掘出城市商圈中心點(diǎn),然后將歸屬于該商圈中逡逑心點(diǎn)的商業(yè)網(wǎng)點(diǎn)聚集在一起得到城市商圈A,完成城市商圈挖掘任務(wù)。如圖3.2所示,給逡逑定模擬的商業(yè)網(wǎng)點(diǎn)集合,經(jīng)過(guò)對(duì)集合使用AP聚類(lèi)算法聚類(lèi)后,找到了聚類(lèi)中心(中間的逡逑大點(diǎn)),然后將周?chē)狞c(diǎn)中分配給所屬的聚類(lèi)中心點(diǎn),類(lèi)中心點(diǎn)與所屬的點(diǎn)組成了族,即逡逑城市商圈。逡逑3.2.2問(wèn)題描述與分析逡逑在對(duì)城市商圈分布測(cè)定的傳統(tǒng)方法中,,一般由下面幾個(gè)方面組成[53]:逡逑(1)預(yù)測(cè)分析逡逑首先對(duì)城市商圈這一對(duì)象附近的消費(fèi)者環(huán)境、經(jīng)濟(jì)環(huán)境、公共交通設(shè)施、以及政府逡逑對(duì)該商業(yè)區(qū)域的未來(lái)規(guī)劃等信息進(jìn)行收集,再對(duì)商圈內(nèi)的商業(yè)網(wǎng)點(diǎn)的經(jīng)營(yíng)范圍、經(jīng)營(yíng)品逡逑20逡逑
【學(xué)位授予單位】:杭州電子科技大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2019
【分類(lèi)號(hào)】:F713;TP311.13
【參考文獻(xiàn)】
相關(guān)期刊論文 前6條
1 江頡;王卓芳;陳鐵明;朱陳晨;陳波;;自適應(yīng)AP聚類(lèi)算法及其在入侵檢測(cè)中的應(yīng)用[J];通信學(xué)報(bào);2015年11期
2 王士君;馮章獻(xiàn);張石磊;;經(jīng)濟(jì)地域系統(tǒng)理論視角下的中心地及其擴(kuò)散域[J];地理科學(xué);2010年06期
3 王磊;汪西莉;劉高霞;趙琳;;一種結(jié)合半監(jiān)督的改進(jìn)自適應(yīng)親和傳播聚類(lèi)[J];計(jì)算機(jī)應(yīng)用研究;2010年12期
4 張宇;吳t
本文編號(hào):2665246
本文鏈接:http://sikaile.net/jingjilunwen/guojimaoyilunwen/2665246.html
最近更新
教材專(zhuān)著