社交網(wǎng)絡(luò)關(guān)注模式分析應(yīng)用研究
發(fā)布時(shí)間:2022-01-24 02:18
在當(dāng)前大數(shù)據(jù)時(shí)代,包括大型社交網(wǎng)絡(luò)數(shù)據(jù),尤其是微博的出現(xiàn),對人們的生活和工作產(chǎn)生了巨大影響,甚至由此形成了新的商業(yè)模式。微博類平臺的實(shí)時(shí)高效吸引了大量用戶。微博關(guān)鍵用戶作為構(gòu)建微博社交網(wǎng)絡(luò)的基礎(chǔ),極大影響了微博社交網(wǎng)絡(luò)的形成和發(fā)展,因此,微博關(guān)鍵用戶組的分析對微博社交網(wǎng)絡(luò)的研究具有十分重要的理論價(jià)值和實(shí)踐意義。在面向社交網(wǎng)絡(luò)的數(shù)據(jù)挖掘中,社交網(wǎng)絡(luò)數(shù)據(jù)復(fù)雜性對挖掘算法的準(zhǔn)確性和執(zhí)行效率提出了嚴(yán)峻挑戰(zhàn),如何提高算法效率成為了研究的核心問題。本文針對社交網(wǎng)絡(luò)的垂直數(shù)據(jù)格式用分別串行和并行的方法進(jìn)行深入研究。本文的主要工作如下:首先,詳細(xì)闡述社交網(wǎng)絡(luò)基本理論,通過用戶與用戶之間的關(guān)注關(guān)系建立有向的在線社交網(wǎng)絡(luò)。介紹社交網(wǎng)絡(luò)用戶影響力、關(guān)鍵用戶的研究方法的分類,介紹頻繁模式挖掘算法分類,頻繁模式挖掘也適用于解決社交網(wǎng)絡(luò)分析問題。其次,詳細(xì)解釋了社交網(wǎng)絡(luò)關(guān)注模式數(shù)據(jù)結(jié)構(gòu),分析對關(guān)注模式數(shù)據(jù)結(jié)構(gòu)還面臨著產(chǎn)生候選項(xiàng)集過程中連接動作時(shí)間復(fù)雜度較高的問題。針對不足,提出基于垂直數(shù)據(jù)格式的在線社交網(wǎng)絡(luò)關(guān)鍵用戶組發(fā)現(xiàn)算法---VDF-Miner算法。將數(shù)據(jù)進(jìn)行按位存儲,將集合求交的運(yùn)算改進(jìn)為位求與,對頻繁項(xiàng)集...
【文章來源】:南華大學(xué)湖南省
【文章頁數(shù)】:57 頁
【學(xué)位級別】:碩士
【部分圖文】:
社交網(wǎng)絡(luò)圖
南華大學(xué)碩士學(xué)位論文24表3.3三種算法在retail數(shù)據(jù)集上不同閾值下的運(yùn)行時(shí)間閾值(%)FoP-Miner運(yùn)行時(shí)間(s)Eclat運(yùn)行時(shí)間(s)VDF-Miner運(yùn)行時(shí)間(s)11369170296635136141354442928539252310311816圖3.2FoP-Miner、Eclat和VDF-Miner算法在retail數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果實(shí)驗(yàn)表明,在閾值在1%~4%之間時(shí),Eclat算法的運(yùn)行時(shí)間比FoP-Miner要小,在閾值大于4%時(shí),Eclat算法和FoP-Miner算法運(yùn)行時(shí)間基本相當(dāng)。這說明以垂直格式為基礎(chǔ)的頻繁挖掘算法Eclat在閾值較小時(shí),時(shí)間效率明顯要比基于水平格式的FoP-Miner。在閾值10%之前,F(xiàn)oP-Miner算法的時(shí)間性能要落后于VDF-Miner算法的時(shí)間性能,只有在閾值大于等于10%時(shí),運(yùn)行時(shí)間才基本一致,但總體上看,VDF-Miner的性能要優(yōu)于FoP-Miner。在VDF-Miner與Eclat算法進(jìn)行比較時(shí),實(shí)驗(yàn)表明,閾值范圍在1%至5%這
第3章基于改進(jìn)垂直數(shù)據(jù)格式的關(guān)注模式方法-VDF-Miner算法25個(gè)區(qū)間時(shí)VDF-Miner算法的時(shí)間性能要比Eclat算法好,而閾值在10%這個(gè)區(qū)間時(shí),兩種算法執(zhí)行時(shí)間基本相當(dāng),在最小閾值較小的時(shí)候,VDF-Miner算法的時(shí)間性能優(yōu)于Eclat算法。在6個(gè)閾值條件下,VDF-Miner算法效率大約是FoP-Miner算法的1.8倍,VDF-Miner算法效率大約是Eclat的1.1倍。下面我們在Twitter數(shù)據(jù)集進(jìn)行實(shí)驗(yàn),選擇的閾值范圍為1%~3%,在這范圍內(nèi),逐步增加1%。然后對FoP-Miner算法、Eclat算法和VDF-Miner算法分別使用Twitter數(shù)據(jù)集運(yùn)行,并記錄每一個(gè)閾值下的運(yùn)行時(shí)間(單位為秒),如表3.4。表3.43三種算法在Twitter數(shù)據(jù)集上不同閾值下的運(yùn)行時(shí)間閾值(%)FoP-Miner運(yùn)行時(shí)間(s)Eclat運(yùn)行時(shí)間(s)VDF-Miner運(yùn)行時(shí)間(s)11646143211239283923522圖3.3FoP-Miner、Eclat和VDF-Miner算法在社交網(wǎng)絡(luò)數(shù)據(jù)集SNAPTwitter數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果在Twitter數(shù)據(jù)集中,在閡值在1%至3%這個(gè)區(qū)間時(shí),F(xiàn)oP-Miner算法的時(shí)間性能要落后于VDF-Miner算法的時(shí)間性能,只有在閾值大于等于3%時(shí)運(yùn)行時(shí)間才一致,但總體上看,VDF-Miner的性能要優(yōu)于FoP-Miner。在3個(gè)閾值條件下,
【參考文獻(xiàn)】:
期刊論文
[1]基于矩陣的Apriori改進(jìn)算法的關(guān)聯(lián)規(guī)則挖掘[J]. 程昌品,鄔依林,姜永生. 廣東第二師范學(xué)院學(xué)報(bào). 2019(05)
[2]結(jié)合遺傳算法的Apriori算法改進(jìn)[J]. 文武,郭有慶. 計(jì)算機(jī)工程與設(shè)計(jì). 2019(07)
[3]頻繁項(xiàng)集挖掘的研究進(jìn)展及主流方法[J]. 李廣璞,黃妙華. 計(jì)算機(jī)科學(xué). 2018(S2)
[4]融合社交網(wǎng)絡(luò)與關(guān)鍵用戶的并行協(xié)同過濾推薦算法[J]. 肖成龍,王寧,王永貴. 計(jì)算機(jī)應(yīng)用研究. 2019(10)
[5]大規(guī)模社交網(wǎng)絡(luò)中高效的關(guān)鍵用戶選取方法[J]. 鄭永廣,岳昆,尹子都,張學(xué)杰. 計(jì)算機(jī)應(yīng)用. 2017(11)
[6]基于Spark框架的FP-Growth大數(shù)據(jù)頻繁項(xiàng)集挖掘算法[J]. 邵梁,何星舟,尚俊娜. 計(jì)算機(jī)應(yīng)用研究. 2018(10)
[7]垂直數(shù)據(jù)格式挖掘頻繁項(xiàng)集算法的改進(jìn)[J]. 邢長征,安維國,王星. 計(jì)算機(jī)工程與科學(xué). 2017(07)
[8]基于鏈路預(yù)測的微博用戶關(guān)系分析[J]. 傅穎斌,陳羽中. 計(jì)算機(jī)科學(xué). 2014(02)
[9]一種基于矩陣的Apriori改進(jìn)算法[J]. 孫逢嘯,倪世宏,謝川. 計(jì)算機(jī)仿真. 2013(08)
[10]基于個(gè)人屬性特征的微博用戶影響力分析[J]. 馬俊,周剛,許斌,黃永忠. 計(jì)算機(jī)應(yīng)用研究. 2013(08)
博士論文
[1]社交網(wǎng)絡(luò)中的社區(qū)發(fā)現(xiàn)及其應(yīng)用研究[D]. 黃明清.上海大學(xué) 2018
[2]加權(quán)網(wǎng)絡(luò)社區(qū)發(fā)現(xiàn)與鏈接預(yù)測方法研究[D]. 劉苗苗.燕山大學(xué) 2017
[3]基于用戶特征的社交網(wǎng)絡(luò)數(shù)據(jù)挖掘研究[D]. 廉捷.北京交通大學(xué) 2014
碩士論文
[1]社交網(wǎng)絡(luò)節(jié)點(diǎn)影響力研究[D]. 呂志偉.西安電子科技大學(xué) 2019
[2]基于用戶關(guān)系與行為的微博用戶影響力評價(jià)研究[D]. 李璟.吉林大學(xué) 2019
[3]社交網(wǎng)絡(luò)關(guān)聯(lián)分析技術(shù)及應(yīng)用研究[D]. 任翔.西安電子科技大學(xué) 2018
[4]基于用戶特征屬性的微博話題關(guān)鍵用戶挖掘[D]. 柯陽.中國科學(xué)院大學(xué)(中國科學(xué)院人工智能學(xué)院) 2018
[5]基于位存儲Tid的Eclat算法GPU并行化與分布式研究[D]. 孫宗鑫.天津師范大學(xué) 2018
[6]基于用戶與消息特征的微博轉(zhuǎn)發(fā)預(yù)測模型研究[D]. 陳磊.南華大學(xué) 2016
[7]一種改進(jìn)的關(guān)聯(lián)規(guī)則算法研究與應(yīng)用[D]. 陳向華.北京郵電大學(xué) 2016
[8]基于垂直數(shù)據(jù)布局的關(guān)聯(lián)規(guī)則挖掘算法研究[D]. 孫志長.北方民族大學(xué) 2009
本文編號:3605637
【文章來源】:南華大學(xué)湖南省
【文章頁數(shù)】:57 頁
【學(xué)位級別】:碩士
【部分圖文】:
社交網(wǎng)絡(luò)圖
南華大學(xué)碩士學(xué)位論文24表3.3三種算法在retail數(shù)據(jù)集上不同閾值下的運(yùn)行時(shí)間閾值(%)FoP-Miner運(yùn)行時(shí)間(s)Eclat運(yùn)行時(shí)間(s)VDF-Miner運(yùn)行時(shí)間(s)11369170296635136141354442928539252310311816圖3.2FoP-Miner、Eclat和VDF-Miner算法在retail數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果實(shí)驗(yàn)表明,在閾值在1%~4%之間時(shí),Eclat算法的運(yùn)行時(shí)間比FoP-Miner要小,在閾值大于4%時(shí),Eclat算法和FoP-Miner算法運(yùn)行時(shí)間基本相當(dāng)。這說明以垂直格式為基礎(chǔ)的頻繁挖掘算法Eclat在閾值較小時(shí),時(shí)間效率明顯要比基于水平格式的FoP-Miner。在閾值10%之前,F(xiàn)oP-Miner算法的時(shí)間性能要落后于VDF-Miner算法的時(shí)間性能,只有在閾值大于等于10%時(shí),運(yùn)行時(shí)間才基本一致,但總體上看,VDF-Miner的性能要優(yōu)于FoP-Miner。在VDF-Miner與Eclat算法進(jìn)行比較時(shí),實(shí)驗(yàn)表明,閾值范圍在1%至5%這
第3章基于改進(jìn)垂直數(shù)據(jù)格式的關(guān)注模式方法-VDF-Miner算法25個(gè)區(qū)間時(shí)VDF-Miner算法的時(shí)間性能要比Eclat算法好,而閾值在10%這個(gè)區(qū)間時(shí),兩種算法執(zhí)行時(shí)間基本相當(dāng),在最小閾值較小的時(shí)候,VDF-Miner算法的時(shí)間性能優(yōu)于Eclat算法。在6個(gè)閾值條件下,VDF-Miner算法效率大約是FoP-Miner算法的1.8倍,VDF-Miner算法效率大約是Eclat的1.1倍。下面我們在Twitter數(shù)據(jù)集進(jìn)行實(shí)驗(yàn),選擇的閾值范圍為1%~3%,在這范圍內(nèi),逐步增加1%。然后對FoP-Miner算法、Eclat算法和VDF-Miner算法分別使用Twitter數(shù)據(jù)集運(yùn)行,并記錄每一個(gè)閾值下的運(yùn)行時(shí)間(單位為秒),如表3.4。表3.43三種算法在Twitter數(shù)據(jù)集上不同閾值下的運(yùn)行時(shí)間閾值(%)FoP-Miner運(yùn)行時(shí)間(s)Eclat運(yùn)行時(shí)間(s)VDF-Miner運(yùn)行時(shí)間(s)11646143211239283923522圖3.3FoP-Miner、Eclat和VDF-Miner算法在社交網(wǎng)絡(luò)數(shù)據(jù)集SNAPTwitter數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果在Twitter數(shù)據(jù)集中,在閡值在1%至3%這個(gè)區(qū)間時(shí),F(xiàn)oP-Miner算法的時(shí)間性能要落后于VDF-Miner算法的時(shí)間性能,只有在閾值大于等于3%時(shí)運(yùn)行時(shí)間才一致,但總體上看,VDF-Miner的性能要優(yōu)于FoP-Miner。在3個(gè)閾值條件下,
【參考文獻(xiàn)】:
期刊論文
[1]基于矩陣的Apriori改進(jìn)算法的關(guān)聯(lián)規(guī)則挖掘[J]. 程昌品,鄔依林,姜永生. 廣東第二師范學(xué)院學(xué)報(bào). 2019(05)
[2]結(jié)合遺傳算法的Apriori算法改進(jìn)[J]. 文武,郭有慶. 計(jì)算機(jī)工程與設(shè)計(jì). 2019(07)
[3]頻繁項(xiàng)集挖掘的研究進(jìn)展及主流方法[J]. 李廣璞,黃妙華. 計(jì)算機(jī)科學(xué). 2018(S2)
[4]融合社交網(wǎng)絡(luò)與關(guān)鍵用戶的并行協(xié)同過濾推薦算法[J]. 肖成龍,王寧,王永貴. 計(jì)算機(jī)應(yīng)用研究. 2019(10)
[5]大規(guī)模社交網(wǎng)絡(luò)中高效的關(guān)鍵用戶選取方法[J]. 鄭永廣,岳昆,尹子都,張學(xué)杰. 計(jì)算機(jī)應(yīng)用. 2017(11)
[6]基于Spark框架的FP-Growth大數(shù)據(jù)頻繁項(xiàng)集挖掘算法[J]. 邵梁,何星舟,尚俊娜. 計(jì)算機(jī)應(yīng)用研究. 2018(10)
[7]垂直數(shù)據(jù)格式挖掘頻繁項(xiàng)集算法的改進(jìn)[J]. 邢長征,安維國,王星. 計(jì)算機(jī)工程與科學(xué). 2017(07)
[8]基于鏈路預(yù)測的微博用戶關(guān)系分析[J]. 傅穎斌,陳羽中. 計(jì)算機(jī)科學(xué). 2014(02)
[9]一種基于矩陣的Apriori改進(jìn)算法[J]. 孫逢嘯,倪世宏,謝川. 計(jì)算機(jī)仿真. 2013(08)
[10]基于個(gè)人屬性特征的微博用戶影響力分析[J]. 馬俊,周剛,許斌,黃永忠. 計(jì)算機(jī)應(yīng)用研究. 2013(08)
博士論文
[1]社交網(wǎng)絡(luò)中的社區(qū)發(fā)現(xiàn)及其應(yīng)用研究[D]. 黃明清.上海大學(xué) 2018
[2]加權(quán)網(wǎng)絡(luò)社區(qū)發(fā)現(xiàn)與鏈接預(yù)測方法研究[D]. 劉苗苗.燕山大學(xué) 2017
[3]基于用戶特征的社交網(wǎng)絡(luò)數(shù)據(jù)挖掘研究[D]. 廉捷.北京交通大學(xué) 2014
碩士論文
[1]社交網(wǎng)絡(luò)節(jié)點(diǎn)影響力研究[D]. 呂志偉.西安電子科技大學(xué) 2019
[2]基于用戶關(guān)系與行為的微博用戶影響力評價(jià)研究[D]. 李璟.吉林大學(xué) 2019
[3]社交網(wǎng)絡(luò)關(guān)聯(lián)分析技術(shù)及應(yīng)用研究[D]. 任翔.西安電子科技大學(xué) 2018
[4]基于用戶特征屬性的微博話題關(guān)鍵用戶挖掘[D]. 柯陽.中國科學(xué)院大學(xué)(中國科學(xué)院人工智能學(xué)院) 2018
[5]基于位存儲Tid的Eclat算法GPU并行化與分布式研究[D]. 孫宗鑫.天津師范大學(xué) 2018
[6]基于用戶與消息特征的微博轉(zhuǎn)發(fā)預(yù)測模型研究[D]. 陳磊.南華大學(xué) 2016
[7]一種改進(jìn)的關(guān)聯(lián)規(guī)則算法研究與應(yīng)用[D]. 陳向華.北京郵電大學(xué) 2016
[8]基于垂直數(shù)據(jù)布局的關(guān)聯(lián)規(guī)則挖掘算法研究[D]. 孫志長.北方民族大學(xué) 2009
本文編號:3605637
本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/3605637.html
最近更新
教材專著