面向社交媒體的網(wǎng)絡(luò)和內(nèi)容分析關(guān)鍵技術(shù)研究
發(fā)布時(shí)間:2020-03-17 20:26
【摘要】:近年來(lái),隨著互聯(lián)網(wǎng)技術(shù)的迅速發(fā)展,社交媒體已經(jīng)不再僅僅限于在線交流,而是滲透到生活中的方方面面。社交媒體包含了海量的、具有豐富應(yīng)用場(chǎng)景的數(shù)據(jù),為研究社會(huì)生活提供了新的視角和工具,這是傳統(tǒng)社會(huì)學(xué)所不具備的。為了更好地利用和分析社交媒體數(shù)據(jù),面向社交媒體的數(shù)據(jù)挖掘技術(shù)層出不窮。網(wǎng)絡(luò)結(jié)構(gòu)和內(nèi)容分析,作為社交媒體分析的兩個(gè)主要方面,吸引了大量的研究者,產(chǎn)生了許多重要的理論和技術(shù)成果。本文從這兩個(gè)方面出發(fā),結(jié)合社交媒體在生活中的應(yīng)用場(chǎng)景,對(duì)其中的關(guān)鍵技術(shù)進(jìn)行了創(chuàng)新性的研究和探索,具體完成的工作和貢獻(xiàn)包括以下幾個(gè)方面:1.提出了一種基于超圖的層次化社交網(wǎng)絡(luò)表示模型,通過(guò)組件的增減,可以滿足大多數(shù)社交網(wǎng)絡(luò)的建模需求。針對(duì)臉書和企業(yè)社交網(wǎng)絡(luò),用提出的模型進(jìn)行了建模和案例研究。通過(guò)對(duì)社交網(wǎng)絡(luò)結(jié)構(gòu)特性的研究,驗(yàn)證和分析了傳統(tǒng)社會(huì)學(xué)中冪律分布和小世界效應(yīng)等理論。2.針對(duì)社交網(wǎng)絡(luò)中節(jié)點(diǎn)排名問(wèn)題,結(jié)合PageRank和HITS的核心思想,提出了一種基于二部圖的節(jié)點(diǎn)排名算法。算法能夠支持兩類節(jié)點(diǎn)和多種節(jié)點(diǎn)重要性度量方法的情況。將該算法應(yīng)用到企業(yè)排名問(wèn)題中,取得了較好的效果。通過(guò)不同的評(píng)價(jià)方法,發(fā)現(xiàn)該算法具有更好的排名效果。3.針對(duì)社交網(wǎng)絡(luò)鏈接預(yù)測(cè)問(wèn)題中,因訓(xùn)練集負(fù)樣本數(shù)量過(guò)于龐大,而導(dǎo)致的訓(xùn)練效率較低的問(wèn)題,提出了一種基于博弈的鏈接預(yù)測(cè)模型,通過(guò)網(wǎng)絡(luò)生成博弈模型和其他加速策略,該方法能夠在保證良好預(yù)測(cè)效果的同時(shí),極大地降低訓(xùn)練集中的負(fù)樣本數(shù)量,從而提高訓(xùn)練效率。實(shí)驗(yàn)結(jié)果表明,在多種社交網(wǎng)絡(luò)和圖數(shù)據(jù)上,該算法獲得了比同類型方法更為優(yōu)異的表現(xiàn)。4.針對(duì)社交媒體中事件的特征提取問(wèn)題,提出了一種基于事件的主題模型,不僅能夠提取事件的主要話題,還能夠?qū)κ录念悇e特征進(jìn)行提取;谀P统槿〉奶卣,并結(jié)合新聞和社交媒體,對(duì)相關(guān)網(wǎng)絡(luò)事件進(jìn)行了深入的分析。利用提取的特征,對(duì)事件進(jìn)行分類,其結(jié)果表明了這些特征的有效性。5.針對(duì)社交媒體中不可靠?jī)?nèi)容識(shí)別、分類和分析問(wèn)題,提出了基于邏輯回歸和深度學(xué)習(xí)的兩種不可靠?jī)?nèi)容分類器,以及一種不可靠?jī)?nèi)容的新分類方法。首先,進(jìn)行了假新聞識(shí)別,邏輯回歸和深度學(xué)習(xí)模型分別展現(xiàn)了在不同分類任務(wù)中的有效性。由于邏輯回歸模型較好的可解釋性,基于邏輯回歸模型提取的特征對(duì)假新聞的語(yǔ)言風(fēng)格、情感、主觀性等進(jìn)行了分析。其次,新提出的分類方法能夠?qū)⒉豢煽績(jī)?nèi)容目的和可靠性評(píng)分結(jié)合起來(lái)。同樣,基于邏輯回歸和深度學(xué)習(xí)模型,對(duì)不可靠?jī)?nèi)容進(jìn)行新分類下的識(shí)別和分析,并結(jié)合社交用戶反應(yīng),獲得了新的發(fā)現(xiàn)和模式。綜上所述,本文所研究的社交媒體中網(wǎng)絡(luò)和內(nèi)容分析的關(guān)鍵技術(shù),對(duì)于面向社交媒體的數(shù)據(jù)挖掘和分析工作有重要的理論意義和應(yīng)用價(jià)值。提出的新模型和方法,能夠被應(yīng)用在實(shí)際系統(tǒng)中,獲得更高效、準(zhǔn)確的結(jié)果。對(duì)社交媒體中事件、假新聞等熱點(diǎn)問(wèn)題的探討,為深入理解和解決這些問(wèn)題提供了參考。
【圖文】:
(a)節(jié)點(diǎn)度分布邐(b)邋Log-log模式下的節(jié)點(diǎn)度分布逡逑圖2.2:臉書網(wǎng)絡(luò)中用戶度分布逡逑臉書社交網(wǎng)絡(luò)度分布的冪律特性表明,網(wǎng)絡(luò)中的大多數(shù)用戶只有有限的朋逡逑友關(guān)系,而極少一部分用戶會(huì)有很大的朋友圈。圖2.3中展示了臉書中度分布的逡逑互補(bǔ)累計(jì)分布函數(shù)(complementary邋cumulative邋distribution邋function,CCDF)邋0逡逑帕累托分布(Pareto邋distribution)是可以通過(guò)雙對(duì)數(shù)模式T的CCDFli]線的形逡逑狀來(lái)判斷的,如果圖線是一條直線,那么這個(gè)分布就遵從帕累托效應(yīng)。在圖中,逡逑臉書度分布的CCDF曲線向上凸起,并不符合帕累托分布。這表明小度節(jié)點(diǎn)的逡逑數(shù)量較多,例如,從圖中可以看出度小于60的節(jié)點(diǎn)大概占了所有節(jié)點(diǎn)的90%左逡逑右。逡逑1。。。。。°^逡逑10-1逡逑,,邋\逡逑8::邋\逡逑10-4邐義逡逑%逡逑0逡逑0逡逑10°邐RP邐RP邐f0^逡逑Degree逡逑圖2.3:邋Log-log模式下的用戶節(jié)點(diǎn)度分布的CCDF逡逑-15-逡逑
山東大學(xué)博士學(xué)位論文構(gòu)成關(guān)系。在汽車行業(yè),很多部件都是由其他構(gòu)件裝配而同一公司產(chǎn)品間的構(gòu)成關(guān)系就形成產(chǎn)品的物料清單(bill邋ofM)。不同企業(yè)間的產(chǎn)品表示配件采購(gòu)自其他廠家的產(chǎn)品。逡逑-員工-產(chǎn)品關(guān)系。員工和產(chǎn)品從屬于企業(yè),同時(shí)由于業(yè)務(wù)工需要跟蹤負(fù)責(zé)特定的一些產(chǎn)品,這樣就形成了企業(yè)內(nèi)業(yè)元。逡逑_?Producl邋L5'
【學(xué)位授予單位】:山東大學(xué)
【學(xué)位級(jí)別】:博士
【學(xué)位授予年份】:2018
【分類號(hào)】:G206;O157.5
本文編號(hào):2587656
【圖文】:
(a)節(jié)點(diǎn)度分布邐(b)邋Log-log模式下的節(jié)點(diǎn)度分布逡逑圖2.2:臉書網(wǎng)絡(luò)中用戶度分布逡逑臉書社交網(wǎng)絡(luò)度分布的冪律特性表明,網(wǎng)絡(luò)中的大多數(shù)用戶只有有限的朋逡逑友關(guān)系,而極少一部分用戶會(huì)有很大的朋友圈。圖2.3中展示了臉書中度分布的逡逑互補(bǔ)累計(jì)分布函數(shù)(complementary邋cumulative邋distribution邋function,CCDF)邋0逡逑帕累托分布(Pareto邋distribution)是可以通過(guò)雙對(duì)數(shù)模式T的CCDFli]線的形逡逑狀來(lái)判斷的,如果圖線是一條直線,那么這個(gè)分布就遵從帕累托效應(yīng)。在圖中,逡逑臉書度分布的CCDF曲線向上凸起,并不符合帕累托分布。這表明小度節(jié)點(diǎn)的逡逑數(shù)量較多,例如,從圖中可以看出度小于60的節(jié)點(diǎn)大概占了所有節(jié)點(diǎn)的90%左逡逑右。逡逑1。。。。。°^逡逑10-1逡逑,,邋\逡逑8::邋\逡逑10-4邐義逡逑%逡逑0逡逑0逡逑10°邐RP邐RP邐f0^逡逑Degree逡逑圖2.3:邋Log-log模式下的用戶節(jié)點(diǎn)度分布的CCDF逡逑-15-逡逑
山東大學(xué)博士學(xué)位論文構(gòu)成關(guān)系。在汽車行業(yè),很多部件都是由其他構(gòu)件裝配而同一公司產(chǎn)品間的構(gòu)成關(guān)系就形成產(chǎn)品的物料清單(bill邋ofM)。不同企業(yè)間的產(chǎn)品表示配件采購(gòu)自其他廠家的產(chǎn)品。逡逑-員工-產(chǎn)品關(guān)系。員工和產(chǎn)品從屬于企業(yè),同時(shí)由于業(yè)務(wù)工需要跟蹤負(fù)責(zé)特定的一些產(chǎn)品,這樣就形成了企業(yè)內(nèi)業(yè)元。逡逑_?Producl邋L5'
【學(xué)位授予單位】:山東大學(xué)
【學(xué)位級(jí)別】:博士
【學(xué)位授予年份】:2018
【分類號(hào)】:G206;O157.5
本文編號(hào):2587656
本文鏈接:http://sikaile.net/xinwenchuanbolunwen/2587656.html
最近更新
教材專著