面向中文微博的社區(qū)發(fā)現(xiàn)和結(jié)構(gòu)洞挖掘的研究
本文選題:微博 切入點(diǎn):社會(huì)網(wǎng)絡(luò) 出處:《哈爾濱工業(yè)大學(xué)》2014年碩士論文 論文類型:學(xué)位論文
【摘要】:隨著互聯(lián)網(wǎng)技術(shù)的快速發(fā)展,虛擬社會(huì)網(wǎng)絡(luò)逐漸成為了人們關(guān)注的焦點(diǎn)。人們可以在虛擬社會(huì)平臺(tái)中更加方便地認(rèn)識(shí)好友和相互交流,從而促進(jìn)了真實(shí)社會(huì)關(guān)系的發(fā)展,使得人類的活動(dòng)與互聯(lián)網(wǎng)的應(yīng)用融為一體。而微博作為一種新興的網(wǎng)絡(luò)信息交互平臺(tái),其優(yōu)越獨(dú)特的設(shè)計(jì)理念使得用戶之間的交流更加及時(shí)、方便與暢通,龐大的用戶群體以及海量的文本信息蘊(yùn)含著極大的價(jià)值,在不同的研究領(lǐng)域有著重大的意義。本文對(duì)微博網(wǎng)絡(luò)中的社區(qū)發(fā)現(xiàn)和結(jié)構(gòu)洞挖掘的主要研究如下: 首先,闡述了社會(huì)網(wǎng)絡(luò)的基本概念及主要特征,對(duì)網(wǎng)絡(luò)分析的相關(guān)理論和技術(shù)進(jìn)行分析,即文本的預(yù)處理、文本的表示模型以及常用的聚類算法等,同時(shí),對(duì)文本的語義分析理論進(jìn)行研究,了解特征空間降維的必要性以及隱含語義分析的基本流程。 其次,分析微博網(wǎng)絡(luò)的主要特點(diǎn)及其交流機(jī)制,并采用微博開放平臺(tái)實(shí)現(xiàn)了數(shù)據(jù)的獲取。同時(shí),微博網(wǎng)絡(luò)呈現(xiàn)出多維度的結(jié)構(gòu)特征,而傳統(tǒng)平面結(jié)構(gòu)的網(wǎng)絡(luò)模型不能體現(xiàn)不同主題領(lǐng)域下的權(quán)威度,因此,提出了基于主題的多層次網(wǎng)絡(luò)模型,從不同的層次建立不同主題的用戶交互網(wǎng)絡(luò)圖,以充分挖掘出網(wǎng)絡(luò)中的社會(huì)群體。 再次,分析微博網(wǎng)絡(luò)的社區(qū)特征,并在傳統(tǒng)的社區(qū)發(fā)現(xiàn)算法基礎(chǔ)上,考慮到社區(qū)的主題特性,采用了詞共現(xiàn)度的事件劃分以及隱含語義的進(jìn)展分析,實(shí)現(xiàn)基于主題相似性的社區(qū)發(fā)現(xiàn)。同時(shí),從社區(qū)的網(wǎng)絡(luò)結(jié)構(gòu)出發(fā),提出了基于最大基數(shù)搜索的Greedy算法以及基于權(quán)重平衡的WEBA算法,實(shí)現(xiàn)了網(wǎng)絡(luò)社區(qū)結(jié)構(gòu)的合理劃分。 最后,闡述社會(huì)網(wǎng)絡(luò)結(jié)構(gòu)洞節(jié)點(diǎn)的基本概念,以及其在社會(huì)資產(chǎn)以及不同領(lǐng)域中的重要作用,通過PageRank算法對(duì)網(wǎng)絡(luò)節(jié)點(diǎn)的重要度做出了重要評(píng)價(jià)。并在此基礎(chǔ)上,從網(wǎng)絡(luò)的社區(qū)結(jié)構(gòu)和流網(wǎng)絡(luò)的信息擴(kuò)散角度出發(fā),提出基于輿論領(lǐng)袖的HIS算法和基于最小割集的MaxD算法,實(shí)現(xiàn)了結(jié)構(gòu)洞節(jié)點(diǎn)的挖掘。
[Abstract]:With the rapid development of Internet technology, virtual social network has gradually become the focus of attention. People can more conveniently know friends and communicate with each other in the virtual social platform, thus promoting the development of real social relations. As a new network information exchange platform, Weibo's superior and unique design concept makes the communication between users more timely, convenient and smooth. The huge user group and the massive text information contain the great value, has the great significance in the different research domain. This article mainly studies the community discovery and the structure hole mining in Weibo network as follows:. Firstly, the basic concept and main characteristics of social network are introduced, and the related theories and techniques of network analysis are analyzed, such as text preprocessing, text representation model and clustering algorithm, etc. The semantic analysis theory of text is studied to understand the necessity of dimensionality reduction in feature space and the basic process of implicit semantic analysis. Secondly, it analyzes the main characteristics of Weibo's network and its communication mechanism, and realizes the acquisition of data by use of Weibo's open platform. At the same time, Weibo's network presents multi-dimensional structural characteristics. However, the traditional planar network model can not reflect the authority degree under different subject areas. Therefore, a multi-level network model based on topic is proposed to build user interaction network graph with different topics from different levels. In order to fully excavate the social groups in the network. Thirdly, it analyzes the community characteristics of Weibo network, and on the basis of the traditional community discovery algorithm, taking into account the thematic characteristics of the community, uses the word co-occurrence degree of event division and the implicit semantic progress analysis. At the same time, based on the community network structure, the Greedy algorithm based on maximum cardinality search and the WEBA algorithm based on weight balance are proposed to realize the reasonable division of the network community structure. Finally, the basic concept of the hole node of social network structure and its important role in social assets and different fields are expounded. The importance degree of network node is evaluated by PageRank algorithm. From the point of view of the community structure of the network and the information diffusion of the flow network, the HIS algorithm based on the opinion leader and the MaxD algorithm based on the minimum cut set are proposed to realize the mining of the structure hole nodes.
【學(xué)位授予單位】:哈爾濱工業(yè)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2014
【分類號(hào)】:TP393.092
【相似文獻(xiàn)】
相關(guān)期刊論文 前6條
1 畢克新;馬慧子;艾明曄;;基于結(jié)構(gòu)洞的制造業(yè)企業(yè)信息化演進(jìn)研究[J];統(tǒng)計(jì)與決策;2011年23期
2 呂剛;;區(qū)域信息資源共建共享中的結(jié)構(gòu)洞現(xiàn)象研究[J];圖書館理論與實(shí)踐;2012年02期
3 王芬;;基于結(jié)構(gòu)洞理論的波特五力模型分析[J];現(xiàn)代情報(bào);2012年01期
4 曹學(xué)艷;;基于結(jié)構(gòu)洞視角的學(xué)科服務(wù)模式研究[J];圖書情報(bào)工作;2012年15期
5 汪丹;;結(jié)構(gòu)洞算法的比較與測(cè)評(píng)[J];現(xiàn)代情報(bào);2008年09期
6 ;[J];;年期
相關(guān)會(huì)議論文 前3條
1 周文;趙炎;;復(fù)雜創(chuàng)新網(wǎng)絡(luò)的小世界效應(yīng)研究——一個(gè)整合社會(huì)資本與結(jié)構(gòu)洞的視角[A];第七屆中國科技政策與管理學(xué)術(shù)年會(huì)論文集[C];2011年
2 梁魯晉;;基于管理視角的結(jié)構(gòu)洞與企業(yè)績效關(guān)系研究綜述[A];第六屆(2011)中國管理學(xué)年會(huì)——組織與戰(zhàn)略分會(huì)場(chǎng)論文集[C];2011年
3 陳育芳;;社會(huì)網(wǎng)理論視閾下的青年創(chuàng)業(yè)行為干預(yù)[A];福建省社會(huì)學(xué)2008年會(huì)論文集[C];2008年
相關(guān)重要報(bào)紙文章 前2條
1 趙軍;電影產(chǎn)業(yè)需要有了不起的中介[N];中國電影報(bào);2008年
2 何建華 安徽師范大學(xué)經(jīng)濟(jì)管理學(xué)院;“結(jié)構(gòu)洞”的創(chuàng)新價(jià)值[N];經(jīng)濟(jì)日?qǐng)?bào);2013年
相關(guān)博士學(xué)位論文 前1條
1 周浩軍;搜索優(yōu)勢(shì)與轉(zhuǎn)移問題:弱聯(lián)系、結(jié)構(gòu)洞和網(wǎng)絡(luò)多樣性對(duì)創(chuàng)新的曲線效應(yīng)[D];浙江大學(xué);2011年
相關(guān)碩士學(xué)位論文 前7條
1 袁恩洋;大學(xué)生微博社會(huì)資本的實(shí)證研究[D];蘭州大學(xué);2016年
2 崔平平;基于分層遞階的網(wǎng)絡(luò)結(jié)構(gòu)洞占據(jù)者挖掘研究[D];安徽大學(xué);2016年
3 高玉華;結(jié)構(gòu)洞網(wǎng)絡(luò)位置對(duì)研發(fā)投入的影響研究[D];內(nèi)蒙古大學(xué);2016年
4 孫永利;面向中文微博的社區(qū)發(fā)現(xiàn)和結(jié)構(gòu)洞挖掘的研究[D];哈爾濱工業(yè)大學(xué);2014年
5 劉倩倩;加權(quán)網(wǎng)絡(luò)的結(jié)構(gòu)洞占據(jù)者獲取方法的研究[D];安徽大學(xué);2015年
6 李昱祺;“結(jié)構(gòu)洞”與半熟人社會(huì)中的選舉[D];華中師范大學(xué);2013年
7 范棟梁;結(jié)構(gòu)洞分類理論及其在CoPS創(chuàng)新網(wǎng)絡(luò)中的應(yīng)用[D];浙江工商大學(xué);2010年
,本文編號(hào):1595832
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/1595832.html