天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 搜索引擎論文 >

基于Web和Email的多元社會網(wǎng)絡抽取與分析關(guān)鍵技術(shù)研究

發(fā)布時間:2018-10-09 08:31
【摘要】:隨著信息技術(shù)和網(wǎng)絡通信技術(shù)的發(fā)展,利用互聯(lián)網(wǎng)組織的違法行為和活動越來越多。如何從多種網(wǎng)絡數(shù)據(jù)中準確抽取人物的屬性和社會關(guān)系等信息,進而挖掘潛在的關(guān)鍵人物和社團組織等網(wǎng)情信息,已成為一個備受關(guān)注的問題。目前,基于單一網(wǎng)絡數(shù)據(jù)的社會網(wǎng)絡抽取與分析技術(shù)已比較成熟,但相關(guān)技術(shù)還無法解決基于多種網(wǎng)絡數(shù)據(jù)的社會網(wǎng)絡抽取與分析問題。本文對基于網(wǎng)絡數(shù)據(jù)的社會網(wǎng)絡抽取與分析相關(guān)技術(shù)的應用和研究現(xiàn)狀進行了分析,在此基礎(chǔ)上,針對Web頁面和Email消息這兩種數(shù)據(jù),圍繞基于多種網(wǎng)絡數(shù)據(jù)的社會網(wǎng)絡抽取與分析中的幾個關(guān)鍵技術(shù),包括社會網(wǎng)絡模型、人物屬性抽取、社會關(guān)系評估及社團發(fā)現(xiàn)等,開展了深入研究。主要工作和研究成果包括以下幾個方面: (1)社會網(wǎng)絡模型方面。針對現(xiàn)有社會網(wǎng)絡模型不能充分描述人物在多種網(wǎng)絡數(shù)據(jù)中的屬性及社會關(guān)系信息,提出了多元社會網(wǎng)絡的概念與模型,并給出了基于Web和Email的多元社會網(wǎng)絡實例的具體描述方法;該模型為基于多種網(wǎng)絡數(shù)據(jù)的人物的屬性抽取、社會關(guān)系評估和社團發(fā)現(xiàn)等社會網(wǎng)絡抽取與分析技術(shù)提供了研究基礎(chǔ);诖四P停岢隽硕嘣鐣W(wǎng)絡抽取分析技術(shù)框架,并對其中的關(guān)鍵技術(shù)進行了分析,該框架對面向多元社會網(wǎng)絡的相關(guān)研究和系統(tǒng)設計具有較好的指導意義。 (2)基于Web頁面的人物屬性抽取方面。針對現(xiàn)有Web人物屬性抽取的概念和方法不能適用于Web頁面中不同類型的人物屬性自動抽取問題,提出了廣義Web人物屬性抽取的概念,并對其進行了形式化描述。為解決廣義Web人物屬性抽取問題,提出了基于多特征自動推理的Web人物屬性抽取方法(MFAR)。在MFAR方法的關(guān)聯(lián)規(guī)則定義問題上,提出了多種具有通用性的關(guān)聯(lián)特征,建立了基于單一特征和多特征的屬性關(guān)聯(lián)規(guī)則,對關(guān)聯(lián)特征和關(guān)聯(lián)規(guī)則進行了邏輯表示。提出了利用Markov邏輯網(wǎng)來解決MFAR方法中的關(guān)聯(lián)規(guī)則自動訓練與推理問題,并給出了基于Markov邏輯網(wǎng)的關(guān)聯(lián)規(guī)則自動訓練與推理框架。實驗結(jié)果表明:面對不同類型的Web人物屬性抽取問題,,與現(xiàn)有基于單一規(guī)則的Web人物屬性抽取方法相比,該算法可以更準確地從Web頁面中自動抽取出人物屬性。 (3)基于Email數(shù)據(jù)的人物屬性抽取方面。提出了基于郵件數(shù)據(jù)的人物屬性抽取框架;針對框架中郵件正文稱呼塊和簽名塊內(nèi)的候選人名屬性抽取問題,提出了基于統(tǒng)計和規(guī)則的塊定位算法;針對框架中候選人名可信度評估問題,提出了基于聚類和通信重要度的候選人名可信度評估算法,算法通過對候選人名聚類并分析人名在郵件通信中體現(xiàn)的重要度,評估候選人名類的可信度,進而抽取出人物的可信人名。在Enron郵件數(shù)據(jù)集上的實驗結(jié)果表明利用提出的塊定位算法可以較為準確地抽取出郵件正文中的稱呼塊和簽名塊,提出的候選人名可信度評估算法可以準確地抽取出人物的正式人名及其別名。 (4)基于Web頁面的社會關(guān)系評估方面。針對現(xiàn)有Web社會關(guān)系評估方法的評估結(jié)果準確度不高、穩(wěn)定性不好等問題,提出了一個基于搜索引擎和文本分析的Web社會關(guān)系評估模型;在該模型的基礎(chǔ)上,設計了兩種關(guān)系評估函數(shù),并構(gòu)建了相應的關(guān)系評估方法。實驗結(jié)果表明:與現(xiàn)有基于搜索引擎和基于文本分析的典型方法相比,基于SETARM模型設計的兩種關(guān)系評估方法計算出的關(guān)系權(quán)重更準確、穩(wěn)定性更好;模型中兩類基本方法以線性方式融合且基于文本分析的方法其貢獻更大時模型的性能更好。 (5)社團發(fā)現(xiàn)算法方面。針對現(xiàn)有社團發(fā)現(xiàn)算法不能很好地解決多元社會網(wǎng)絡中的社團發(fā)現(xiàn)問題,提出了多元社會網(wǎng)絡中社團發(fā)現(xiàn)的基本思想;谠撍枷,針對多元社會網(wǎng)絡向有權(quán)網(wǎng)絡的轉(zhuǎn)換問題,提出了綜合多元信息的關(guān)系緊密度評估方法(MICE);針對有權(quán)網(wǎng)絡中的社團發(fā)現(xiàn)問題,提出了兩階段局部貪婪擴展算法(TSLGE),算法在種子的選擇、擴展評價函數(shù)的定義和相似社團合并等關(guān)鍵問題的處理上提出了改進方法。在基于Enron郵件集構(gòu)建的多元社會網(wǎng)絡實例上的實驗結(jié)果,驗證了利用MICE方法評估出的節(jié)點之間的關(guān)系緊密度與真實社會關(guān)系更接近;在仿真網(wǎng)絡和基于Enron郵件集構(gòu)建的多元社會網(wǎng)絡實例上進行的社團發(fā)現(xiàn)實驗結(jié)果表明,TSLGE算法具有較好的時間性能,且與現(xiàn)有基于局部擴展的典型社團發(fā)現(xiàn)算法相比,TSLGE算法在無權(quán)網(wǎng)絡和有權(quán)網(wǎng)絡上均可以比較準確地發(fā)現(xiàn)網(wǎng)絡中的社團。 最后,對全文工作進行了總結(jié),并對多元社會網(wǎng)絡抽取和分析技術(shù)進行了展望,提出了下一步的研究方向。
[Abstract]:......
【學位授予單位】:解放軍信息工程大學
【學位級別】:博士
【學位授予年份】:2012
【分類號】:TP393.09

【相似文獻】

相關(guān)期刊論文 前10條

1 李方敏;CGI的安全編程[J];計算機工程與應用;1999年06期

2 宋如順,姜乃松;基于Web的遠程考試系統(tǒng)設計與實現(xiàn)[J];計算機工程;1999年06期

3 王紅霞,姚家亮;利用ASP構(gòu)建新型信息系統(tǒng)的方法與實現(xiàn)[J];計算機應用;1999年09期

4 鄧勁生,張銀福;面向?qū)ο蟮亩嗝襟w信息WEB發(fā)布[J];計算機應用研究;1999年09期

5 刁興春,李赤紅;Intranet環(huán)境下事務處理的理論研究和實現(xiàn)[J];小型微型計算機系統(tǒng);1999年06期

6 高昆;基于ASP的WEB站點開發(fā)技術(shù)分析[J];北華大學學報(社會科學版);1999年05期

7 王清心,胡建華;經(jīng)貿(mào)數(shù)據(jù)庫的WEB集成發(fā)布[J];昆明理工大學學報;1999年02期

8 李晶,朱秋萍;Web頁制作中的動態(tài)表現(xiàn)技術(shù)[J];計算機工程;2000年06期

9 劉波,代亞非,杜躍進;遠程協(xié)同教學系統(tǒng)中課程搜索子系統(tǒng)設計[J];計算機應用;2000年06期

10 武莊,劉友丹;基于Web的企業(yè)內(nèi)部質(zhì)量審核系統(tǒng)設計與實現(xiàn)[J];計算機應用研究;2000年05期

相關(guān)會議論文 前10條

1 石晶;龔震宇;裘杭萍;;基于Web挖掘的個性化服務技術(shù)[A];第十九屆全國數(shù)據(jù)庫學術(shù)會議論文集(技術(shù)報告篇)[C];2002年

2 李利波;劉明利;;一種改進的無回溯反向Web服務動態(tài)組合方法[A];2011年全國通信安全學術(shù)會議論文集[C];2011年

3 游爭光;劉建勛;唐明董;;分布式Web服務測試系統(tǒng)的設計與實現(xiàn)[A];CCF NCSC 2011——第二屆中國計算機學會服務計算學術(shù)會議論文集[C];2011年

4 殷華蓓;李通;唐常杰;張?zhí)鞈c;左志松;;從Web文件中挖掘個性化導航知識[A];第十七屆全國數(shù)據(jù)庫學術(shù)會議論文集(研究報告篇)[C];2000年

5 ;基于廣義對話的Web用戶的聚類(英文)[A];第十七屆全國數(shù)據(jù)庫學術(shù)會議論文集(研究報告篇)[C];2000年

6 鄧長壽;郭景峰;楊焱林;鄧安遠;;下一代Web搜索引擎初探[A];第十八屆全國數(shù)據(jù)庫學術(shù)會議論文集(研究報告篇)[C];2001年

7 ;WTCA:A Web Text Clustering Algorithm Based on DFSSM[A];第二十七屆中國控制會議論文集[C];2008年

8 胡建強;周斌;尹剛;鄒鵬;;基于角色的Web服務訪問控制技術(shù)研究[A];第二十屆全國數(shù)據(jù)庫學術(shù)會議論文集(技術(shù)報告篇)[C];2003年

9 黃建波;丁揚;方芳;;基于代理服務器的Web加速的實現(xiàn)[A];2010通信理論與技術(shù)新發(fā)展——第十五屆全國青年通信學術(shù)會議論文集(上冊)[C];2010年

10 陶冶;劉建勛;唐明董;;基于Map/Reduce的分布式Web服務搜索引擎設計與實現(xiàn)[A];CCF NCSC 2011——第二屆中國計算機學會服務計算學術(shù)會議論文集[C];2011年

相關(guān)重要報紙文章 前10條

1 ;Web 2.0數(shù)據(jù)分析工具正流行[N];網(wǎng)絡世界;2008年

2 趙曉濤;Web安全 服務為王[N];網(wǎng)絡世界;2008年

3 本報記者 趙曉濤;Web安全:歷史的命題[N];網(wǎng)絡世界;2008年

4 彭敏;企業(yè)級Web2.0迎來應用高潮[N];電腦商報;2009年

5 本報記者 毛江華;安啟華聯(lián)手賽門鐵克 掘金Web安全[N];計算機世界;2009年

6 閆冰;“推”出Web交付新天地[N];網(wǎng)絡世界;2009年

7 趙曉濤;中國成全球Web安全新看點[N];網(wǎng)絡世界;2009年

8 邊歆;動態(tài)阻斷Web2.0威脅[N];網(wǎng)絡世界;2009年

9 泰樂公司首席技術(shù)官兼執(zhí)行副總裁Vikram Saksena;學習Web 3.0 做聰明的“管道工”[N];通信產(chǎn)業(yè)報;2009年

10 ;Web2.0工具使用須謹慎[N];網(wǎng)絡世界;2009年

相關(guān)博士學位論文 前10條

1 王洋;社會網(wǎng)絡視角下的危機傳播機理與治理[D];哈爾濱工業(yè)大學;2011年

2 倪順江;基于復雜網(wǎng)絡理論的傳染病動力學建模與研究[D];清華大學;2009年

3 尹美娟;基于Web和Email的多元社會網(wǎng)絡抽取與分析關(guān)鍵技術(shù)研究[D];解放軍信息工程大學;2012年

4 袁曉婷;企業(yè)R&D團隊內(nèi)部社會網(wǎng)絡與團隊知識創(chuàng)造關(guān)系研究[D];華南理工大學;2010年

5 張淑娟;吳景濂與民國政治:1916~1923[D];復旦大學;2007年

6 徐峰;互聯(lián)網(wǎng)宏觀拓撲結(jié)構(gòu)中社團特征演化分析及應用[D];東北大學;2009年

7 蘇春艷;社會網(wǎng)絡與職業(yè)獲得[D];上海大學;2005年

8 王小明;社會資本的經(jīng)濟分析[D];復旦大學;2008年

9 鄧學軍;企業(yè)家社會網(wǎng)絡對企業(yè)績效的影響研究[D];暨南大學;2009年

10 林琛;WEB環(huán)境下的社會網(wǎng)絡挖掘研究[D];復旦大學;2009年

相關(guān)碩士學位論文 前10條

1 龐永杰;基于Web的社會網(wǎng)絡搜索中人名同一性判斷方法研究[D];華中科技大學;2011年

2 唐黎;Deep Web頁面結(jié)構(gòu)分析與核心內(nèi)容提取研究[D];重慶大學;2011年

3 吳新勇;基于需求群組的Web服務調(diào)度模型研究[D];上海交通大學;2011年

4 徐衛(wèi);Web新聞熱點發(fā)現(xiàn)系統(tǒng)的設計與實現(xiàn)[D];華中科技大學;2011年

5 姜本臣;基于嵌入式Web服務器應用技術(shù)的研究[D];沈陽工業(yè)大學;2012年

6 溫梨梨;基于零拷貝的Web服務器技術(shù)研究[D];中國海洋大學;2011年

7 焦燕廷;一種基于領(lǐng)域本體的語義Web服務匹配和組合方法[D];山東科技大學;2011年

8 黃亮;Web漏洞掃描系統(tǒng)中的智能爬蟲技術(shù)研究[D];杭州電子科技大學;2012年

9 趙春娟;Web服務組合方法的研究與實現(xiàn)[D];天津理工大學;2011年

10 任強;基于謂詞抽象與精化技術(shù)的Web服務驗證研究[D];蘇州大學;2011年



本文編號:2258667

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2258667.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶2f769***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com