基于特征詞條本體進(jìn)化的微博話題跟蹤研究
本文關(guān)鍵詞:基于特征詞條本體進(jìn)化的微博話題跟蹤研究,由筆耕文化傳播整理發(fā)布。
【摘要】:微博作為一種新的在線社交媒體平臺(tái),近年來發(fā)展十分迅速,參與人數(shù)越來越多,已成為廣大民眾獲取信息、發(fā)表觀點(diǎn)的重要平臺(tái),并日益成為社會(huì)輿論中最重要的信息來源,快速及時(shí)的獲取微博熱點(diǎn)信息成為了人們的迫切需要。因此需要在微博中引入話題跟蹤技術(shù),讓用戶能夠快速準(zhǔn)確的掌握微博中的熱點(diǎn)話題信息。傳統(tǒng)的話題跟蹤主要采用特征詞的模型,數(shù)據(jù)維度很大且噪音很多,因此本文通過抽取話題最相關(guān)的本體信息來對(duì)話題進(jìn)行跟蹤,同時(shí)針對(duì)獨(dú)立的特征詞對(duì)話題語義表示上的缺陷,本文提出了特征詞條本體的概念,并應(yīng)用于話題跟蹤之中。本文首先介紹了話題跟蹤的相關(guān)基礎(chǔ)理論,詳述了話題跟蹤過程及涉及的關(guān)鍵技術(shù),分析了現(xiàn)有話題跟蹤方法的不足,同時(shí)介紹本體的知識(shí),并分析了本體的特點(diǎn)和本體進(jìn)化的概念;接下來針對(duì)現(xiàn)有話題跟蹤方法的不足,分析了微博報(bào)道的語義特征,提出了基于本體的話題表示方法,并自動(dòng)構(gòu)建出初始話題本體;初始本體中單一的特征項(xiàng)仍不能充分表達(dá)話題的語義信息,因此本體提出了特征詞條本體的概念,通過自動(dòng)抽取出的話題相關(guān)特征詞條來描述話題中的事件信息,并且通過本體的不斷進(jìn)化來進(jìn)行微博話題的跟蹤;最后,本文設(shè)計(jì)了相應(yīng)的實(shí)驗(yàn)系統(tǒng),對(duì)本文提出的方法進(jìn)行實(shí)驗(yàn)驗(yàn)證。本文的主要貢獻(xiàn)在于:①針對(duì)微博的語義特征,提出了微博話題的特征詞條本體表示方法,能夠自動(dòng)構(gòu)建特征詞條本體并實(shí)現(xiàn)本體的進(jìn)化。②提出了基于本體進(jìn)化的微博話題跟蹤算法,根據(jù)微博話題的特征設(shè)計(jì)了相應(yīng)的權(quán)重和相似度計(jì)算方法。
【關(guān)鍵詞】:話題跟蹤 特征詞條本體 本體進(jìn)化 信息抽取
【學(xué)位授予單位】:南京航空航天大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類號(hào)】:TP391.1;TP393.092
【目錄】:
- 摘要4-5
- ABSTRACT5-10
- 第一章 緒論10-17
- 1.1 選題背景及意義10-11
- 1.1.1 選題背景10
- 1.1.2 研究意義10-11
- 1.2 國內(nèi)外研究現(xiàn)狀11-14
- 1.2.1 國外研究現(xiàn)狀11-12
- 1.2.2 國內(nèi)研究現(xiàn)狀12-13
- 1.2.3 存在的問題13-14
- 1.3 研究內(nèi)容和技術(shù)路線14-16
- 1.3.1 研究內(nèi)容14-15
- 1.3.2 技術(shù)路線15-16
- 1.4 主要工作及創(chuàng)新點(diǎn)16-17
- 第二章 相關(guān)基礎(chǔ)理論研究17-27
- 2.1 話題跟蹤技術(shù)17-18
- 2.1.1 相關(guān)概念17-18
- 2.1.2 話題跟蹤特點(diǎn)18
- 2.2 話題跟蹤關(guān)鍵技術(shù)18-23
- 2.2.1 話題跟蹤一般流程18-19
- 2.2.2 建立話題/報(bào)道模型19-20
- 2.2.3 特征項(xiàng)提取20
- 2.2.4 權(quán)重計(jì)算20-22
- 2.2.5 計(jì)算模型相似度22
- 2.2.6 閾值比較22-23
- 2.3 本體及本體進(jìn)化23-26
- 2.3.1 本體簡介23-24
- 2.3.2 本體的構(gòu)建24-25
- 2.3.3 本體的進(jìn)化25-26
- 2.4 本章小結(jié)26-27
- 第三章 微博初始本體構(gòu)建27-38
- 3.1 微博數(shù)據(jù)獲取與處理27-32
- 3.1.1 確定數(shù)據(jù)來源27-28
- 3.1.2 微博數(shù)據(jù)采集28-30
- 3.1.3 微博數(shù)據(jù)預(yù)處理30-32
- 3.2 話題本體的自動(dòng)構(gòu)建32-37
- 3.2.1 話題本體自動(dòng)構(gòu)建流程32-33
- 3.2.2 時(shí)間本體的獲取33-34
- 3.2.3 地點(diǎn)本體的獲取34-36
- 3.2.4 對(duì)象本體的獲取36-37
- 3.3 本章小結(jié)37-38
- 第四章 特征詞條本體的自動(dòng)構(gòu)建及進(jìn)化38-45
- 4.1 特征詞條本體的提出38-39
- 4.2 特征詞條本體的自動(dòng)構(gòu)建39-42
- 4.2.1 特征詞的獲取39-40
- 4.2.2 特征詞點(diǎn)互信息計(jì)算40
- 4.2.3 初始特征詞條抽取算法40
- 4.2.4 特征詞條本體獲取40-42
- 4.3 特征詞條本體的進(jìn)化42-44
- 4.4 本章小結(jié)44-45
- 第五章 基于特征詞條本體的微博話題跟蹤算法45-49
- 5.1 話題跟蹤流程45-46
- 5.2 本體權(quán)重的計(jì)算46-47
- 5.3 話題本體與報(bào)道相似度計(jì)算47-48
- 5.4 報(bào)道相關(guān)性判定48
- 5.5 微博熱度計(jì)算48
- 5.6 本章小結(jié)48-49
- 第六章 實(shí)驗(yàn)設(shè)計(jì)及分析49-59
- 6.1 實(shí)驗(yàn)系統(tǒng)設(shè)計(jì)49-56
- 6.1.1 實(shí)驗(yàn)系統(tǒng)功能49-50
- 6.1.2 實(shí)驗(yàn)數(shù)據(jù)50
- 6.1.3 實(shí)驗(yàn)過程展示50-56
- 6.2 實(shí)驗(yàn)結(jié)果分析與比較56-58
- 6.2.1 評(píng)價(jià)標(biāo)準(zhǔn)56-57
- 6.2.2 實(shí)驗(yàn)結(jié)果及分析57-58
- 6.3 本章小結(jié)58-59
- 第七章 總結(jié)與展望59-60
- 7.1 總結(jié)59
- 7.2 展望59-60
- 參考文獻(xiàn)60-63
- 致謝63-64
- 攻讀碩士期間發(fā)表的論文及科研成果64
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前3條
1 劉宗田;黃美麗;周文;仲兆滿;付劍鋒;單建芳;智慧來;;面向事件的本體研究[J];計(jì)算機(jī)科學(xué);2009年11期
2 范寬;吳朝暉;陳華鈞;;基于本體的網(wǎng)絡(luò)數(shù)據(jù)工作平臺(tái)NetData[J];計(jì)算機(jī)科學(xué);2006年09期
3 ;[J];;年期
中國重要會(huì)議論文全文數(shù)據(jù)庫 前4條
1 楊保軍;;關(guān)于新聞本體的幾個(gè)基本問題[A];新聞學(xué)論集(第22輯)[C];2009年
2 王連誠;馬強(qiáng);;基于概念權(quán)重的本體相似度計(jì)算[A];計(jì)算機(jī)技術(shù)與應(yīng)用進(jìn)展·2007——全國第18屆計(jì)算機(jī)技術(shù)與應(yīng)用(CACIS)學(xué)術(shù)會(huì)議論文集[C];2007年
3 王文晶;李茹;宋小香;;基于漢語框架知識(shí)庫的旅游信息問答系統(tǒng)設(shè)計(jì)[A];第四屆全國學(xué)生計(jì)算語言學(xué)研討會(huì)會(huì)議論文集[C];2008年
4 汪政;曉華;;批評(píng)的本體相位[A];這就是我們的文學(xué)生活——《當(dāng)代文壇》三十年評(píng)論精選(下)[C];2012年
中國重要報(bào)紙全文數(shù)據(jù)庫 前1條
1 清華大學(xué)計(jì)算機(jī)系知識(shí)工程組 仲茜邋李涓子;語義Web中的本體建立技術(shù)[N];計(jì)算機(jī)世界;2007年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前1條
1 林松濤;模塊化本體建設(shè)研究[D];北京郵電大學(xué);2006年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前3條
1 簡旭文;基于特征詞條本體進(jìn)化的微博話題跟蹤研究[D];南京航空航天大學(xué);2015年
2 蔣璐;基于變化管理的本體協(xié)同開發(fā)方法研究[D];江蘇科技大學(xué);2013年
3 張志慧;UML類圖轉(zhuǎn)換到OWL DL本體的一種形式化方法的研究[D];東北大學(xué);2008年
本文關(guān)鍵詞:基于特征詞條本體進(jìn)化的微博話題跟蹤研究,由筆耕文化傳播整理發(fā)布。
,本文編號(hào):383524
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/383524.html