天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 碩博論文 > 信息類博士論文 >

基于信念網(wǎng)絡(luò)的話題識別與追蹤模型研究

發(fā)布時間:2017-11-24 13:21

  本文關(guān)鍵詞:基于信念網(wǎng)絡(luò)的話題識別與追蹤模型研究


  更多相關(guān)文章: 話題識別與追蹤 信念網(wǎng)絡(luò) 話題模型 誤報檢測 特征選擇 互信息


【摘要】:向量空間檢索模型在話題識別與追蹤領(lǐng)域的成功應(yīng)用,從理論上證明用于信息檢索的貝葉斯網(wǎng)絡(luò)模型亦可用于該領(lǐng)域。信念網(wǎng)絡(luò)模型屬于基于貝葉斯網(wǎng)絡(luò)的檢索模型的一種,論文嘗試將其用于話題識別與追蹤模型的構(gòu)建,為該領(lǐng)域提出新的研究方法。特征選擇是話題模型構(gòu)建的基礎(chǔ),互信息是文本處理領(lǐng)域一種有效的特征選擇方法。在基本互信息的基礎(chǔ)上,將出現(xiàn)相同高頻詞的新聞報道進(jìn)行聚類,計(jì)算聚類后術(shù)語的互信息,將追蹤到的相關(guān)報道的發(fā)生時間和話題的發(fā)生時間量化為時間距離,使其反比影響互信息的動態(tài)更新,得到基于聚類的動態(tài)互信息計(jì)算方法,用于計(jì)算新聞報道中術(shù)語的權(quán)重。為了獲得TDT4語料中,每個話題的初始特征子集規(guī)模,給出基于類內(nèi)距離最小、類間距離最大的目標(biāo)函數(shù),并采用坐標(biāo)下降法對其求解。結(jié)合信念網(wǎng)絡(luò)模型和新聞報道的特點(diǎn),給出四個基于信念網(wǎng)絡(luò)的話題模型BSTM-I、BSTM-II、BDTM-I和BDTM-II。BSTM-I包括三類節(jié)點(diǎn):新報道節(jié)點(diǎn)、術(shù)語節(jié)點(diǎn)和話題節(jié)點(diǎn),弧體現(xiàn)節(jié)點(diǎn)間的隸屬關(guān)系。BSTM-II在BSTM-I的基礎(chǔ)上加入事件節(jié)點(diǎn),弧的指向和意義不變,為體現(xiàn)核心報道、核心事件的重要性,BSTM-II對核心報道、核心事件中的術(shù)語權(quán)重進(jìn)行了兩次線性提高調(diào)整。BDTM-I屬于動態(tài)話題模型,節(jié)點(diǎn)類型和弧的意義與上述模型相同,不同的是在話題追蹤過程中,其術(shù)語層會隨著話題的發(fā)展而不斷更新,重復(fù)出現(xiàn)的術(shù)語權(quán)重采用求和平均的方法更新,新出現(xiàn)的術(shù)語作為新的節(jié)點(diǎn)插入術(shù)語層。以上三個話題模型沿用了傳統(tǒng)建模思想,具備和以往模型相同的優(yōu)缺點(diǎn)。BDTM-II打破傳統(tǒng)建模的思想,運(yùn)用信念網(wǎng)絡(luò)模型提供了一個靈活框架的優(yōu)勢,將術(shù)語節(jié)點(diǎn)分為兩類:初始核心術(shù)語節(jié)點(diǎn)和更新術(shù)語節(jié)點(diǎn),并采用析取手段將它們作為兩類證據(jù)進(jìn)行歸并。依據(jù)模型的拓?fù)浣Y(jié)構(gòu),給出了上述四個模型計(jì)算新聞報道和話題相似度的概率推導(dǎo)過程,用于判斷新的新聞報道是否和話題相關(guān)。通過系統(tǒng)分析動態(tài)話題追蹤的誤報原因,提出動態(tài)話題追蹤中的誤報檢測。該方法首先分析了時間距離、相似度差值、相似話題分布及與核心內(nèi)容相似度分別如何影響誤報檢測,然后通過將這四項(xiàng)內(nèi)容線性調(diào)和得到了誤報檢測因子的計(jì)算方法,用于判斷追蹤到的相關(guān)報道是否屬于誤報,若屬于誤報,則對部分特征權(quán)重進(jìn)行衰減,并確定模型結(jié)構(gòu)是否需要調(diào)整。實(shí)驗(yàn)采用TDT4語料,結(jié)合DET曲線驗(yàn)證了以上研究內(nèi)容的合理性和有效性。
【學(xué)位授予單位】:河北大學(xué)
【學(xué)位級別】:博士
【學(xué)位授予年份】:2015
【分類號】:TP391.1

【相似文獻(xiàn)】

中國期刊全文數(shù)據(jù)庫 前10條

1 張鴻久;何熹;;數(shù)字化電廠模型層次分析[J];現(xiàn)代商貿(mào)工業(yè);2009年20期

2 易先清,羅雪山,羅愛民;活動模型描述工具的設(shè)計(jì)與實(shí)現(xiàn)[J];系統(tǒng)工程與電子技術(shù);2004年08期

3 閻光偉;;點(diǎn)采樣模型的多樣性編輯與繪制[J];計(jì)算機(jī)工程;2007年10期

4 周穎;鄭國梁;李宣東;;模型層次與自省思想研究[J];計(jì)算機(jī)應(yīng)用與軟件;2005年12期

5 蔡國永;林煜明;;RBAC模型的擴(kuò)充及其應(yīng)用[J];計(jì)算機(jī)工程與應(yīng)用;2008年03期

6 ;MathWorks現(xiàn)代化的基于模型的設(shè)計(jì)[J];工業(yè)設(shè)計(jì);2012年08期

7 陳文超;陳寧;李文全;李峰;;基于交通管理GIS的道路模型研究與實(shí)現(xiàn)[J];計(jì)算機(jī)工程與設(shè)計(jì);2007年09期

8 羅軍,呂德文,陳松,李茜;基于E-R模型層次化的錄入技術(shù)[J];重慶大學(xué)學(xué)報(自然科學(xué)版);2003年07期

9 李文軍;周曉聰;李師賢;;并發(fā)模型的分類與層次[J];計(jì)算機(jī)科學(xué);2000年03期

10 周伯鑫;CEOOM──一個面向復(fù)雜環(huán)境的語義元模型[J];東南大學(xué)學(xué)報;1995年S1期

中國重要會議論文全文數(shù)據(jù)庫 前1條

1 張松;崔鐵軍;蔡暢;鄔雨筍;李偉;;一種基于空間認(rèn)知的三維地物模型[A];2009`中國地理信息產(chǎn)業(yè)論壇暨第二屆教育論壇就業(yè)洽談會論文集[C];2009年

中國博士學(xué)位論文全文數(shù)據(jù)庫 前5條

1 李欽;面向模型的組合理論研究[D];華東師范大學(xué);2011年

2 吳樹芳;基于信念網(wǎng)絡(luò)的話題識別與追蹤模型研究[D];河北大學(xué);2015年

3 翟文正;基于模型的異構(gòu)多核嵌入式系統(tǒng)開發(fā)研究[D];上海大學(xué);2013年

4 季慶光;高安全級操作系統(tǒng)形式設(shè)計(jì)的研究[D];中國科學(xué)院研究生院(軟件研究所);2004年

5 徐本柱;變結(jié)構(gòu)工序狀態(tài)網(wǎng)的模型與算法研究[D];合肥工業(yè)大學(xué);2011年

中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條

1 趙偉;基于經(jīng)濟(jì)關(guān)系的互聯(lián)網(wǎng)層次化建模與演化分析[D];上海交通大學(xué);2010年

2 吳菲;基于MOF的可執(zhí)行模型工具的研究與實(shí)現(xiàn)[D];吉林大學(xué);2008年

3 朱尚武;基于KⅢ的嗅覺仿生模型及其應(yīng)用研究[D];湖南大學(xué);2012年

4 王政;基于模糊的RBAC模型的研究與應(yīng)用[D];大連理工大學(xué);2009年

5 陳龍飛;農(nóng)資電子商務(wù)智能推薦模型研究[D];河北經(jīng)貿(mào)大學(xué);2014年

6 朱岳;基于三維分枝模型的樹木模擬算法研究及其實(shí)現(xiàn)[D];湖南大學(xué);2005年

7 周品;基于CBR的離散模擬模型可復(fù)用性研究[D];華中科技大學(xué);2010年

8 賈文質(zhì);基于動態(tài)權(quán)限策略的CAD模型安全保護(hù)[D];浙江工業(yè)大學(xué);2009年

9 盛兵;基于變維向量空間的鈑金件多態(tài)模型數(shù)字化定義技術(shù)研究[D];西北工業(yè)大學(xué);2005年

10 張倩;用于網(wǎng)絡(luò)評論文本挖掘的主題模型研究[D];北京交通大學(xué);2014年



本文編號:1222394

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/shoufeilunwen/xxkjbs/1222394.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶5b16d***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com