天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 碩博論文 > 信息類博士論文 >

概率主題模型的研究及其在多媒體主題發(fā)現(xiàn)和演化中的應(yīng)用

發(fā)布時(shí)間:2017-12-08 09:14

  本文關(guān)鍵詞:概率主題模型的研究及其在多媒體主題發(fā)現(xiàn)和演化中的應(yīng)用


  更多相關(guān)文章: 主題演化 主題模型 隨機(jī)游走 運(yùn)動(dòng)模式 異常檢測(cè)


【摘要】:隨著信息技術(shù)、互聯(lián)網(wǎng)和數(shù)據(jù)庫(kù)技術(shù)的發(fā)展,人們積累的數(shù)據(jù)不斷增加,信息泛濫問(wèn)題日益嚴(yán)重。如何從大量的數(shù)據(jù)集中發(fā)現(xiàn)用戶感興趣的熱點(diǎn)主題以及這些主題隨時(shí)間發(fā)展演化的情況,逐漸成為這個(gè)信息爆炸時(shí)代的重要問(wèn)題。搜索引擎的出現(xiàn)為人們從海量的存檔數(shù)據(jù)中快速檢索和尋找有用信息提供了一種有效途徑。然而,搜索引擎所返回的搜索結(jié)果往往是零碎的非結(jié)構(gòu)化的信息,它不能反映整個(gè)主題隨時(shí)間發(fā)展演化的情況。隨著以LDA為代表的概率主題模型的出現(xiàn),各種主題發(fā)現(xiàn)和演化的研究大量涌現(xiàn),為解決熱點(diǎn)主題的發(fā)現(xiàn)和主題隨時(shí)間的演化等問(wèn)題提供了很好的途徑。近十年來(lái),概率概率主題模型的研究越來(lái)越受到數(shù)據(jù)挖掘和知識(shí)發(fā)現(xiàn)領(lǐng)域研究者的重視,相關(guān)研究成果也在文本、圖像和視頻數(shù)據(jù)處理上獲得了廣泛的應(yīng)用,取得了不少進(jìn)展,但也存在一些問(wèn)題。例如,各種概率主題模型的對(duì)比分析、歸納總結(jié)的綜合性分析還很少出現(xiàn);在科研文獻(xiàn)的主題發(fā)現(xiàn)和演化分析研究中,利用結(jié)構(gòu)化的數(shù)據(jù)中的多種信息源來(lái)發(fā)現(xiàn)主題和跟蹤主題的演化研究方面還不夠深入;跟蹤不同主題之間的相互演化的研究還未出現(xiàn);概率主題模型在交通視頻的運(yùn)動(dòng)模式發(fā)現(xiàn)和異常行為檢測(cè)上的應(yīng)用還很不完善。針對(duì)這些問(wèn)題,本文首先對(duì)各種概率主題模型中的典型模型進(jìn)行了綜述分析和對(duì)比研究;在此基礎(chǔ)上,針對(duì)科研文獻(xiàn)數(shù)據(jù)中廣泛存在的多源結(jié)構(gòu)化信息,提出了一種內(nèi)容和引用信息相結(jié)合的概率主題模型,并應(yīng)用到科研文獻(xiàn)的主題發(fā)現(xiàn)和跟蹤中;其次,提出了一種新的基于隨機(jī)游走模型的主題演化圖構(gòu)建算法,解決了不同主題之間的演化問(wèn)題;最后,提出了一種兩層結(jié)構(gòu)的非參數(shù)化的概率主題模型,并應(yīng)用到交通視頻中的運(yùn)動(dòng)模式識(shí)別和異常行為檢測(cè)中。論文的主要工作和研究成果如下:(1)對(duì)最新的各種不同類型的概率主題模型進(jìn)行了綜述分析。首先根據(jù)模型對(duì)時(shí)間變量處理的特點(diǎn),將其分為三類典型模型——離散時(shí)間主題模型、連續(xù)時(shí)間主題模型和在線式的主題模型。其次,分別對(duì)這三類模型的特點(diǎn)進(jìn)行了總結(jié),并選取每類模型中的典型模型進(jìn)行了詳細(xì)的分析,包括模型的建模過(guò)程、模型特點(diǎn)以及各種模型的優(yōu)缺點(diǎn)。針對(duì)各類概率主題模型的對(duì)比實(shí)驗(yàn)問(wèn)題,分析了模型性能比較的各種可能方法,并總結(jié)了兩種有效的性能指標(biāo)——困惑度值和sKL散度值。分別對(duì)三類主題模型中的典型模型,在兩個(gè)典型的科研文獻(xiàn)數(shù)據(jù)庫(kù)上進(jìn)行了對(duì)比實(shí)驗(yàn)研究,通過(guò)對(duì)比實(shí)驗(yàn)驗(yàn)證了綜述分析中對(duì)各種模型特點(diǎn)的分析。(2)提出了一種Citation-Content-LDA主題模型,該模型在一個(gè)概率主題模型中綜合利用文檔的文本信息和文檔之間的引用信息來(lái)進(jìn)行主題的建模。該Citation-Content-LDA模型是一種兩層的主題模型,其分別利用引用信息來(lái)生成“父主題”和文本信息生成“子主題”,在此基礎(chǔ)上還實(shí)現(xiàn)了主題跟蹤算法,并利用吉布斯采樣算法來(lái)求解模型的參數(shù)。通過(guò)在兩個(gè)典型的科研文獻(xiàn)數(shù)據(jù)集上的對(duì)比實(shí)驗(yàn)研究,驗(yàn)證了該模型的有效性和優(yōu)越性。(3)提出了一種基于主題分割和主題關(guān)系度量的主題演化圖的構(gòu)建算法。針對(duì)不同主題之間的演化問(wèn)題,在Citation-Content-LDA模型發(fā)現(xiàn)的主題的基礎(chǔ)上,利用主題中文檔的時(shí)間信息進(jìn)行主題的分割,解決了主題對(duì)齊的問(wèn)題;提出了一種基于隨機(jī)游走的主題關(guān)系度量算法,借鑒PageRank算法的思想,建立主題之間關(guān)聯(lián)關(guān)系的有向無(wú)環(huán)圖,并通過(guò)對(duì)圖的隨機(jī)游走遍歷實(shí)現(xiàn)了主題之間關(guān)系的概率度量,最終實(shí)現(xiàn)了不同主題之間演化關(guān)系圖的構(gòu)建算法。通過(guò)在兩個(gè)典型的科研文獻(xiàn)數(shù)據(jù)集上的實(shí)驗(yàn),分別得到了這兩個(gè)數(shù)據(jù)集上不同主題之間的演化圖。(4)提出了一種非參數(shù)化的兩層結(jié)構(gòu)的主題模型,應(yīng)用于交通視頻數(shù)據(jù)的運(yùn)動(dòng)模式識(shí)別和異常行為檢測(cè)。該兩層結(jié)構(gòu)的非參數(shù)化的主題模型能夠自動(dòng)確定每層的主題數(shù)量,可分別提取出交通視頻中的局部主題(視覺(jué)活動(dòng))和全局主題(交通模式)。提出了一種基于該兩層模型的似然函數(shù)的視頻異常行為檢測(cè)算法,在交通視頻異常行為檢測(cè)中取得了比現(xiàn)有方法更好的結(jié)果。
【學(xué)位授予單位】:浙江大學(xué)
【學(xué)位級(jí)別】:博士
【學(xué)位授予年份】:2017
【分類號(hào)】:TP391.1

【相似文獻(xiàn)】

中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條

1 侯鋒軍,何克清;CWM多維元模型中鍵的定義方法[J];計(jì)算機(jī)工程;2005年06期

2 祝義;AMVC模型的設(shè)計(jì)與應(yīng)用[J];福建電腦;2005年11期

3 胡長(zhǎng)城;;現(xiàn)實(shí)篇:模型與技術(shù)的搏弈[J];軟件世界;2007年14期

4 張朋柱,張梅,韓崇昭,萬(wàn)百五;決策支持過(guò)程控制:問(wèn)題-模型-求解遞階分層法[J];控制與決策;1993年04期

5 龔報(bào)鈞,王樹青;模型層MAS模型的獲取和實(shí)現(xiàn)方法[J];計(jì)算機(jī)工程與應(yīng)用;2001年19期

6 劉威;喬立紅;;基于元模型的統(tǒng)一制造資源模型框架[J];計(jì)算機(jī)集成制造系統(tǒng);2007年10期

7 李靜;;高校圖書館電子資源使用過(guò)程中用戶情境模型的構(gòu)建與應(yīng)用[J];情報(bào)理論與實(shí)踐;2009年02期

8 李海峰,金昊,吳介一;采用XMI標(biāo)準(zhǔn)實(shí)現(xiàn)UML模型到XML的轉(zhuǎn)換[J];制造業(yè)自動(dòng)化;2003年04期

9 柴興無(wú);喬京成;陳蕓生;;對(duì)多媒體數(shù)據(jù)庫(kù)管理系統(tǒng)的層次結(jié)構(gòu)分析[J];計(jì)算機(jī)科學(xué);1995年01期

10 王建光;段富;;一種UML模型到XML模型的轉(zhuǎn)換方法[J];計(jì)算機(jī)技術(shù)與發(fā)展;2007年07期

中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前6條

1 吳晨;宋丹;薛德軍;師慶輝;;科技主題識(shí)別及表示[A];第五屆全國(guó)信息檢索學(xué)術(shù)會(huì)議論文集[C];2009年

2 潘志勇;李紅燕;;一種MVC架構(gòu)中的數(shù)據(jù)組織方法[A];第二十一屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2004年

3 熊方;王曉宇;鄭駿;周傲英;;ITED:一種基于鏈接的主題提取和主題發(fā)現(xiàn)系統(tǒng)[A];第十九屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2002年

4 王玉婷;杜亞軍;涂騰濤;;基于Web鏈接的主題爬行蟲初始URL的研究[A];第四屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集(上)[C];2008年

5 鄭偉;王朝坤;劉璋;王建民;;一種基于隨機(jī)游走模型的多標(biāo)簽分類算法[A];NDBC2010第27屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集A輯一[C];2010年

6 馮少卿;都云程;施水才;;基于模板的網(wǎng)頁(yè)主題信息抽取[A];第三屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2007年

中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條

1 周厚奎;概率主題模型的研究及其在多媒體主題發(fā)現(xiàn)和演化中的應(yīng)用[D];浙江大學(xué);2017年

2 單黎君;圖形化模型的一致性檢查[D];國(guó)防科學(xué)技術(shù)大學(xué);2008年

3 李響爍;PLM開(kāi)發(fā)實(shí)施進(jìn)程與集成產(chǎn)品元模型研究[D];浙江大學(xué);2007年

4 楊肖;基于主題的互聯(lián)網(wǎng)信息抓取研究[D];浙江大學(xué);2014年

5 江濤;特定領(lǐng)域元建模語(yǔ)言的形式化及其模型一致性驗(yàn)證研究[D];云南大學(xué);2010年

6 薛斌黨;嵌入式隱Markov模型和神經(jīng)網(wǎng)絡(luò)人臉識(shí)別[D];大連理工大學(xué);2002年

7 趙一鳴;基于多維尺度分析的潛在主題可視化研究[D];華中師范大學(xué);2013年

8 吳永輝;面向?qū)I(yè)領(lǐng)域的網(wǎng)絡(luò)信息采集及主題檢測(cè)技術(shù)研究與應(yīng)用[D];哈爾濱工業(yè)大學(xué);2010年

9 張楚賢;基于元模型的工程系統(tǒng)仿真建模方法及應(yīng)用研究[D];華中科技大學(xué);2011年

10 鄧凱英;復(fù)雜網(wǎng)絡(luò)搜索策略及相關(guān)模型的數(shù)值方法[D];東北師范大學(xué);2015年

中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條

1 柴葉生;基于MARTE模型的系統(tǒng)性能評(píng)估[D];蘇州大學(xué);2015年

2 李小青;中學(xué)物理課程中光的本質(zhì)模型的學(xué)習(xí)進(jìn)階研究[D];長(zhǎng)江大學(xué);2016年

3 杜彩蘭;基于COX模型的某跨國(guó)企業(yè)人員流失預(yù)測(cè)模型研究[D];大連理工大學(xué);2016年

4 夏劉洋;基于多尺度內(nèi)聚顆粒模型的振動(dòng)擠壓破碎過(guò)程研究[D];江西理工大學(xué);2016年

5 田彬;基于語(yǔ)義元模型的作物模型開(kāi)發(fā)方法與設(shè)計(jì)工具研究[D];南京農(nóng)業(yè)大學(xué);2015年

6 李鑫;飛行員疲勞度評(píng)估模型及應(yīng)用研究[D];大連理工大學(xué);2016年

7 張媛;基于有線電視寬帶網(wǎng)的電子商務(wù)模型中心平臺(tái)模型層的研究與實(shí)現(xiàn)[D];昆明理工大學(xué);2004年

8 田剛;基于元模型的PIM到PSM轉(zhuǎn)換技術(shù)研究[D];山東科技大學(xué);2007年

9 宋亮亮;基于模型的軟件工具鏈的設(shè)計(jì)與實(shí)現(xiàn)[D];汕頭大學(xué);2009年

10 李明宇;UML模型一致性檢測(cè)的研究[D];山東大學(xué);2005年

,

本文編號(hào):1265842

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/shoufeilunwen/xxkjbs/1265842.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶b33ab***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com