天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于相關(guān)性和圖分析理論的主題檢測(cè)研究

發(fā)布時(shí)間:2024-02-29 06:05
  得益于互聯(lián)網(wǎng)技術(shù)的快速發(fā)展,各種社交網(wǎng)站和電子商務(wù)平臺(tái)應(yīng)運(yùn)而生,這些網(wǎng)絡(luò)平臺(tái)作為信息載體已經(jīng)成為人們進(jìn)行信息分享和維護(hù)社會(huì)關(guān)系不可或缺的一部分。這使得在線文本數(shù)量呈現(xiàn)爆炸式增長,如何快速有效地從海量文本信息中檢測(cè)出有價(jià)值的話題及其發(fā)展趨勢(shì)一直是數(shù)據(jù)挖掘領(lǐng)域關(guān)注的熱點(diǎn)話題。主題檢測(cè)和跟蹤作為主題分析的代表性方法,旨在從各種文本語料中檢測(cè)主題及其變化趨勢(shì)。其中主題檢測(cè)作為TDT的一個(gè)子任務(wù),因能高效檢測(cè)話題及發(fā)展趨勢(shì)而成為探索突發(fā)事件、追蹤特定社會(huì)活動(dòng)現(xiàn)象發(fā)展趨勢(shì)的重要工具。一些主題檢測(cè)研究利用主題模型來檢測(cè)主題。其中LDA模型因提供了一種更加自然的方式來進(jìn)行文本表示而被公認(rèn)是一種有效的算法。但其前提是文檔中單詞相互獨(dú)立,沒有考慮詞/術(shù)語的共現(xiàn)問題,阻止了隱含而重要主題的檢測(cè)。有些研究基于共現(xiàn)關(guān)系使用圖分析方法進(jìn)行主題檢測(cè)。把文本數(shù)據(jù)轉(zhuǎn)換成基于詞語間共現(xiàn)關(guān)系的術(shù)語圖,進(jìn)而分割出主題。該方法重點(diǎn)關(guān)注網(wǎng)絡(luò)結(jié)構(gòu)而忽略了節(jié)點(diǎn)屬性,導(dǎo)致生成的主題缺乏意義和語義連貫性。為整合語義關(guān)系和共現(xiàn)關(guān)系,有研究提出一種基于LDA主題模型和圖分析的聯(lián)合理論框架。能更有效地檢測(cè)主題,挖掘出重要且稀有的主題。但該方法...

【文章頁數(shù)】:65 頁

【學(xué)位級(jí)別】:碩士

【文章目錄】:
摘要
ABSTRACT
第一章 緒論
    1.1 研究背景和意義
    1.2 研究現(xiàn)狀
        1.2.1 主題模型的研究現(xiàn)狀
        1.2.2 社區(qū)檢測(cè)的研究現(xiàn)狀
    1.3 本文的研究內(nèi)容和技術(shù)路線
    1.4 本文的組織結(jié)構(gòu)
第二章 相關(guān)概念和理論基礎(chǔ)
    2.1 圖分析理論
    2.2 余弦相似性理論
    2.3 主題模型理論
        2.3.1 LDA主題模型
        2.3.2 CTM主題模型
第三章 主題檢測(cè)基于LDA余弦相似性的圖分析方法
    3.1 LDA-CS-IG模型描述
    3.2 LDA-CS-IG模型生成過程
    3.3 仿真實(shí)驗(yàn)
    3.4 小結(jié)
第四章 主題檢測(cè)基于CTM模型的圖分析方法
    4.1 CTM-CG理論框架描述
    4.2 CTM-CG處理過程和CorrelationGraph算法描述
    4.3 仿真實(shí)驗(yàn)
        4.3.1 CTM-CG模型生成過程
        4.3.2 CTM-CG模型結(jié)果分析
    4.4 小結(jié)
第五章 總結(jié)與展望
    5.1 本文工作總結(jié)
    5.2 未來工作展望
參考文獻(xiàn)
在校期間發(fā)表的論文、科研成果等
致謝



本文編號(hào):3914610

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3914610.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶8337d***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com