天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

面向文本語義分析應用的話題模型研究

發(fā)布時間:2021-04-30 22:48
  隨著互聯(lián)網(wǎng)技術(shù)的迅猛發(fā)展和快速普及,人們在網(wǎng)絡上的活動日益頻繁,導致互聯(lián)網(wǎng)數(shù)據(jù)爆炸式增長,特別是海量的非結(jié)構(gòu)化文本和無標簽的文本,包括電子郵件,社交媒體,新聞報道和電子商務等。如何有效地分析和處理海量的非結(jié)構(gòu)化文本數(shù)據(jù),迅速、精準地挖掘出有效的語義信息,成為文本智能處理研究領(lǐng)域所面臨的巨大挑戰(zhàn)之一。大量研究工作致力于使用無監(jiān)督學習的方式,比如話題模型,對非結(jié)構(gòu)化文本進行分析。然而,文本信息涉及的各個領(lǐng)域,具有不同的統(tǒng)計特征,同時,文本語義分析涵蓋多種分析應用,各類應用的側(cè)重點和目標也不盡相同。例如在輿情監(jiān)測領(lǐng)域模型需要關(guān)注語義在時間上的演化,在社交媒體上的語義挖掘則著重處理短文本建模,而以用戶作為出發(fā)點的應用如個性化推薦系統(tǒng)更重視基于用戶興趣點的細粒度分析,傳統(tǒng)的話題模型難以滿足各類分析任務,因此,為解決互聯(lián)網(wǎng)海量文本數(shù)據(jù)帶來的各類問題,不同的變種話題模型應運而生。本文在基于話題模型的文本語義分析的基礎上,針對話題動態(tài)演化,短文本話題建模和基于用戶興趣點的有針對性挖掘這三個應用方面進行研究。具體研究內(nèi)容如下:(1)在話題動態(tài)演化方面,本文提出了一種使用深度學習算法進行基于語義連接的話題... 

【文章來源】:合肥工業(yè)大學安徽省 211工程院校 教育部直屬院校

【文章頁數(shù)】:117 頁

【學位級別】:博士

【文章目錄】:
致謝
摘要
abstract
第一章 緒論
    1.1 研究背景
    1.2 本文的主要工作和創(chuàng)新點
    1.3 課題來源與本文組織結(jié)構(gòu)
        1.3.1 課題來源
        1.3.2 本文組織結(jié)構(gòu)
    1.4 本章小結(jié)
第二章 基于話題模型的文本語義分析綜述
    2.1 傳統(tǒng)話題模型
        2.1.1 概率方法
        2.1.2 矩陣分解方法
    2.2 混合話題模型
        2.2.1 動態(tài)話題模型
        2.2.2 多維度話題模型
    2.3 短文本話題模型
        2.3.1 經(jīng)典的短文本話題模型
        2.3.2 基于外部輔助信息的短文本話題模型
    2.4 話題模型的評測標準
        2.4.1 話題可解釋性評測
        2.4.2 話題質(zhì)量評測
第三章 基于語義連接的話題演化框架
    3.1 引言
    3.2 相關(guān)工作
        3.2.1 話題演化
        3.2.2 潛在的狄利克雷分配
        3.2.3 深度學習算法Deep Walk
    3.3 模型描述
        3.3.1 事件與話題
        3.3.2 演化的類型
        3.3.3 語義連接
        3.3.4 話題演化流程框架
    3.4 實驗結(jié)果
        3.4.1 數(shù)據(jù)集
        3.4.2 對比算法
        3.4.3 事件演化和話題演化
        3.4.4 新聞數(shù)據(jù)實驗結(jié)果
        3.4.5 郵件數(shù)據(jù)集的實驗結(jié)果
        3.4.6 Twitter數(shù)據(jù)集的實驗結(jié)果
        3.4.7 對比算法的實驗結(jié)果
    3.5 小結(jié)
第四章 結(jié)合分布式詞嵌入表達的短文本話題模型
    4.1 引言
    4.2 相關(guān)工作
        4.2.1 使用詞嵌入技術(shù)的話題模型
        4.2.2 基于注意力的話題模型
    4.3 基于注意力分割的話題模型
        4.3.1 模型描述和生成過程
        4.3.2 算法
        4.3.3 學習話題嵌入
    4.4 實驗結(jié)果
        4.4.1 數(shù)據(jù)集描述和實驗設置
        4.4.2 話題一致性評估
        4.4.3 短文本分類評估
        4.4.4 片段分割實例展示
        4.4.5 閾值討論
    4.5 小結(jié)
第五章 基于核心詞對的有針對性話題模型
    5.1 引言
    5.2 相關(guān)工作
        5.2.1 有針對性話題模型(Targeted Topic Models)
        5.2.2 Biterm Topic Model
        5.2.3 其他相關(guān)話題模型
    5.3 模型描述
        5.3.1 核心詞對
        5.3.2 模型描述和生成過程
        5.3.3 公式推導
    5.4 實驗結(jié)果
        5.4.1 對比算法與評估標準
        5.4.2 數(shù)據(jù)集與實驗設置
        5.4.3 定量評估
        5.4.4 時效性分析
        5.4.5 定性評估
    5.5 小結(jié)
第六章 結(jié)束語
    6.1 主要研究工作總結(jié)
    6.2 未來工作展望
參考文獻
攻讀博士學位期間的學術(shù)活動及成果情況


【參考文獻】:
期刊論文
[1]一種基于LDA的在線主題演化挖掘模型[J]. 崔凱,周斌,賈焰,梁政.  計算機科學. 2010(11)



本文編號:3169628

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3169628.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶ecb99***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com