天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 社科論文 > 圖書檔案論文 >

基于多維尺度分析的潛在主題可視化研究

發(fā)布時間:2021-03-29 16:04
  本文的研究目標是“使用可視化方法表示、挖掘、早現(xiàn)和解釋文本集包含的潛在主題,展示不同層次和觀測水平上的潛在主題、發(fā)現(xiàn)主題之間的關(guān)聯(lián),將潛在主題可視化方法應(yīng)用于特定領(lǐng)域的文本知識發(fā)現(xiàn)”。論證了使用詞條集合表示潛在主題的原理、在轉(zhuǎn)置向量空間中詞的鄰近關(guān)系表示集聚關(guān)系的原理、用多維尺度分析(MDS)將鄰近關(guān)系投影到低維空間的原理,構(gòu)建了使用MDS可視化方法挖掘并展示潛在主題的基本流程。本文認為可以找到一組在文本集中具有集聚關(guān)系的詞條集合來表示潛在主題,將這種集聚關(guān)系抽象出來,就能得到從屬于同一個主題的詞條集合。為了將集聚關(guān)系抽象出來,使用詞條在轉(zhuǎn)置向量空間中的鄰近關(guān)系表示詞條在原始文本集中的集聚特性,有集聚關(guān)系的詞條會在高維轉(zhuǎn)置向量空間中相互鄰近。由于高維空間不具有可以觀測的兒何結(jié)構(gòu),選擇了MDS可視化的方法將詞條在高維空間中的鄰近關(guān)系投影到人們可視的低維MDS空間圖中,使用低維的空間對象結(jié)構(gòu)來映射高維空間中的對象之間的關(guān)系和結(jié)構(gòu)。由于保持了高維空間中的拓撲結(jié)構(gòu),從屬于同一個主題的詞條在低維可視空間中仍然相互鄰近,在MD5空間圖中形成一個個類團,每一個類團就是一個潛在主題。這個方法流程克服了... 

【文章來源】:華中師范大學(xué)湖北省 211工程院校 教育部直屬院校

【文章頁數(shù)】:163 頁

【學(xué)位級別】:博士

【文章目錄】:
中文摘要
Abstract
目錄
圖目錄
表目錄
1 緒論
    1.1 研究背景與意義
    1.2 國內(nèi)外研究現(xiàn)狀
        1.2.1 基于文本單元聚類的主題發(fā)現(xiàn)
        1.2.2 基于共詞分析的主題發(fā)現(xiàn)
        1.2.3 基于數(shù)據(jù)庫內(nèi)容結(jié)構(gòu)分析的主題發(fā)現(xiàn)
        1.2.4 基于概率主題模型的潛在主題發(fā)現(xiàn)
        1.2.5 小結(jié)與評述
    1.3 研究目的與研究問題
    1.4 研究方法與技術(shù)路線
        1.4.1 研究方法
        1.4.2 技術(shù)路線
    1.5 特色與創(chuàng)新點
    1.6 論文的組織結(jié)構(gòu)
2 文本主題發(fā)現(xiàn)的理論基礎(chǔ)
    2.1 文本挖掘
        2.1.1 文本挖掘概述
        2.1.2 文本的向量空間表示
        2.1.3 文本特征選擇與提取
    2.2 知識發(fā)現(xiàn)
        2.2.1 知識發(fā)現(xiàn)概述
        2.2.2 聚類知識發(fā)現(xiàn)
3 潛在主題可視化的基本原理和流程
    3.1 詞匯集聚與潛在主題的表示
        3.1.1 基于文本單元集聚的主題發(fā)現(xiàn)
        3.1.2 詞匯集聚與潛在主題的發(fā)現(xiàn)和表示
        3.1.3 潛在主題的定義
        3.1.4 潛在主題與相關(guān)概念辨析
    3.2 MDS可視化與潛在主題的挖掘和展示
        3.2.1 MDS用于潛在主題可視化的可行性
        3.2.2 MDS用于潛在主題可視化的優(yōu)勢
    3.3 潛在主題可視化的基本流程
        3.3.1 潛在主題可視化的總體思路
        3.3.2 文本分詞和預(yù)處理
        3.3.3 詞條在轉(zhuǎn)置向量空間中的表示
        3.3.4 鄰近關(guān)系的計算與提取
        3.3.5 MDS降維和投影
        3.3.6 潛在主題的表示
        3.3.7 潛在主題可視化的效果評價
    3.4 小結(jié)與討論
4 潛在主題可視化的方法
    4.1 扎根理論與潛在主題可視化的融合
        4.1.1 潛在主題可視化中的難點
        4.1.2 扎根理論概述
        4.1.3 開放式編碼技術(shù)的引入
        4.1.4 扎根性思想的啟示
        4.1.5 融入扎根思想和方法的可行性
        4.1.6 扎根理論的融入與潛在主題可視化的流程再造
        4.1.7 潛在主題可視化對扎根理論的流程再造
    4.2 潛在主題可視化中的情景模型
        4.2.1 潛在主題及其詞條的情景依賴特性
        4.2.2 潛在主題可視化中的情景模型
        4.2.3 情景模型的啟示
    4.3 潛在主題可視化的方法設(shè)計
        4.3.1 鄰近矩陣的定義及其在潛在主題可視化中的分析方法
        4.3.2 質(zhì)心鄰近矩陣的定義及其在潛在主題可視化中的分析方法
        4.3.3 屬性疊加鄰近矩陣的定義及其在潛在主題可視化中的分析方法
        4.3.4 潛在主題可視化的流程優(yōu)化
        4.3.5 潛在主題可視化方法在不同性質(zhì)文本集中的應(yīng)用策略
    4.4 小結(jié)與討論
5 潛在主題可視化在上市公司風險識別中的應(yīng)用
    5.1 引言
        5.1.1 研究目的
        5.1.2 研究意義
        5.1.3 上市公司知識發(fā)現(xiàn)的研究現(xiàn)狀
    5.2 數(shù)據(jù)來源與處理
        5.2.1 數(shù)據(jù)來源
        5.2.2 章節(jié)標題的開放式編碼
        5.2.3 編碼后數(shù)據(jù)的特征分析
        5.2.4 文本分詞和預(yù)處理
        5.2.5 特征選擇與提取
        5.2.6 構(gòu)造輸入矩陣
    5.3 基于鄰近矩陣的潛在主題可視化
    5.4 基于質(zhì)心鄰近矩陣的潛在主題可視化
    5.5 基于屬性疊加鄰近矩陣的潛在主題可視化
    5.6 結(jié)果評價
    5.7 小結(jié)與討論
6 總結(jié)與展望
    6.1 本文的主要工作
    6.2 研究的不足和局限性
    6.3 下一步的工作
參考文獻
附錄
研究成果
致謝


【參考文獻】:
期刊論文
[1]基于文獻的語義資源庫建設(shè)及其在NSTL中的應(yīng)用[J]. 張鏵予,李廣建.  圖書情報工作. 2012(09)
[2]基于電子政務(wù)平臺查詢關(guān)鍵詞共現(xiàn)多維可視化聚類分析研究[J]. 夏立新,程秀峰,桂思思.  情報學(xué)報. 2012 (04)
[3]知識管理學(xué)科體系研究(下)——聚類分析和多維尺度分析[J]. 儲節(jié)旺,閆士濤.  情報理論與實踐. 2012(03)
[4]客觀知識體系中語義關(guān)系的分析分類研究[J]. 裘江南,張彬.  情報學(xué)報. 2012 (03)
[5]基于跨語言廣義向量空間模型的跨語言文檔聚類方法[J]. 唐國瑜,夏云慶,張民,鄭方.  中文信息學(xué)報. 2012(02)
[6]知識管理學(xué)科體系研究(上)——因子分析[J]. 儲節(jié)旺,閆士濤.  情報理論與實踐. 2012(02)
[7]基于詞共現(xiàn)的社會化標簽研究熱點可視化分析[J]. 盧小賓,孟璽,張進.  情報學(xué)報. 2012 (02)
[8]共現(xiàn)聚類分析的新方法:最大頻繁項集挖掘[J]. 徐碩,喬曉東,朱禮軍,張運良,薛春香.  情報學(xué)報. 2012 (02)
[9]科技文獻全文主題識別方法實證研究[J]. 葉春蕾,冷伏海.  現(xiàn)代圖書情報技術(shù). 2012(01)
[10]國內(nèi)外共詞分析研究綜述[J]. 李穎,賈二鵬,馬力.  新世紀圖書館. 2012(01)

博士論文
[1]基于軟件人的情境主題分析及應(yīng)用研究[D]. 周亦鵬.北京科技大學(xué) 2012
[2]主題模型及其在中醫(yī)臨床診療中的應(yīng)用研究[D]. 張小平.北京交通大學(xué) 2011
[3]基于潛在語義分析的社會化標注系統(tǒng)標簽語義檢索研究[D]. 宣云干.南京大學(xué) 2011
[4]大規(guī)模文檔聚類中若干關(guān)鍵問題的研究[D]. 劉銘.哈爾濱工業(yè)大學(xué) 2010
[5]基于自組織映射的期刊主題研究[D]. 安璐.武漢大學(xué) 2009
[6]文本分割關(guān)鍵技術(shù)及其在多文檔摘要中的應(yīng)用研究[D]. 葉娜.東北大學(xué) 2008
[7]多文檔自動文摘關(guān)鍵技術(shù)研究[D]. 徐永東.哈爾濱工業(yè)大學(xué) 2007
[8]文本聚類分析若干問題研究[D]. 高茂庭.天津大學(xué) 2007
[9]基于潛在語義分析的中文概念檢索研究[D]. 劉云峰.華中科技大學(xué) 2005

碩士論文
[1]概率主題模型及其在關(guān)聯(lián)文本分類中的應(yīng)用研究[D]. 梁鵬鵬.鄭州大學(xué) 2011
[2]概率主題模型在文本分類中的應(yīng)用研究[D]. 林洋港.中國科學(xué)技術(shù)大學(xué) 2009
[3]基于語義相似度的文本聚類算法的研究[D]. 孫爽.南京航空航天大學(xué) 2007



本文編號:3107805

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/tushudanganlunwen/3107805.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶23899***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com