基于復(fù)雜網(wǎng)絡(luò)的報告文本可視化模型研究
發(fā)布時間:2017-04-24 07:15
本文關(guān)鍵詞:基于復(fù)雜網(wǎng)絡(luò)的報告文本可視化模型研究,由筆耕文化傳播整理發(fā)布。
【摘要】:隨著現(xiàn)代社會信息化的不斷加深,工作和學(xué)習(xí)過程中涌現(xiàn)出大量的文本信息,尤其是包含信息內(nèi)容較為豐富的調(diào)查報告文本,一方面給人們帶來了大量的有用信息,另一方面也給人們在閱讀和掌握大量的信息帶來了挑戰(zhàn)。通過對報告文本建立文本可視化模型,用圖的形式展示報告文本信息,在縮短讀者閱讀時間的同時,還能發(fā)現(xiàn)文本潛在的信息關(guān)聯(lián),促進(jìn)信息的有效利用。 通過對調(diào)查報告文本的內(nèi)容結(jié)構(gòu)進(jìn)行分析,并結(jié)合概念分層理論,完成了實(shí)體類型以及實(shí)體粒度特征的界定;結(jié)合復(fù)雜網(wǎng)絡(luò)理論以及實(shí)體粒度特征,對實(shí)體類內(nèi)部和外部關(guān)系進(jìn)行界定;在自動分詞的前提下,基于詞典和規(guī)則的方法完成實(shí)體的抽。徊⒉捎靡阅J狡ヅ涞年P(guān)系抽取Ontology的關(guān)系抽取模型為主體的混合模型完成實(shí)體關(guān)系的抽取,形成信息實(shí)體關(guān)系矩陣,完成將非結(jié)構(gòu)化的文本信息轉(zhuǎn)化為結(jié)構(gòu)化信息。借鑒Card提出的信息可視化參考模型,依據(jù)不同類型的信息實(shí)體關(guān)系矩陣,構(gòu)建了調(diào)查報告文本的可視化模型,并利用復(fù)雜網(wǎng)絡(luò)中的度分布理論對文本信息進(jìn)行統(tǒng)計(jì)分析。最后,以國土資源大調(diào)查報告為例進(jìn)行實(shí)證分析,對該調(diào)查報告內(nèi)容進(jìn)行不同層次的信息可視化,并對報告文本信息內(nèi)容進(jìn)行統(tǒng)計(jì)分析,挖掘出報告中的關(guān)鍵信息及信息之間的關(guān)聯(lián),,驗(yàn)證了該文本可視化模型的可行性。 本文的研究將復(fù)雜網(wǎng)絡(luò)理論應(yīng)用于報告文本的可視化中,通過分析調(diào)查報告文本特征,建立報告文本可視化模型,最終的可視化結(jié)果不僅能直觀的顯現(xiàn)文本信息,同時還能有效的利用復(fù)雜網(wǎng)絡(luò)的統(tǒng)計(jì)指標(biāo)去挖掘文本中的潛在信息關(guān)聯(lián),在豐富報告文本可視化理論的同時,也使復(fù)雜網(wǎng)絡(luò)在研究文本內(nèi)容和潛在信息關(guān)聯(lián)上有一定的擴(kuò)展。
【關(guān)鍵詞】:調(diào)查報告 信息可視化 復(fù)雜網(wǎng)絡(luò) 信息實(shí)體 實(shí)體關(guān)聯(lián)
【學(xué)位授予單位】:中國地質(zhì)大學(xué)(北京)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2012
【分類號】:C931.6
【目錄】:
- 摘要5-6
- Abstract6-9
- 1 緒論9-19
- 1.1 研究背景、目的與意義9-10
- 1.2 國內(nèi)外研究現(xiàn)狀10-16
- 1.2.1 信息服務(wù)相關(guān)理論10-11
- 1.2.2 復(fù)雜網(wǎng)絡(luò)相關(guān)理論11-13
- 1.2.3 信息抽取相關(guān)理論13-14
- 1.2.4 文本信息可視化相關(guān)理論14-15
- 1.2.5 研究現(xiàn)狀分析15-16
- 1.3 主要研究內(nèi)容16-17
- 1.4 技術(shù)路線17-19
- 2 信息實(shí)體和實(shí)體關(guān)系的界定19-26
- 2.1 文本及報告文本內(nèi)容分析19-20
- 2.2 調(diào)查報告文本的信息實(shí)體20-23
- 2.2.1 信息實(shí)體的概念20
- 2.2.2 信息實(shí)體的特征20-21
- 2.2.3 信息實(shí)體的建立21-23
- 2.3 調(diào)查報告文本的信息實(shí)體關(guān)系23-25
- 2.3.1 信息實(shí)體關(guān)系的定義23-24
- 2.3.2 信息實(shí)體關(guān)系的分類24-25
- 2.4 本章小結(jié)25-26
- 3 信息實(shí)體和實(shí)體關(guān)系的抽取26-31
- 3.1 文本預(yù)處理26
- 3.2 信息實(shí)體的抽取26-28
- 3.2.1 信息實(shí)體抽取概述26-27
- 3.2.2 信息實(shí)體抽取方法27-28
- 3.3 信息實(shí)體關(guān)系的抽取28-30
- 3.3.1 信息實(shí)體關(guān)系抽取概述28-29
- 3.3.2 信息實(shí)體關(guān)系抽取方法29-30
- 3.4 本章小結(jié)30-31
- 4 調(diào)查報告文本可視化模型建立與分析31-38
- 4.1 調(diào)查報告文本可視化概念模型31-34
- 4.1.1 調(diào)查報告文本可視化模型的要素32-33
- 4.1.2 調(diào)查報告文本可視化模型的轉(zhuǎn)換過程33-34
- 4.2 調(diào)查報告文本可視化模型各要素的實(shí)現(xiàn)34-35
- 4.3 調(diào)查報告文本可視化模型結(jié)果分析35-36
- 4.3.1 調(diào)查報告文本的粒度層次分析35-36
- 4.3.2 文本信息統(tǒng)計(jì)分析方法36
- 4.4 本章小結(jié)36-38
- 5 實(shí)證分析38-52
- 5.1 調(diào)查報告文本信息來源38
- 5.2 國土資源大調(diào)查報告實(shí)體和實(shí)體關(guān)系的抽取38-41
- 5.2.1 報告實(shí)體的提取38-41
- 5.2.2 報告實(shí)體關(guān)系的提取41
- 5.3 國土資源大調(diào)查報告可視化結(jié)果與分析41-51
- 5.3.1 總體可視化41-43
- 5.3.2 各實(shí)體類可視化43-46
- 5.3.3 兩兩實(shí)體可視化46-49
- 5.3.4 實(shí)體粒度層次可視化49-51
- 5.4 本章小結(jié)51-52
- 6 結(jié)論與展望52-54
- 6.1 結(jié)論52-53
- 6.2 展望53-54
- 致謝54-55
- 參考文獻(xiàn)55-59
- 附錄59
【引證文獻(xiàn)】
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前1條
1 王凱;新聞文本集可視化模型研究[D];中國地質(zhì)大學(xué)(北京);2013年
本文關(guān)鍵詞:基于復(fù)雜網(wǎng)絡(luò)的報告文本可視化模型研究,由筆耕文化傳播整理發(fā)布。
本文編號:323797
本文鏈接:http://sikaile.net/guanlilunwen/glzh/323797.html
最近更新
教材專著