基于文本挖掘技術的建筑節(jié)能領域主題網絡模型研究
發(fā)布時間:2022-02-16 17:15
建筑節(jié)能是應對氣候變化和能源緊缺最重要的領域之一,與建筑節(jié)能相關的在線資源和文獻數量呈指數性增長,海量文獻數據為研究者和從業(yè)者及時準確地掌握領域研究主題和發(fā)展趨勢帶來挑戰(zhàn),現有文獻分析研究中以文獻綜述和文獻計量法為主,分析內容和形式存在明顯局限性。因此,通過文本挖掘技術對建筑節(jié)能領域文獻進行系統分析,對促進建筑節(jié)能研究發(fā)展具有重要的理論和實踐價值。本文以web of science數據庫中5712篇建筑節(jié)能相關的文獻為數據對象開展研究。首先,根據建筑能耗和氣候變化之間的關系,將數據劃分為5個階段并分別進行數據清洗和數據結構化,構建建筑節(jié)能領域文獻數據語料庫。其次,對不同階段建筑節(jié)能文獻進行關鍵詞分析和LDA主題模型建模,系統分析建筑節(jié)能的主要研究主題。然后,基于LDA主題模型的不足,利用word2vec詞向量模型優(yōu)化LDA主題模型,完善研究主題的語義關系,并結合社交網絡模型構建主題間關聯,依托Gephi網絡模型可視化平臺,提出一種新的建筑節(jié)能文獻數據主題網絡模型。最后,通過不同階段主題網絡模型結果分析,闡明1973-2018年間建筑節(jié)能領域的研究主題,揭示主題間關聯性及主題演化。經過建...
【文章來源】:深圳大學廣東省
【文章頁數】:112 頁
【學位級別】:碩士
【文章目錄】:
摘要
abstract
第1章 緒論
1.1 研究背景
1.2 研究目標與意義
1.2.1 研究目的
1.2.2 研究意義
1.3 論文框架
第2章 建筑節(jié)能文獻分析與文本挖掘技術研究綜述
2.1 國內外研究現狀
2.1.1 建筑節(jié)能文獻分析
2.1.2 文本挖掘技術發(fā)展研究
2.1.3 LDA主題模型改進研究
2.2 研究問題提煉
2.3 研究內容
2.3.1 建筑節(jié)能文獻數據采集及分析
2.3.2 構建筑節(jié)能主題網絡模型
2.4 技術路線
第3章 研究理論基礎及方法
3.1 LDA(Latent Dirichlet Allocation)主題模型
3.1.1 LDA主題模型理論介紹
3.1.2 LDA主題模型實現步驟
3.1.3 LDA模型可視化
3.2 Word2vec詞向量模型
3.2.1 Word2vec詞向量概念
3.2.2 Word2vec詞向量實現
3.3 社交網絡模型
3.3.1 社區(qū)檢測算法
3.3.2 Gephi可視化平臺
第4章 建筑節(jié)能文獻數據語料庫搭建
4.1 數據采集
4.1.1 數據采集范圍
4.1.2 數據采集來源
4.2 數據預處理
4.2.1 數據清洗
4.2.2 文本數據結構化
4.2.3 數據再清洗
第5章 建筑節(jié)能領域主題網絡模型構建及分析
5.1 研究問題
5.2 基于特征提取的建筑節(jié)能研究熱點
5.2.1 不同階段建筑節(jié)能研究熱點對比
5.2.2 不同階段建筑節(jié)能研究熱點變化趨勢
5.3 基于LDA主題模型的建筑節(jié)能研究主題
5.3.1 構建LDA模型并可視化
5.3.2 不同階段建筑節(jié)能研究主題對比
5.3.3 不同階段建筑節(jié)能研究主題變化趨勢
5.4 建筑節(jié)能領域主題網絡模型構建
5.4.1 基于word2vec的主題模型優(yōu)化
5.4.2 結合社交網絡模型構建主題網絡模型
5.4.3 不同階段建筑節(jié)能主題網絡結果分析
5.4.4 基于主題網絡模型的建筑節(jié)能領域研究主題變化分析
5.5 模型應用
第6章 結論及建議
6.1 結論
6.2 本文創(chuàng)新點
6.3 后續(xù)研究建議
參考文獻
附錄
致謝
攻讀碩士學位期間的研究成果
【參考文獻】:
期刊論文
[1]基于LF-LDA和Word2vec的文本表示模型研究[J]. 陳磊,李俊. 電子技術. 2017(07)
[2]共詞網絡LDA模型的中文文本主題分析:以交通法學文獻(2000-2016)為例[J]. 馬紅,蔡永明. 現代圖書情報技術. 2016(12)
[3]融合Word2vec與TextRank的關鍵詞抽取研究[J]. 寧建飛,劉降珍. 現代圖書情報技術. 2016(06)
[4]國內基于主題模型的科技文獻主題發(fā)現及演化研究進展[J]. 王燕鵬. 圖書情報工作. 2016(03)
[5]基于LDA主題模型的專利內容分析方法[J]. 王博,劉盛博,丁堃,劉則淵. 科研管理. 2015(03)
[6]基于LDA模型的文本聚類研究[J]. 王鵬,高鋮,陳曉美. 情報科學. 2015(01)
[7]基于Gephi的可視分析方法研究與應用[J]. 關迎暉,向勇,陳康. 電信科學. 2013(S1)
[8]基于概率模型的主題識別方法實證研究[J]. 葉春蕾,冷伏海. 情報科學. 2013(02)
[9]詞形還原方法及實現工具比較分析[J]. 吳思竹,錢慶,胡鐵軍,李丹亞,李軍蓮,洪娜. 現代圖書情報技術. 2012(03)
[10]文本挖掘技術在科研信息自動建議中的應用[J]. 李芳,朱群雄. 計算機工程與應用. 2011(10)
碩士論文
[1]時間序列的復雜網絡轉換策略研究[D]. 蘭鑫.西南大學 2015
[2]中文文本挖掘基本理論與應用[D]. 康東.蘇州大學 2014
[3]社會網絡分析在學科熱點分析中的實證研究[D]. 王慧.江蘇大學 2010
本文編號:3628345
【文章來源】:深圳大學廣東省
【文章頁數】:112 頁
【學位級別】:碩士
【文章目錄】:
摘要
abstract
第1章 緒論
1.1 研究背景
1.2 研究目標與意義
1.2.1 研究目的
1.2.2 研究意義
1.3 論文框架
第2章 建筑節(jié)能文獻分析與文本挖掘技術研究綜述
2.1 國內外研究現狀
2.1.1 建筑節(jié)能文獻分析
2.1.2 文本挖掘技術發(fā)展研究
2.1.3 LDA主題模型改進研究
2.2 研究問題提煉
2.3 研究內容
2.3.1 建筑節(jié)能文獻數據采集及分析
2.3.2 構建筑節(jié)能主題網絡模型
2.4 技術路線
第3章 研究理論基礎及方法
3.1 LDA(Latent Dirichlet Allocation)主題模型
3.1.1 LDA主題模型理論介紹
3.1.2 LDA主題模型實現步驟
3.1.3 LDA模型可視化
3.2 Word2vec詞向量模型
3.2.1 Word2vec詞向量概念
3.2.2 Word2vec詞向量實現
3.3 社交網絡模型
3.3.1 社區(qū)檢測算法
3.3.2 Gephi可視化平臺
第4章 建筑節(jié)能文獻數據語料庫搭建
4.1 數據采集
4.1.1 數據采集范圍
4.1.2 數據采集來源
4.2 數據預處理
4.2.1 數據清洗
4.2.2 文本數據結構化
4.2.3 數據再清洗
第5章 建筑節(jié)能領域主題網絡模型構建及分析
5.1 研究問題
5.2 基于特征提取的建筑節(jié)能研究熱點
5.2.1 不同階段建筑節(jié)能研究熱點對比
5.2.2 不同階段建筑節(jié)能研究熱點變化趨勢
5.3 基于LDA主題模型的建筑節(jié)能研究主題
5.3.1 構建LDA模型并可視化
5.3.2 不同階段建筑節(jié)能研究主題對比
5.3.3 不同階段建筑節(jié)能研究主題變化趨勢
5.4 建筑節(jié)能領域主題網絡模型構建
5.4.1 基于word2vec的主題模型優(yōu)化
5.4.2 結合社交網絡模型構建主題網絡模型
5.4.3 不同階段建筑節(jié)能主題網絡結果分析
5.4.4 基于主題網絡模型的建筑節(jié)能領域研究主題變化分析
5.5 模型應用
第6章 結論及建議
6.1 結論
6.2 本文創(chuàng)新點
6.3 后續(xù)研究建議
參考文獻
附錄
致謝
攻讀碩士學位期間的研究成果
【參考文獻】:
期刊論文
[1]基于LF-LDA和Word2vec的文本表示模型研究[J]. 陳磊,李俊. 電子技術. 2017(07)
[2]共詞網絡LDA模型的中文文本主題分析:以交通法學文獻(2000-2016)為例[J]. 馬紅,蔡永明. 現代圖書情報技術. 2016(12)
[3]融合Word2vec與TextRank的關鍵詞抽取研究[J]. 寧建飛,劉降珍. 現代圖書情報技術. 2016(06)
[4]國內基于主題模型的科技文獻主題發(fā)現及演化研究進展[J]. 王燕鵬. 圖書情報工作. 2016(03)
[5]基于LDA主題模型的專利內容分析方法[J]. 王博,劉盛博,丁堃,劉則淵. 科研管理. 2015(03)
[6]基于LDA模型的文本聚類研究[J]. 王鵬,高鋮,陳曉美. 情報科學. 2015(01)
[7]基于Gephi的可視分析方法研究與應用[J]. 關迎暉,向勇,陳康. 電信科學. 2013(S1)
[8]基于概率模型的主題識別方法實證研究[J]. 葉春蕾,冷伏海. 情報科學. 2013(02)
[9]詞形還原方法及實現工具比較分析[J]. 吳思竹,錢慶,胡鐵軍,李丹亞,李軍蓮,洪娜. 現代圖書情報技術. 2012(03)
[10]文本挖掘技術在科研信息自動建議中的應用[J]. 李芳,朱群雄. 計算機工程與應用. 2011(10)
碩士論文
[1]時間序列的復雜網絡轉換策略研究[D]. 蘭鑫.西南大學 2015
[2]中文文本挖掘基本理論與應用[D]. 康東.蘇州大學 2014
[3]社會網絡分析在學科熱點分析中的實證研究[D]. 王慧.江蘇大學 2010
本文編號:3628345
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3628345.html