基于文本挖掘技術(shù)的建筑節(jié)能領(lǐng)域主題網(wǎng)絡(luò)模型研究
發(fā)布時(shí)間:2022-02-16 17:15
建筑節(jié)能是應(yīng)對(duì)氣候變化和能源緊缺最重要的領(lǐng)域之一,與建筑節(jié)能相關(guān)的在線資源和文獻(xiàn)數(shù)量呈指數(shù)性增長(zhǎng),海量文獻(xiàn)數(shù)據(jù)為研究者和從業(yè)者及時(shí)準(zhǔn)確地掌握領(lǐng)域研究主題和發(fā)展趨勢(shì)帶來(lái)挑戰(zhàn),現(xiàn)有文獻(xiàn)分析研究中以文獻(xiàn)綜述和文獻(xiàn)計(jì)量法為主,分析內(nèi)容和形式存在明顯局限性。因此,通過(guò)文本挖掘技術(shù)對(duì)建筑節(jié)能領(lǐng)域文獻(xiàn)進(jìn)行系統(tǒng)分析,對(duì)促進(jìn)建筑節(jié)能研究發(fā)展具有重要的理論和實(shí)踐價(jià)值。本文以web of science數(shù)據(jù)庫(kù)中5712篇建筑節(jié)能相關(guān)的文獻(xiàn)為數(shù)據(jù)對(duì)象開(kāi)展研究。首先,根據(jù)建筑能耗和氣候變化之間的關(guān)系,將數(shù)據(jù)劃分為5個(gè)階段并分別進(jìn)行數(shù)據(jù)清洗和數(shù)據(jù)結(jié)構(gòu)化,構(gòu)建建筑節(jié)能領(lǐng)域文獻(xiàn)數(shù)據(jù)語(yǔ)料庫(kù)。其次,對(duì)不同階段建筑節(jié)能文獻(xiàn)進(jìn)行關(guān)鍵詞分析和LDA主題模型建模,系統(tǒng)分析建筑節(jié)能的主要研究主題。然后,基于LDA主題模型的不足,利用word2vec詞向量模型優(yōu)化LDA主題模型,完善研究主題的語(yǔ)義關(guān)系,并結(jié)合社交網(wǎng)絡(luò)模型構(gòu)建主題間關(guān)聯(lián),依托Gephi網(wǎng)絡(luò)模型可視化平臺(tái),提出一種新的建筑節(jié)能文獻(xiàn)數(shù)據(jù)主題網(wǎng)絡(luò)模型。最后,通過(guò)不同階段主題網(wǎng)絡(luò)模型結(jié)果分析,闡明1973-2018年間建筑節(jié)能領(lǐng)域的研究主題,揭示主題間關(guān)聯(lián)性及主題演化。經(jīng)過(guò)建...
【文章來(lái)源】:深圳大學(xué)廣東省
【文章頁(yè)數(shù)】:112 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
abstract
第1章 緒論
1.1 研究背景
1.2 研究目標(biāo)與意義
1.2.1 研究目的
1.2.2 研究意義
1.3 論文框架
第2章 建筑節(jié)能文獻(xiàn)分析與文本挖掘技術(shù)研究綜述
2.1 國(guó)內(nèi)外研究現(xiàn)狀
2.1.1 建筑節(jié)能文獻(xiàn)分析
2.1.2 文本挖掘技術(shù)發(fā)展研究
2.1.3 LDA主題模型改進(jìn)研究
2.2 研究問(wèn)題提煉
2.3 研究?jī)?nèi)容
2.3.1 建筑節(jié)能文獻(xiàn)數(shù)據(jù)采集及分析
2.3.2 構(gòu)建筑節(jié)能主題網(wǎng)絡(luò)模型
2.4 技術(shù)路線
第3章 研究理論基礎(chǔ)及方法
3.1 LDA(Latent Dirichlet Allocation)主題模型
3.1.1 LDA主題模型理論介紹
3.1.2 LDA主題模型實(shí)現(xiàn)步驟
3.1.3 LDA模型可視化
3.2 Word2vec詞向量模型
3.2.1 Word2vec詞向量概念
3.2.2 Word2vec詞向量實(shí)現(xiàn)
3.3 社交網(wǎng)絡(luò)模型
3.3.1 社區(qū)檢測(cè)算法
3.3.2 Gephi可視化平臺(tái)
第4章 建筑節(jié)能文獻(xiàn)數(shù)據(jù)語(yǔ)料庫(kù)搭建
4.1 數(shù)據(jù)采集
4.1.1 數(shù)據(jù)采集范圍
4.1.2 數(shù)據(jù)采集來(lái)源
4.2 數(shù)據(jù)預(yù)處理
4.2.1 數(shù)據(jù)清洗
4.2.2 文本數(shù)據(jù)結(jié)構(gòu)化
4.2.3 數(shù)據(jù)再清洗
第5章 建筑節(jié)能領(lǐng)域主題網(wǎng)絡(luò)模型構(gòu)建及分析
5.1 研究問(wèn)題
5.2 基于特征提取的建筑節(jié)能研究熱點(diǎn)
5.2.1 不同階段建筑節(jié)能研究熱點(diǎn)對(duì)比
5.2.2 不同階段建筑節(jié)能研究熱點(diǎn)變化趨勢(shì)
5.3 基于LDA主題模型的建筑節(jié)能研究主題
5.3.1 構(gòu)建LDA模型并可視化
5.3.2 不同階段建筑節(jié)能研究主題對(duì)比
5.3.3 不同階段建筑節(jié)能研究主題變化趨勢(shì)
5.4 建筑節(jié)能領(lǐng)域主題網(wǎng)絡(luò)模型構(gòu)建
5.4.1 基于word2vec的主題模型優(yōu)化
5.4.2 結(jié)合社交網(wǎng)絡(luò)模型構(gòu)建主題網(wǎng)絡(luò)模型
5.4.3 不同階段建筑節(jié)能主題網(wǎng)絡(luò)結(jié)果分析
5.4.4 基于主題網(wǎng)絡(luò)模型的建筑節(jié)能領(lǐng)域研究主題變化分析
5.5 模型應(yīng)用
第6章 結(jié)論及建議
6.1 結(jié)論
6.2 本文創(chuàng)新點(diǎn)
6.3 后續(xù)研究建議
參考文獻(xiàn)
附錄
致謝
攻讀碩士學(xué)位期間的研究成果
【參考文獻(xiàn)】:
期刊論文
[1]基于LF-LDA和Word2vec的文本表示模型研究[J]. 陳磊,李俊. 電子技術(shù). 2017(07)
[2]共詞網(wǎng)絡(luò)LDA模型的中文文本主題分析:以交通法學(xué)文獻(xiàn)(2000-2016)為例[J]. 馬紅,蔡永明. 現(xiàn)代圖書情報(bào)技術(shù). 2016(12)
[3]融合Word2vec與TextRank的關(guān)鍵詞抽取研究[J]. 寧建飛,劉降珍. 現(xiàn)代圖書情報(bào)技術(shù). 2016(06)
[4]國(guó)內(nèi)基于主題模型的科技文獻(xiàn)主題發(fā)現(xiàn)及演化研究進(jìn)展[J]. 王燕鵬. 圖書情報(bào)工作. 2016(03)
[5]基于LDA主題模型的專利內(nèi)容分析方法[J]. 王博,劉盛博,丁堃,劉則淵. 科研管理. 2015(03)
[6]基于LDA模型的文本聚類研究[J]. 王鵬,高鋮,陳曉美. 情報(bào)科學(xué). 2015(01)
[7]基于Gephi的可視分析方法研究與應(yīng)用[J]. 關(guān)迎暉,向勇,陳康. 電信科學(xué). 2013(S1)
[8]基于概率模型的主題識(shí)別方法實(shí)證研究[J]. 葉春蕾,冷伏海. 情報(bào)科學(xué). 2013(02)
[9]詞形還原方法及實(shí)現(xiàn)工具比較分析[J]. 吳思竹,錢慶,胡鐵軍,李丹亞,李軍蓮,洪娜. 現(xiàn)代圖書情報(bào)技術(shù). 2012(03)
[10]文本挖掘技術(shù)在科研信息自動(dòng)建議中的應(yīng)用[J]. 李芳,朱群雄. 計(jì)算機(jī)工程與應(yīng)用. 2011(10)
碩士論文
[1]時(shí)間序列的復(fù)雜網(wǎng)絡(luò)轉(zhuǎn)換策略研究[D]. 蘭鑫.西南大學(xué) 2015
[2]中文文本挖掘基本理論與應(yīng)用[D]. 康東.蘇州大學(xué) 2014
[3]社會(huì)網(wǎng)絡(luò)分析在學(xué)科熱點(diǎn)分析中的實(shí)證研究[D]. 王慧.江蘇大學(xué) 2010
本文編號(hào):3628345
【文章來(lái)源】:深圳大學(xué)廣東省
【文章頁(yè)數(shù)】:112 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
abstract
第1章 緒論
1.1 研究背景
1.2 研究目標(biāo)與意義
1.2.1 研究目的
1.2.2 研究意義
1.3 論文框架
第2章 建筑節(jié)能文獻(xiàn)分析與文本挖掘技術(shù)研究綜述
2.1 國(guó)內(nèi)外研究現(xiàn)狀
2.1.1 建筑節(jié)能文獻(xiàn)分析
2.1.2 文本挖掘技術(shù)發(fā)展研究
2.1.3 LDA主題模型改進(jìn)研究
2.2 研究問(wèn)題提煉
2.3 研究?jī)?nèi)容
2.3.1 建筑節(jié)能文獻(xiàn)數(shù)據(jù)采集及分析
2.3.2 構(gòu)建筑節(jié)能主題網(wǎng)絡(luò)模型
2.4 技術(shù)路線
第3章 研究理論基礎(chǔ)及方法
3.1 LDA(Latent Dirichlet Allocation)主題模型
3.1.1 LDA主題模型理論介紹
3.1.2 LDA主題模型實(shí)現(xiàn)步驟
3.1.3 LDA模型可視化
3.2 Word2vec詞向量模型
3.2.1 Word2vec詞向量概念
3.2.2 Word2vec詞向量實(shí)現(xiàn)
3.3 社交網(wǎng)絡(luò)模型
3.3.1 社區(qū)檢測(cè)算法
3.3.2 Gephi可視化平臺(tái)
第4章 建筑節(jié)能文獻(xiàn)數(shù)據(jù)語(yǔ)料庫(kù)搭建
4.1 數(shù)據(jù)采集
4.1.1 數(shù)據(jù)采集范圍
4.1.2 數(shù)據(jù)采集來(lái)源
4.2 數(shù)據(jù)預(yù)處理
4.2.1 數(shù)據(jù)清洗
4.2.2 文本數(shù)據(jù)結(jié)構(gòu)化
4.2.3 數(shù)據(jù)再清洗
第5章 建筑節(jié)能領(lǐng)域主題網(wǎng)絡(luò)模型構(gòu)建及分析
5.1 研究問(wèn)題
5.2 基于特征提取的建筑節(jié)能研究熱點(diǎn)
5.2.1 不同階段建筑節(jié)能研究熱點(diǎn)對(duì)比
5.2.2 不同階段建筑節(jié)能研究熱點(diǎn)變化趨勢(shì)
5.3 基于LDA主題模型的建筑節(jié)能研究主題
5.3.1 構(gòu)建LDA模型并可視化
5.3.2 不同階段建筑節(jié)能研究主題對(duì)比
5.3.3 不同階段建筑節(jié)能研究主題變化趨勢(shì)
5.4 建筑節(jié)能領(lǐng)域主題網(wǎng)絡(luò)模型構(gòu)建
5.4.1 基于word2vec的主題模型優(yōu)化
5.4.2 結(jié)合社交網(wǎng)絡(luò)模型構(gòu)建主題網(wǎng)絡(luò)模型
5.4.3 不同階段建筑節(jié)能主題網(wǎng)絡(luò)結(jié)果分析
5.4.4 基于主題網(wǎng)絡(luò)模型的建筑節(jié)能領(lǐng)域研究主題變化分析
5.5 模型應(yīng)用
第6章 結(jié)論及建議
6.1 結(jié)論
6.2 本文創(chuàng)新點(diǎn)
6.3 后續(xù)研究建議
參考文獻(xiàn)
附錄
致謝
攻讀碩士學(xué)位期間的研究成果
【參考文獻(xiàn)】:
期刊論文
[1]基于LF-LDA和Word2vec的文本表示模型研究[J]. 陳磊,李俊. 電子技術(shù). 2017(07)
[2]共詞網(wǎng)絡(luò)LDA模型的中文文本主題分析:以交通法學(xué)文獻(xiàn)(2000-2016)為例[J]. 馬紅,蔡永明. 現(xiàn)代圖書情報(bào)技術(shù). 2016(12)
[3]融合Word2vec與TextRank的關(guān)鍵詞抽取研究[J]. 寧建飛,劉降珍. 現(xiàn)代圖書情報(bào)技術(shù). 2016(06)
[4]國(guó)內(nèi)基于主題模型的科技文獻(xiàn)主題發(fā)現(xiàn)及演化研究進(jìn)展[J]. 王燕鵬. 圖書情報(bào)工作. 2016(03)
[5]基于LDA主題模型的專利內(nèi)容分析方法[J]. 王博,劉盛博,丁堃,劉則淵. 科研管理. 2015(03)
[6]基于LDA模型的文本聚類研究[J]. 王鵬,高鋮,陳曉美. 情報(bào)科學(xué). 2015(01)
[7]基于Gephi的可視分析方法研究與應(yīng)用[J]. 關(guān)迎暉,向勇,陳康. 電信科學(xué). 2013(S1)
[8]基于概率模型的主題識(shí)別方法實(shí)證研究[J]. 葉春蕾,冷伏海. 情報(bào)科學(xué). 2013(02)
[9]詞形還原方法及實(shí)現(xiàn)工具比較分析[J]. 吳思竹,錢慶,胡鐵軍,李丹亞,李軍蓮,洪娜. 現(xiàn)代圖書情報(bào)技術(shù). 2012(03)
[10]文本挖掘技術(shù)在科研信息自動(dòng)建議中的應(yīng)用[J]. 李芳,朱群雄. 計(jì)算機(jī)工程與應(yīng)用. 2011(10)
碩士論文
[1]時(shí)間序列的復(fù)雜網(wǎng)絡(luò)轉(zhuǎn)換策略研究[D]. 蘭鑫.西南大學(xué) 2015
[2]中文文本挖掘基本理論與應(yīng)用[D]. 康東.蘇州大學(xué) 2014
[3]社會(huì)網(wǎng)絡(luò)分析在學(xué)科熱點(diǎn)分析中的實(shí)證研究[D]. 王慧.江蘇大學(xué) 2010
本文編號(hào):3628345
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3628345.html
最近更新
教材專著