基于改進LDA主題模型的中日美氫能產(chǎn)業(yè)鏈技術(shù)布局研究
【部分圖文】:
和分類號等關(guān)鍵信息,并保存至本地以備后續(xù)研究使用。3.2數(shù)據(jù)處理3.2.1數(shù)據(jù)預處理在KNIME平臺上對文獻的題目與摘要進行分詞、詞性標注、提取名詞與去燥處理等步驟,以保證結(jié)果的客觀性和科學性。其中去噪處理主要包括:提取詞干、限制最小字符(2字符)、去除標點與數(shù)字、去除例如描述性質(zhì)詞(如comprise,in-volves)、學術(shù)詞匯(如advantage,method)以及一些本實驗特有的、出現(xiàn)頻率高但對結(jié)果沒有意義的詞語(如hydrogen)等詞。數(shù)據(jù)處理流程如圖3所示。圖3數(shù)據(jù)預處理流程3.2.2技術(shù)詞語境賦予在為聚類詞提供產(chǎn)業(yè)鏈語義時,依據(jù)調(diào)研與專家咨詢的基礎(chǔ)上把氫能產(chǎn)業(yè)鏈分為氫能制備、氫能純化、氫能儲運與氫能應用,并確定利用IPC大組為所有專利賦予產(chǎn)業(yè)鏈語義,最后劃分出來的結(jié)果得到氫能領(lǐng)域?qū)<业恼J可。在為聚類詞提供IPC語義時,選取專利的主IPC小類作為聚類詞語義情景的限定。同時為了過程中的簡易性以及結(jié)果展示的直觀性,對數(shù)據(jù)涉及的IPC小類與產(chǎn)業(yè)鏈進行編碼,部分編碼分布如表1所示。3.2.3WIC-I-LDA主題挖掘本實驗工具利用R語言的lda工具包,參數(shù)具體設(shè)置如下:alpha(docu-ment—topicassociations)=50/K(K為文檔的主題數(shù)),beta(topic—termassociatios)=0.1,迭代次數(shù)為2000次。實驗過程中,由于主題數(shù)目對聚類結(jié)構(gòu)以及主題解讀上產(chǎn)生影響,需人工調(diào)整,本文依據(jù)專家意見將主題數(shù)目劃分為5~30類進行概率分析,選取各主題名詞擁有最佳區(qū)分度和相對較高概率時的主題數(shù)作為主題個數(shù)。表1氫能領(lǐng)域IPC小類與產(chǎn)業(yè)鏈編碼分布情況(部
續(xù)表2WIC-I-LDA主題模型下氫能領(lǐng)域主題分布主題內(nèi)容Topic19:material03-86gas03-86fuel03-86carbon03-86metal03-86reaction03-86heat03-86compound03-86Topic20:alloy03-140material03-140metal03-140composition03-140magnesi-um03-140titanium03-140method03-140hydride03-140Topic21:water01-146electrode01-146gas01-146electrolysis01-146device01-146oxygen01-146power01-146electrolyte01-146注:主題內(nèi)容欄中每個WIC-I主題詞的結(jié)構(gòu)為主題詞-產(chǎn)業(yè)鏈編碼—分類號編碼分布3.2.4綜合主題強度計算本文經(jīng)過征詢相關(guān)專家意見與討論認為:主題下文檔數(shù)量與文本概率兩者相互補充,互為表里,因此賦予α與β的值為0.5。根據(jù)WIC-I-LDA模型提取的文檔-主題概率分布,依據(jù)上文2.2模型介紹計算綜合主題強度。三國在各產(chǎn)業(yè)鏈的綜合主題強度如圖4所示,產(chǎn)業(yè)鏈下三國在各技術(shù)主題的綜合主題強度如圖5所示。為動態(tài)比較產(chǎn)業(yè)鏈下三國在各技術(shù)主題的發(fā)展趨勢,文章計算了各技術(shù)主題在時間切片上的綜合主題強度:在時間切片上,考慮到氫能是新興的能源領(lǐng)域,專利數(shù)據(jù)從2010年多了起來,故將2010年之前申請的專利數(shù)據(jù)作為一個時間切片,其他時間的專利數(shù)據(jù)按照每2年一個時間切片(見圖6)。圖4三國產(chǎn)業(yè)鏈的綜合主題強度圖5產(chǎn)業(yè)鏈下三國各技術(shù)主題的綜合主題強度圖6產(chǎn)業(yè)鏈下三國各技術(shù)主題在時間切片上的綜合主題強度·28·情報雜志第38卷
續(xù)表2WIC-I-LDA主題模型下氫能領(lǐng)域主題分布主題內(nèi)容Topic19:material03-86gas03-86fuel03-86carbon03-86metal03-86reaction03-86heat03-86compound03-86Topic20:alloy03-140material03-140metal03-140composition03-140magnesi-um03-140titanium03-140method03-140hydride03-140Topic21:water01-146electrode01-146gas01-146electrolysis01-146device01-146oxygen01-146power01-146electrolyte01-146注:主題內(nèi)容欄中每個WIC-I主題詞的結(jié)構(gòu)為主題詞-產(chǎn)業(yè)鏈編碼—分類號編碼分布3.2.4綜合主題強度計算本文經(jīng)過征詢相關(guān)專家意見與討論認為:主題下文檔數(shù)量與文本概率兩者相互補充,互為表里,因此賦予α與β的值為0.5。根據(jù)WIC-I-LDA模型提取的文檔-主題概率分布,依據(jù)上文2.2模型介紹計算綜合主題強度。三國在各產(chǎn)業(yè)鏈的綜合主題強度如圖4所示,產(chǎn)業(yè)鏈下三國在各技術(shù)主題的綜合主題強度如圖5所示。為動態(tài)比較產(chǎn)業(yè)鏈下三國在各技術(shù)主題的發(fā)展趨勢,文章計算了各技術(shù)主題在時間切片上的綜合主題強度:在時間切片上,考慮到氫能是新興的能源領(lǐng)域,專利數(shù)據(jù)從2010年多了起來,故將2010年之前申請的專利數(shù)據(jù)作為一個時間切片,其他時間的專利數(shù)據(jù)按照每2年一個時間切片(見圖6)。圖4三國產(chǎn)業(yè)鏈的綜合主題強度圖5產(chǎn)業(yè)鏈下三國各技術(shù)主題的綜合主題強度圖6產(chǎn)業(yè)鏈下三國各技術(shù)主題在時間切片上的綜合主題強度·28·情報雜志第38卷
【參考文獻】
相關(guān)期刊論文 前3條
1 唐果媛;張薇;;基于共詞分析法的學科主題演化研究進展與分析[J];圖書情報工作;2015年05期
2 吳紅;董坤;付秀穎;;中國燃料電池領(lǐng)域?qū)@閳髮Ρ确治鯷J];情報雜志;2014年07期
3 潘穎;盧章平;;國內(nèi)氫能源專利技術(shù)發(fā)展戰(zhàn)略研究[J];情報雜志;2012年06期
【共引文獻】
相關(guān)期刊論文 前3條
1 黃蕾;張鹿;;我國燃料電池技術(shù)專利有效性研究[J];情報雜志;2015年04期
2 張春博;沈喜玲;丁堃;;國內(nèi)可替代能源專利情報分析——基于技術(shù)主題和專利權(quán)人的雙重視角[J];情報雜志;2015年01期
3 張東方;;基于TRIZ對智能手機交互技術(shù)成熟度的預測[J];價值工程;2014年28期
【二級參考文獻】
相關(guān)期刊論文 前10條
1 唐果媛;張薇;;國內(nèi)外共詞分析法研究的發(fā)展與分析[J];圖書情報工作;2014年22期
2 蔡治東;虞榮娟;湯際瀾;;知識圖譜視野下我國體育志愿服務(wù)研究熱點綜述[J];體育科技;2014年01期
3 馮佳;張云秋;;國內(nèi)泌尿生殖器腫瘤領(lǐng)域研究熱點分析[J];醫(yī)學信息學雜志;2014年01期
4 姜霖;王子樸;王曉虹;;基于CSSCI的體育人文社會學論文關(guān)鍵詞分析[J];西南民族大學學報(人文社會科學版);2014年01期
5 徐棣楓;陳瑤;;中國專利促進政策的反思與調(diào)整——目標、機制、階段性和開放性問題[J];重慶大學學報(社會科學版);2013年06期
6 樊霞;吳進;任暢翔;;基于共詞分析的我國產(chǎn)學研研究的發(fā)展態(tài)勢[J];科研管理;2013年09期
7 馬晨峰;谷祖莎;沈君;;我國貿(mào)易與環(huán)境問題研究的文獻計量分析——基于聚類和戰(zhàn)略坐標方法的對比分析[J];科技管理研究;2013年17期
8 馬海群;姜鑫;;我國檔案學研究熱點與前沿演進的知識圖譜分析[J];檔案學研究;2013年04期
9 侯元元;;三維專利技術(shù)生命周期模型構(gòu)建與實證研究[J];情報雜志;2013年03期
10 吳明智;高碩;楊錯;;基于關(guān)鍵詞詞頻和g指數(shù)的高校圖書館學科服務(wù)研究熱點分析[J];醫(yī)學信息學雜志;2013年01期
【相似文獻】
相關(guān)期刊論文 前10條
1 時玉豐;王飛;;各地爭當氫能之都:大同、廣州、成都……誰將率先走進氫的春天?[J];新能源經(jīng)貿(mào)觀察;2019年04期
2 陳梅芬;;加快四川省氫能產(chǎn)業(yè)發(fā)展[J];決策咨詢;2019年03期
3 茹毅;蘇丹;張明宇;黃孟陽;楊璽;張國瑩;;云南培育發(fā)展氫能產(chǎn)業(yè)的對策建議[J];云南科技管理;2019年03期
4 袁華堂;;氫能:21世紀最重要的能源[J];國際學術(shù)動態(tài);1998年12期
5 許帆婷;;氫能產(chǎn)業(yè)發(fā)展應當建立良好生態(tài)——訪國際氫能協(xié)會副主席、清華大學核能與新能源技術(shù)研究院教授毛宗強[J];中國石化;2019年05期
6 趙旭;楊艷;高慧;;世界主要國家和能源企業(yè)加快氫能產(chǎn)業(yè)布局[J];中國石化;2019年05期
7 ;我國將研究制定氫能產(chǎn)業(yè)發(fā)展路線圖[J];低溫與特氣;2018年05期
8 馬曹冉;;日本政商學三方合力打造氫能社會[J];金融世界;2018年07期
9 胡文瑞;;氫能:夢想照進現(xiàn)實[J];中國石油石化;2010年06期
10 毛宗強;;東瀛歸來話氫能——記中國氫能代表團成功訪問日本[J];太陽能;2009年03期
本文編號:2875508
本文鏈接:http://sikaile.net/jingjilunwen/chanyejingjilunwen/2875508.html