基于改進(jìn)LDA主題模型的中日美氫能產(chǎn)業(yè)鏈技術(shù)布局研究
【部分圖文】:
和分類(lèi)號(hào)等關(guān)鍵信息,并保存至本地以備后續(xù)研究使用。3.2數(shù)據(jù)處理3.2.1數(shù)據(jù)預(yù)處理在KNIME平臺(tái)上對(duì)文獻(xiàn)的題目與摘要進(jìn)行分詞、詞性標(biāo)注、提取名詞與去燥處理等步驟,以保證結(jié)果的客觀性和科學(xué)性。其中去噪處理主要包括:提取詞干、限制最小字符(2字符)、去除標(biāo)點(diǎn)與數(shù)字、去除例如描述性質(zhì)詞(如comprise,in-volves)、學(xué)術(shù)詞匯(如advantage,method)以及一些本實(shí)驗(yàn)特有的、出現(xiàn)頻率高但對(duì)結(jié)果沒(méi)有意義的詞語(yǔ)(如hydrogen)等詞。數(shù)據(jù)處理流程如圖3所示。圖3數(shù)據(jù)預(yù)處理流程3.2.2技術(shù)詞語(yǔ)境賦予在為聚類(lèi)詞提供產(chǎn)業(yè)鏈語(yǔ)義時(shí),依據(jù)調(diào)研與專(zhuān)家咨詢的基礎(chǔ)上把氫能產(chǎn)業(yè)鏈分為氫能制備、氫能純化、氫能儲(chǔ)運(yùn)與氫能應(yīng)用,并確定利用IPC大組為所有專(zhuān)利賦予產(chǎn)業(yè)鏈語(yǔ)義,最后劃分出來(lái)的結(jié)果得到氫能領(lǐng)域?qū)<业恼J(rèn)可。在為聚類(lèi)詞提供IPC語(yǔ)義時(shí),選取專(zhuān)利的主IPC小類(lèi)作為聚類(lèi)詞語(yǔ)義情景的限定。同時(shí)為了過(guò)程中的簡(jiǎn)易性以及結(jié)果展示的直觀性,對(duì)數(shù)據(jù)涉及的IPC小類(lèi)與產(chǎn)業(yè)鏈進(jìn)行編碼,部分編碼分布如表1所示。3.2.3WIC-I-LDA主題挖掘本實(shí)驗(yàn)工具利用R語(yǔ)言的lda工具包,參數(shù)具體設(shè)置如下:alpha(docu-ment—topicassociations)=50/K(K為文檔的主題數(shù)),beta(topic—termassociatios)=0.1,迭代次數(shù)為2000次。實(shí)驗(yàn)過(guò)程中,由于主題數(shù)目對(duì)聚類(lèi)結(jié)構(gòu)以及主題解讀上產(chǎn)生影響,需人工調(diào)整,本文依據(jù)專(zhuān)家意見(jiàn)將主題數(shù)目劃分為5~30類(lèi)進(jìn)行概率分析,選取各主題名詞擁有最佳區(qū)分度和相對(duì)較高概率時(shí)的主題數(shù)作為主題個(gè)數(shù)。表1氫能領(lǐng)域IPC小類(lèi)與產(chǎn)業(yè)鏈編碼分布情況(部
續(xù)表2WIC-I-LDA主題模型下氫能領(lǐng)域主題分布主題內(nèi)容Topic19:material03-86gas03-86fuel03-86carbon03-86metal03-86reaction03-86heat03-86compound03-86Topic20:alloy03-140material03-140metal03-140composition03-140magnesi-um03-140titanium03-140method03-140hydride03-140Topic21:water01-146electrode01-146gas01-146electrolysis01-146device01-146oxygen01-146power01-146electrolyte01-146注:主題內(nèi)容欄中每個(gè)WIC-I主題詞的結(jié)構(gòu)為主題詞-產(chǎn)業(yè)鏈編碼—分類(lèi)號(hào)編碼分布3.2.4綜合主題強(qiáng)度計(jì)算本文經(jīng)過(guò)征詢相關(guān)專(zhuān)家意見(jiàn)與討論認(rèn)為:主題下文檔數(shù)量與文本概率兩者相互補(bǔ)充,互為表里,因此賦予α與β的值為0.5。根據(jù)WIC-I-LDA模型提取的文檔-主題概率分布,依據(jù)上文2.2模型介紹計(jì)算綜合主題強(qiáng)度。三國(guó)在各產(chǎn)業(yè)鏈的綜合主題強(qiáng)度如圖4所示,產(chǎn)業(yè)鏈下三國(guó)在各技術(shù)主題的綜合主題強(qiáng)度如圖5所示。為動(dòng)態(tài)比較產(chǎn)業(yè)鏈下三國(guó)在各技術(shù)主題的發(fā)展趨勢(shì),文章計(jì)算了各技術(shù)主題在時(shí)間切片上的綜合主題強(qiáng)度:在時(shí)間切片上,考慮到氫能是新興的能源領(lǐng)域,專(zhuān)利數(shù)據(jù)從2010年多了起來(lái),故將2010年之前申請(qǐng)的專(zhuān)利數(shù)據(jù)作為一個(gè)時(shí)間切片,其他時(shí)間的專(zhuān)利數(shù)據(jù)按照每2年一個(gè)時(shí)間切片(見(jiàn)圖6)。圖4三國(guó)產(chǎn)業(yè)鏈的綜合主題強(qiáng)度圖5產(chǎn)業(yè)鏈下三國(guó)各技術(shù)主題的綜合主題強(qiáng)度圖6產(chǎn)業(yè)鏈下三國(guó)各技術(shù)主題在時(shí)間切片上的綜合主題強(qiáng)度·28·情報(bào)雜志第38卷
續(xù)表2WIC-I-LDA主題模型下氫能領(lǐng)域主題分布主題內(nèi)容Topic19:material03-86gas03-86fuel03-86carbon03-86metal03-86reaction03-86heat03-86compound03-86Topic20:alloy03-140material03-140metal03-140composition03-140magnesi-um03-140titanium03-140method03-140hydride03-140Topic21:water01-146electrode01-146gas01-146electrolysis01-146device01-146oxygen01-146power01-146electrolyte01-146注:主題內(nèi)容欄中每個(gè)WIC-I主題詞的結(jié)構(gòu)為主題詞-產(chǎn)業(yè)鏈編碼—分類(lèi)號(hào)編碼分布3.2.4綜合主題強(qiáng)度計(jì)算本文經(jīng)過(guò)征詢相關(guān)專(zhuān)家意見(jiàn)與討論認(rèn)為:主題下文檔數(shù)量與文本概率兩者相互補(bǔ)充,互為表里,因此賦予α與β的值為0.5。根據(jù)WIC-I-LDA模型提取的文檔-主題概率分布,依據(jù)上文2.2模型介紹計(jì)算綜合主題強(qiáng)度。三國(guó)在各產(chǎn)業(yè)鏈的綜合主題強(qiáng)度如圖4所示,產(chǎn)業(yè)鏈下三國(guó)在各技術(shù)主題的綜合主題強(qiáng)度如圖5所示。為動(dòng)態(tài)比較產(chǎn)業(yè)鏈下三國(guó)在各技術(shù)主題的發(fā)展趨勢(shì),文章計(jì)算了各技術(shù)主題在時(shí)間切片上的綜合主題強(qiáng)度:在時(shí)間切片上,考慮到氫能是新興的能源領(lǐng)域,專(zhuān)利數(shù)據(jù)從2010年多了起來(lái),故將2010年之前申請(qǐng)的專(zhuān)利數(shù)據(jù)作為一個(gè)時(shí)間切片,其他時(shí)間的專(zhuān)利數(shù)據(jù)按照每2年一個(gè)時(shí)間切片(見(jiàn)圖6)。圖4三國(guó)產(chǎn)業(yè)鏈的綜合主題強(qiáng)度圖5產(chǎn)業(yè)鏈下三國(guó)各技術(shù)主題的綜合主題強(qiáng)度圖6產(chǎn)業(yè)鏈下三國(guó)各技術(shù)主題在時(shí)間切片上的綜合主題強(qiáng)度·28·情報(bào)雜志第38卷
【參考文獻(xiàn)】
相關(guān)期刊論文 前3條
1 唐果媛;張薇;;基于共詞分析法的學(xué)科主題演化研究進(jìn)展與分析[J];圖書(shū)情報(bào)工作;2015年05期
2 吳紅;董坤;付秀穎;;中國(guó)燃料電池領(lǐng)域?qū)@閳?bào)對(duì)比分析[J];情報(bào)雜志;2014年07期
3 潘穎;盧章平;;國(guó)內(nèi)氫能源專(zhuān)利技術(shù)發(fā)展戰(zhàn)略研究[J];情報(bào)雜志;2012年06期
【共引文獻(xiàn)】
相關(guān)期刊論文 前3條
1 黃蕾;張鹿;;我國(guó)燃料電池技術(shù)專(zhuān)利有效性研究[J];情報(bào)雜志;2015年04期
2 張春博;沈喜玲;丁堃;;國(guó)內(nèi)可替代能源專(zhuān)利情報(bào)分析——基于技術(shù)主題和專(zhuān)利權(quán)人的雙重視角[J];情報(bào)雜志;2015年01期
3 張東方;;基于TRIZ對(duì)智能手機(jī)交互技術(shù)成熟度的預(yù)測(cè)[J];價(jià)值工程;2014年28期
【二級(jí)參考文獻(xiàn)】
相關(guān)期刊論文 前10條
1 唐果媛;張薇;;國(guó)內(nèi)外共詞分析法研究的發(fā)展與分析[J];圖書(shū)情報(bào)工作;2014年22期
2 蔡治東;虞榮娟;湯際瀾;;知識(shí)圖譜視野下我國(guó)體育志愿服務(wù)研究熱點(diǎn)綜述[J];體育科技;2014年01期
3 馮佳;張?jiān)魄?;國(guó)內(nèi)泌尿生殖器腫瘤領(lǐng)域研究熱點(diǎn)分析[J];醫(yī)學(xué)信息學(xué)雜志;2014年01期
4 姜霖;王子樸;王曉虹;;基于CSSCI的體育人文社會(huì)學(xué)論文關(guān)鍵詞分析[J];西南民族大學(xué)學(xué)報(bào)(人文社會(huì)科學(xué)版);2014年01期
5 徐棣楓;陳瑤;;中國(guó)專(zhuān)利促進(jìn)政策的反思與調(diào)整——目標(biāo)、機(jī)制、階段性和開(kāi)放性問(wèn)題[J];重慶大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版);2013年06期
6 樊霞;吳進(jìn);任暢翔;;基于共詞分析的我國(guó)產(chǎn)學(xué)研研究的發(fā)展態(tài)勢(shì)[J];科研管理;2013年09期
7 馬晨峰;谷祖莎;沈君;;我國(guó)貿(mào)易與環(huán)境問(wèn)題研究的文獻(xiàn)計(jì)量分析——基于聚類(lèi)和戰(zhàn)略坐標(biāo)方法的對(duì)比分析[J];科技管理研究;2013年17期
8 馬海群;姜鑫;;我國(guó)檔案學(xué)研究熱點(diǎn)與前沿演進(jìn)的知識(shí)圖譜分析[J];檔案學(xué)研究;2013年04期
9 侯元元;;三維專(zhuān)利技術(shù)生命周期模型構(gòu)建與實(shí)證研究[J];情報(bào)雜志;2013年03期
10 吳明智;高碩;楊錯(cuò);;基于關(guān)鍵詞詞頻和g指數(shù)的高校圖書(shū)館學(xué)科服務(wù)研究熱點(diǎn)分析[J];醫(yī)學(xué)信息學(xué)雜志;2013年01期
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 時(shí)玉豐;王飛;;各地爭(zhēng)當(dāng)氫能之都:大同、廣州、成都……誰(shuí)將率先走進(jìn)氫的春天?[J];新能源經(jīng)貿(mào)觀察;2019年04期
2 陳梅芬;;加快四川省氫能產(chǎn)業(yè)發(fā)展[J];決策咨詢;2019年03期
3 茹毅;蘇丹;張明宇;黃孟陽(yáng);楊璽;張國(guó)瑩;;云南培育發(fā)展氫能產(chǎn)業(yè)的對(duì)策建議[J];云南科技管理;2019年03期
4 袁華堂;;氫能:21世紀(jì)最重要的能源[J];國(guó)際學(xué)術(shù)動(dòng)態(tài);1998年12期
5 許帆婷;;氫能產(chǎn)業(yè)發(fā)展應(yīng)當(dāng)建立良好生態(tài)——訪國(guó)際氫能協(xié)會(huì)副主席、清華大學(xué)核能與新能源技術(shù)研究院教授毛宗強(qiáng)[J];中國(guó)石化;2019年05期
6 趙旭;楊艷;高慧;;世界主要國(guó)家和能源企業(yè)加快氫能產(chǎn)業(yè)布局[J];中國(guó)石化;2019年05期
7 ;我國(guó)將研究制定氫能產(chǎn)業(yè)發(fā)展路線圖[J];低溫與特氣;2018年05期
8 馬曹冉;;日本政商學(xué)三方合力打造氫能社會(huì)[J];金融世界;2018年07期
9 胡文瑞;;氫能:夢(mèng)想照進(jìn)現(xiàn)實(shí)[J];中國(guó)石油石化;2010年06期
10 毛宗強(qiáng);;東瀛歸來(lái)話氫能——記中國(guó)氫能代表團(tuán)成功訪問(wèn)日本[J];太陽(yáng)能;2009年03期
本文編號(hào):2875508
本文鏈接:http://sikaile.net/jingjilunwen/chanyejingjilunwen/2875508.html