基于潛在主題的交叉學(xué)科知識(shí)組合與知識(shí)傳播研究
發(fā)布時(shí)間:2020-12-27 12:39
近現(xiàn)代科學(xué)發(fā)展過(guò)程伴隨著科學(xué)的不斷分化的同時(shí),亦涌現(xiàn)出一些打破學(xué)科界限或研究領(lǐng)域邊界的科學(xué)研究活動(dòng),并逐步發(fā)展成為交叉學(xué)科。交叉學(xué)科研究已成為現(xiàn)代科學(xué)發(fā)展的主要方向之一,屬于科學(xué)的前沿領(lǐng)域。在此背景下,研究交叉學(xué)科知識(shí)創(chuàng)新規(guī)律和運(yùn)行機(jī)制將有助于進(jìn)一步促進(jìn)交叉學(xué)科繁榮發(fā)展。從本質(zhì)來(lái)看,交叉學(xué)科中的知識(shí)創(chuàng)新是相關(guān)基礎(chǔ)學(xué)科知識(shí)輸入、組合、融匯的結(jié)果。對(duì)交叉學(xué)科的知識(shí)組合結(jié)構(gòu)和知識(shí)傳播進(jìn)行研究,能從創(chuàng)新源頭上剖析交叉學(xué)科的運(yùn)行機(jī)制,揭示交叉學(xué)科發(fā)展規(guī)律。鑒于此,本研究將從交叉學(xué)科研究文獻(xiàn)內(nèi)容中識(shí)別出潛在的研究主題,以主題為視角,通過(guò)挖掘主題之間的聯(lián)系,揭示交叉學(xué)科中知識(shí)組合和知識(shí)傳播的結(jié)構(gòu)和規(guī)律,以窺探交叉學(xué)科運(yùn)行規(guī)律。本文研究以主題為切入視角,剖析交叉學(xué)科中的知識(shí)組合和知識(shí)傳播結(jié)構(gòu)。文章首先提出構(gòu)建整合交叉學(xué)科和基礎(chǔ)學(xué)科研究文獻(xiàn)的集成數(shù)據(jù)集,從中識(shí)別出交叉學(xué)科中的潛在主題。接著,文章從兩個(gè)分析路徑剖析主題之間的相互關(guān)系:一是主題之間的共現(xiàn)關(guān)系。文章假設(shè)科學(xué)文獻(xiàn)中的主題共現(xiàn)是一種知識(shí)組合的反映,在此假設(shè)基礎(chǔ)上,通過(guò)構(gòu)建主題共現(xiàn)網(wǎng)絡(luò)研究了交叉學(xué)科中的知識(shí)組合結(jié)構(gòu)以及跨學(xué)科知識(shí)組合模式;二是主題之...
【文章來(lái)源】:華中師范大學(xué)湖北省 211工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:147 頁(yè)
【學(xué)位級(jí)別】:博士
【部分圖文】:
圖2-4.概率潛在語(yǔ)義索引的圖模型??
它能自動(dòng)地發(fā)現(xiàn)文檔集中的潛在主題結(jié)構(gòu)。與潛在語(yǔ)義索引和概率潛在索引類似,??LDA模型的輸入是文檔-詞項(xiàng)矩陣,輸出結(jié)果是主題詞項(xiàng)概率分布和文檔主題概率分布兩種分??布。根據(jù)圖2-5所示的直觀解釋做如下形式化定義:LDA主題模型的基本假設(shè)是文本集中存在??著K個(gè)潛在主題,而單篇文本是這K個(gè)主題的概率分布,即在單篇文本中,主題z具有不同的概??率值P(z|d)。同時(shí),主題z可以表達(dá)為一元語(yǔ)言模型,即詞項(xiàng)的概率分布——詞項(xiàng)w擁有一個(gè)??概率值PUIZ)。LDA模型的概率圖模型進(jìn)行表示見(jiàn)圖2-7。??(!)?,??0—???Nd_???D_??圖2-7丄DA的概率圖表示???在該圖所示的LDA模型中,D代表整個(gè)語(yǔ)料庫(kù)中有D篇文檔,w為詞變量,1^表示文檔c/中??的詞項(xiàng)數(shù)量,z為主題變量,表示標(biāo)示詞w所屬的主題,9為某文檔的主題概率分布,0表示主??題詞項(xiàng)概率分布,它可以表達(dá)為一個(gè)K?XV的矩陣,其中K為預(yù)設(shè)的主題個(gè)數(shù),V為詞項(xiàng)空間中的??詞數(shù)量。a是文檔主題概率分布0的超參數(shù),可以理解為狄利克雷分布的先驗(yàn)參數(shù)。a值越大,??^lei?D?M
論文也擁有了主題&然后在該主題的詞項(xiàng)概率分布0基礎(chǔ)上生成一個(gè)這個(gè)單詞w;重復(fù)以上過(guò)??程直至完成這篇論文的寫(xiě)作。??作者主題模型的這一過(guò)程可以采用概率圖模型表示方法呈現(xiàn),如圖2-8所示。作者主題模型??的概率圖模型與LDA模型的差別是引入了可觀察變量——論文d的所有作者,以及不可觀察變??量——作者x,主題的生成同時(shí)受到作者和作者主題分布影響。而其他部分與LDA模型相似。??〇?G)???—〇—?????Nd]???D_??圖2_8.作者主題模型的概率圖模型??與LDA模型類似,可以釆用整個(gè)文本集的生成過(guò)程琰描述作者主題模型:??①初始化作者主題分布和主題詞項(xiàng)分布;???Rosen-Zvi?M,?Chemudugunta?C,?Griffiths?T,?et?al.?Learning?author-topic?models?from?text?corpora[J].?ACM??Transactions?on?Information?Systems,?2010,?28(1):?1-38.???Rosen-ZviM,?Griffiths?T,?Ste^ers?M,?et?al.?The?author-topic?model?for?authors?and?documents[C]//Proceedings?of?the??20th?conference?on?Uncertainty?in?artificial?intelligence.?AUAI?Press,?2004:?487-494.??30??
【參考文獻(xiàn)】:
期刊論文
[1]不同語(yǔ)料下基于LDA主題模型的科學(xué)文獻(xiàn)主題抽取效果分析[J]. 關(guān)鵬,王曰芬,傅柱. 圖書(shū)情報(bào)工作. 2016(02)
[2]LDA主題模型研究綜述[J]. 祖弦,謝飛. 合肥師范學(xué)院學(xué)報(bào). 2015(06)
[3]基于LDA的科技創(chuàng)新主題語(yǔ)義識(shí)別研究[J]. 祝娜,王效岳,楊京,白如江. 圖書(shū)情報(bào)工作. 2015(14)
[4]一個(gè)跨學(xué)科性測(cè)度指標(biāo):作者專業(yè)度[J]. 和晉飛,房俊民. 情報(bào)理論與實(shí)踐. 2015(05)
[5]中國(guó)圖書(shū)情報(bào)學(xué)跨學(xué)科知識(shí)交流特征研究——基于CCD數(shù)據(jù)庫(kù)的分析[J]. 王旻霞,趙丙軍. 情報(bào)理論與實(shí)踐. 2015(05)
[6]科研人員論文引用動(dòng)機(jī)及相互影響關(guān)系研究[J]. 邱均平,陳曉宇,何文靜. 圖書(shū)情報(bào)工作. 2015(09)
[7]基于引文耦合和概念格的學(xué)科交叉知識(shí)結(jié)構(gòu)探測(cè)[J]. 邵作運(yùn),李秀霞. 圖書(shū)情報(bào)工作. 2015(08)
[8]原始性創(chuàng)新中的創(chuàng)新技法研究[J]. 陳雅蘭,戴順治,鄭琳琳,盧忠鳴,黃锨. 科學(xué)學(xué)研究. 2015(04)
[9]基于SNA的學(xué)科交叉研究主題分析——以情報(bào)學(xué)與計(jì)算機(jī)科學(xué)為例[J]. 李長(zhǎng)玲,郭鳳嬌,支嶺. 情報(bào)科學(xué). 2014(12)
[10]跨學(xué)科行動(dòng)計(jì)劃下的合作演進(jìn)特征測(cè)度——以TREC1為例[J]. 代君,葉艷. 圖書(shū)情報(bào)知識(shí). 2014(06)
碩士論文
[1]基于引文分析法的學(xué)科關(guān)聯(lián)分析[D]. 蔡璐.上海師范大學(xué) 2011
[2]共現(xiàn)分析在文本知識(shí)挖掘中的應(yīng)用研究[D]. 宋爽.南京理工大學(xué) 2006
本文編號(hào):2941750
【文章來(lái)源】:華中師范大學(xué)湖北省 211工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:147 頁(yè)
【學(xué)位級(jí)別】:博士
【部分圖文】:
圖2-4.概率潛在語(yǔ)義索引的圖模型??
它能自動(dòng)地發(fā)現(xiàn)文檔集中的潛在主題結(jié)構(gòu)。與潛在語(yǔ)義索引和概率潛在索引類似,??LDA模型的輸入是文檔-詞項(xiàng)矩陣,輸出結(jié)果是主題詞項(xiàng)概率分布和文檔主題概率分布兩種分??布。根據(jù)圖2-5所示的直觀解釋做如下形式化定義:LDA主題模型的基本假設(shè)是文本集中存在??著K個(gè)潛在主題,而單篇文本是這K個(gè)主題的概率分布,即在單篇文本中,主題z具有不同的概??率值P(z|d)。同時(shí),主題z可以表達(dá)為一元語(yǔ)言模型,即詞項(xiàng)的概率分布——詞項(xiàng)w擁有一個(gè)??概率值PUIZ)。LDA模型的概率圖模型進(jìn)行表示見(jiàn)圖2-7。??(!)?,??0—???Nd_???D_??圖2-7丄DA的概率圖表示???在該圖所示的LDA模型中,D代表整個(gè)語(yǔ)料庫(kù)中有D篇文檔,w為詞變量,1^表示文檔c/中??的詞項(xiàng)數(shù)量,z為主題變量,表示標(biāo)示詞w所屬的主題,9為某文檔的主題概率分布,0表示主??題詞項(xiàng)概率分布,它可以表達(dá)為一個(gè)K?XV的矩陣,其中K為預(yù)設(shè)的主題個(gè)數(shù),V為詞項(xiàng)空間中的??詞數(shù)量。a是文檔主題概率分布0的超參數(shù),可以理解為狄利克雷分布的先驗(yàn)參數(shù)。a值越大,??^lei?D?M
論文也擁有了主題&然后在該主題的詞項(xiàng)概率分布0基礎(chǔ)上生成一個(gè)這個(gè)單詞w;重復(fù)以上過(guò)??程直至完成這篇論文的寫(xiě)作。??作者主題模型的這一過(guò)程可以采用概率圖模型表示方法呈現(xiàn),如圖2-8所示。作者主題模型??的概率圖模型與LDA模型的差別是引入了可觀察變量——論文d的所有作者,以及不可觀察變??量——作者x,主題的生成同時(shí)受到作者和作者主題分布影響。而其他部分與LDA模型相似。??〇?G)???—〇—?????Nd]???D_??圖2_8.作者主題模型的概率圖模型??與LDA模型類似,可以釆用整個(gè)文本集的生成過(guò)程琰描述作者主題模型:??①初始化作者主題分布和主題詞項(xiàng)分布;???Rosen-Zvi?M,?Chemudugunta?C,?Griffiths?T,?et?al.?Learning?author-topic?models?from?text?corpora[J].?ACM??Transactions?on?Information?Systems,?2010,?28(1):?1-38.???Rosen-ZviM,?Griffiths?T,?Ste^ers?M,?et?al.?The?author-topic?model?for?authors?and?documents[C]//Proceedings?of?the??20th?conference?on?Uncertainty?in?artificial?intelligence.?AUAI?Press,?2004:?487-494.??30??
【參考文獻(xiàn)】:
期刊論文
[1]不同語(yǔ)料下基于LDA主題模型的科學(xué)文獻(xiàn)主題抽取效果分析[J]. 關(guān)鵬,王曰芬,傅柱. 圖書(shū)情報(bào)工作. 2016(02)
[2]LDA主題模型研究綜述[J]. 祖弦,謝飛. 合肥師范學(xué)院學(xué)報(bào). 2015(06)
[3]基于LDA的科技創(chuàng)新主題語(yǔ)義識(shí)別研究[J]. 祝娜,王效岳,楊京,白如江. 圖書(shū)情報(bào)工作. 2015(14)
[4]一個(gè)跨學(xué)科性測(cè)度指標(biāo):作者專業(yè)度[J]. 和晉飛,房俊民. 情報(bào)理論與實(shí)踐. 2015(05)
[5]中國(guó)圖書(shū)情報(bào)學(xué)跨學(xué)科知識(shí)交流特征研究——基于CCD數(shù)據(jù)庫(kù)的分析[J]. 王旻霞,趙丙軍. 情報(bào)理論與實(shí)踐. 2015(05)
[6]科研人員論文引用動(dòng)機(jī)及相互影響關(guān)系研究[J]. 邱均平,陳曉宇,何文靜. 圖書(shū)情報(bào)工作. 2015(09)
[7]基于引文耦合和概念格的學(xué)科交叉知識(shí)結(jié)構(gòu)探測(cè)[J]. 邵作運(yùn),李秀霞. 圖書(shū)情報(bào)工作. 2015(08)
[8]原始性創(chuàng)新中的創(chuàng)新技法研究[J]. 陳雅蘭,戴順治,鄭琳琳,盧忠鳴,黃锨. 科學(xué)學(xué)研究. 2015(04)
[9]基于SNA的學(xué)科交叉研究主題分析——以情報(bào)學(xué)與計(jì)算機(jī)科學(xué)為例[J]. 李長(zhǎng)玲,郭鳳嬌,支嶺. 情報(bào)科學(xué). 2014(12)
[10]跨學(xué)科行動(dòng)計(jì)劃下的合作演進(jìn)特征測(cè)度——以TREC1為例[J]. 代君,葉艷. 圖書(shū)情報(bào)知識(shí). 2014(06)
碩士論文
[1]基于引文分析法的學(xué)科關(guān)聯(lián)分析[D]. 蔡璐.上海師范大學(xué) 2011
[2]共現(xiàn)分析在文本知識(shí)挖掘中的應(yīng)用研究[D]. 宋爽.南京理工大學(xué) 2006
本文編號(hào):2941750
本文鏈接:http://sikaile.net/tushudanganlunwen/2941750.html
最近更新
教材專著