基于LDA模型的圖書(shū)情報(bào)學(xué)向計(jì)算機(jī)科學(xué)知識(shí)流動(dòng)分析
【學(xué)位授予單位】:曲阜師范大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2019
【分類號(hào)】:G353.1
【圖文】:
圖 2-1 LD 模型概率公式圖 2-1 為 LDA 模型概率公式圖,“主題-詞語(yǔ)”矩陣代表每個(gè)主題中每個(gè)詞語(yǔ)出現(xiàn)“文檔-主題”矩陣代表每個(gè)文檔中的每個(gè)主題出現(xiàn)的概率!拔臋n-詞語(yǔ)”矩陣代表中每個(gè)詞語(yǔ)出現(xiàn)的概率。通過(guò)對(duì)大量文檔進(jìn)行分詞工作,計(jì)算出每個(gè)詞語(yǔ)出現(xiàn)在中的概率,如圖中左側(cè)文檔-詞語(yǔ)矩陣。LDA 模型作為無(wú)監(jiān)督的學(xué)習(xí)模型,可以訓(xùn)練,獲得例如圖中右側(cè)主題-詞語(yǔ)和文檔-主題矩陣;谏鲜鰞蓚(gè)矩陣,可以下一步研究。D.M.Blei 使用的是 Mean Field Variational 推理算法,將主題-文檔分布θ作為多維在隨機(jī)變量,引入超參數(shù)α來(lái)生成參數(shù),但只對(duì)文檔-主題的混合參數(shù)加上了 Di,沒(méi)有對(duì)主題-詞語(yǔ)概率分布進(jìn)行先驗(yàn)假設(shè)。T.L.Giffiths 則在文獻(xiàn)中對(duì)主題-詞語(yǔ)上加上先驗(yàn),基于多項(xiàng)式分布和 Dirichlet 分布共軛特性,提出了 Gibbs 算法,并數(shù) β 來(lái)生成參數(shù),該模型原理見(jiàn)圖 2-2。
圖 2-2 LD 模型原理2 中,箭頭代表依賴關(guān)系,矩形方框代表矩形方框內(nèi)的內(nèi)容進(jìn)隱含參數(shù)和變量,實(shí)心節(jié)點(diǎn)表示可被觀測(cè)值,由θ表示文檔的主詞分布的參數(shù)集合,每行代表某個(gè)主題的詞項(xiàng)概率,α則表示檔個(gè)數(shù),K 表示主題數(shù)量;W 是關(guān)鍵詞,W 的主題序號(hào)是 接計(jì)算出θ和φ,通常情況下需要借助最大似然估計(jì)來(lái)完成參數(shù)aritionalinference 算法、EM 算法、Gibbs 算法,Gibbs 因其較而得到廣泛的應(yīng)用。型的文檔生成結(jié)果如表 2-1 所示。表 2-1 LDA 模型文檔生成結(jié)果X.others保存與 LDA 模型相關(guān)參數(shù)X.phi保存詞在主題下的概率分布矩陣
圖 2-3 確定最優(yōu)主題數(shù)目方法常用的 3 種方法來(lái)獲取最優(yōu)主題數(shù)目都存在一定的不足,本文選取開(kāi)源軟件不同主題數(shù)目下困惑度 (Perplexity) 的變化,來(lái)確定主題數(shù)目。開(kāi)源軟件 R軟件 R 誕生于 1980 年左右,其統(tǒng)計(jì)分析和繪圖功能都非常強(qiáng)大,具有很多值點(diǎn):首先,它的開(kāi)發(fā)周期較短,在 CRAN 庫(kù)里包含有大量的函數(shù)包;其次,它
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 錢思晨;肖龍翔;岑炅蓮;;我國(guó)圖書(shū)情報(bào)學(xué)數(shù)據(jù)素養(yǎng)教育內(nèi)容及框架研究[J];圖書(shū)館研究;2019年03期
2 孟巍;;大數(shù)據(jù)驅(qū)動(dòng)下的圖書(shū)情報(bào)學(xué)科熱點(diǎn)領(lǐng)域挖掘[J];農(nóng)業(yè)圖書(shū)情報(bào)學(xué)刊;2018年07期
3 劉波;;知識(shí)管理與圖書(shū)情報(bào)學(xué)的變革[J];傳媒論壇;2018年09期
4 姚川軍;;大數(shù)據(jù)背景下圖書(shū)情報(bào)學(xué)科人才培養(yǎng)模式研究[J];山東工業(yè)技術(shù);2017年02期
5 ;歡迎訂閱2018年度《農(nóng)業(yè)圖書(shū)情報(bào)學(xué)刊》[J];農(nóng)業(yè)展望;2017年06期
6 劉忠寶;趙文娟;賈君枝;;深度學(xué)習(xí)及其對(duì)圖書(shū)情報(bào)學(xué)的啟示[J];情報(bào)工程;2017年04期
7 ;陜西省圖書(shū)館學(xué)會(huì)第十次圖書(shū)情報(bào)學(xué)學(xué)術(shù)成果評(píng)獎(jiǎng)結(jié)果揭曉[J];當(dāng)代圖書(shū)館;2017年03期
8 湯敬謙;楊鶴林;;熱點(diǎn)、網(wǎng)絡(luò)與態(tài)勢(shì):國(guó)外圖書(shū)情報(bào)學(xué)領(lǐng)域元數(shù)據(jù)研究的知識(shí)圖譜分析[J];圖書(shū)館學(xué)研究;2016年06期
9 王紅;白才進(jìn);雷菊霞;;智庫(kù)視角下圖書(shū)情報(bào)學(xué)學(xué)科發(fā)展范式和未來(lái)變革趨勢(shì)[J];圖書(shū)館學(xué)研究;2016年13期
10 楊穎;;大數(shù)據(jù)背景下圖書(shū)情報(bào)學(xué)科教學(xué)模式創(chuàng)新研究[J];魅力中國(guó);2017年05期
相關(guān)會(huì)議論文 前7條
1 劉宇;張?jiān)浦?魏瑞斌;謝歡;;2012-2013年上海圖書(shū)情報(bào)學(xué)研究進(jìn)展述評(píng)[A];上海學(xué)術(shù)報(bào)告(2012-2013)[C];2015年
2 李敏;;淺議圖書(shū)情報(bào)學(xué)的可持續(xù)發(fā)展[A];山西省科技情報(bào)學(xué)會(huì)2004年學(xué)術(shù)年會(huì)論文集[C];2005年
3 陳福蓉;李建霞;;基于圖書(shū)情報(bào)學(xué)的國(guó)家社科基金古籍保護(hù)立項(xiàng)分析[A];廣西圖書(shū)館學(xué)會(huì)2012年年會(huì)暨第30次科學(xué)討論會(huì)論文集[C];2012年
4 歐陽(yáng)劍;周添良;胡雅瓊;;“互聯(lián)網(wǎng)+”視域下的我國(guó)圖書(shū)情報(bào)學(xué)教育模式變革探析[A];中國(guó)圖書(shū)館學(xué)會(huì)年會(huì)論文集(2017年卷)[C];2018年
5 張爾君;;加強(qiáng)行業(yè)協(xié)會(huì)組織建設(shè) 助推圖書(shū)情報(bào)事業(yè)發(fā)展——市地級(jí)圖書(shū)情報(bào)學(xué)會(huì)發(fā)展思考[A];全國(guó)中小型公共圖書(shū)館聯(lián)合會(huì)2015年研討會(huì)會(huì)議論文集(一)[C];2015年
6 ;提升公眾素養(yǎng) 造就文化強(qiáng)市[A];黑龍江省社科工作經(jīng)驗(yàn)交流會(huì)材料匯編[C];2010年
7 杜娜;;淺議圖書(shū)館館員的終身教育[A];新世界中國(guó)教育發(fā)展論壇 第二卷[C];2007年
相關(guān)重要報(bào)紙文章 前5條
1 湘潭大學(xué)公共管理學(xué)院 關(guān)影;從知識(shí)圖譜視角看中外圖書(shū)情報(bào)學(xué)科進(jìn)展[N];新華書(shū)目報(bào);2016年
2 圖娃;圖書(shū)情報(bào)學(xué)需建資格認(rèn)證體系[N];中國(guó)社會(huì)科學(xué)報(bào);2010年
3 中國(guó)科技信息研究所研究員 武夷山;不可忽視信息在文化產(chǎn)業(yè)中的作用[N];光明日?qǐng)?bào);2007年
4 實(shí)習(xí)生 李洪威 記者 張偉國(guó);省社科院延邊州分院成立[N];吉林日?qǐng)?bào);2009年
5 記者 李思輝 王才忠;學(xué)術(shù)繁榮有新篇[N];湖北日?qǐng)?bào);2013年
相關(guān)博士學(xué)位論文 前1條
1 程妮;基于引文的知識(shí)轉(zhuǎn)移研究[D];武漢大學(xué);2009年
相關(guān)碩士學(xué)位論文 前10條
1 倪弘;美國(guó)圖書(shū)情報(bào)學(xué)研究生教育對(duì)中國(guó)的啟示[D];山西財(cái)經(jīng)大學(xué);2019年
2 杜含雙;期刊引證視角下圖書(shū)情報(bào)學(xué)知識(shí)交流結(jié)構(gòu)分析[D];西南科技大學(xué);2019年
3 于娜;基于LDA模型的圖書(shū)情報(bào)學(xué)向計(jì)算機(jī)科學(xué)知識(shí)流動(dòng)分析[D];曲阜師范大學(xué);2019年
4 于舒曼;基于共詞聚類的圖書(shū)情報(bào)學(xué)與新聞傳播學(xué)學(xué)科交叉研究[D];曲阜師范大學(xué);2019年
5 王佳佳;海峽兩岸圖書(shū)情報(bào)學(xué)領(lǐng)域博碩士學(xué)位論文對(duì)比研究[D];東北師范大學(xué);2018年
6 郭驊祥;我國(guó)圖書(shū)情報(bào)學(xué)學(xué)科交叉計(jì)量分析[D];鄭州大學(xué);2018年
7 劉敏;我國(guó)圖書(shū)情報(bào)學(xué)學(xué)科交叉知識(shí)網(wǎng)絡(luò)的構(gòu)建及演化研究[D];曲阜師范大學(xué);2018年
8 朱彥君;近十年圖書(shū)情報(bào)學(xué)科學(xué)結(jié)構(gòu)及演進(jìn)研究[D];曲阜師范大學(xué);2018年
9 李小北;圖書(shū)情報(bào)學(xué)領(lǐng)域研究方法的效度研究[D];河北大學(xué);2018年
10 武正谷;基于CiteSpace分析的我國(guó)圖書(shū)情報(bào)學(xué)科發(fā)展研究[D];山西醫(yī)科大學(xué);2018年
本文編號(hào):2777614
本文鏈接:http://sikaile.net/tushudanganlunwen/2777614.html