信息系統(tǒng)領域熱點研究主題演化及合作關系研究
【學位單位】:北京郵電大學
【學位級別】:碩士
【學位年份】:2019
【中圖分類】:G353.1
【部分圖文】:
對信息系統(tǒng)領域的研究進展貢獻大。??1.4研究框架??研宄技術路線的框架如圖1-1:??原始數(shù)據(jù)收集?..占(所有作者/機構)??國際頂級學術期刊在?:(去除失誤和重復項,.?G印hi建立??5角定唯-ID)?邊(所有合作關系)社交嶋??所有論文基本丨B息)??分析合作??網絡圖譜??文本數(shù)據(jù)預處理?/文檔-關鍵人工判斷??(去除標點、停用詞、?詞列表?丨主題實際意義?十日??詞根處理等)??'文檔-主題,/立姓士?:分析主題隨時間的??LDA概率主題麵?概率矩陣?文檔-±iE^配演化規(guī)律??圖1-1技術路線??第一章為緒論。介紹本文的研宄背景和意義,包括信息系統(tǒng)的產生與發(fā)展,引出??研宂H標與意義以及研究內容,提出本文研宄的兩個主要科學問題,總結出研究的技??術路線,介紹研究的方法,并指出研宄的創(chuàng)新點。??第二章為文獻綜述。主要對國內外關于信息系統(tǒng)領域主題與熱點研究、概率主題??建模(LDA)以及社交網絡分析法的研究現(xiàn)狀進行總結與分析,從中歸納總結出對于??本研究具有參考和借鑒價值的內容。??第三章是數(shù)據(jù)對象介紹。介紹了數(shù)據(jù)對象的來源,數(shù)據(jù)的預處理以及后續(xù)借助模??型與軟件進行分析時
也大幅度增加了人們在搜索、整理以及分析所需知識的難度。海量的文本信息導??致了基于主題的分層次統(tǒng)計模型的研究需求,在此背景下,產生了以LDA為代表的??概率主題模型M。它的發(fā)展史可以簡單概括為三個階段,如圖1-2所示。??LSA?存在一詞多?LDA??義等問題?過渡丨Ua?I??0?#?#??茳抑了咯維?引入?弓丨入Dirichlet??概率統(tǒng)計學先驗分布??圖1-2?LDA的發(fā)展??概率欄題模型的前身可以追溯到潛在語義分析(Latent?Semantic?Analysis,?LSA),??它將文本表示為低維潛在語義空間的語義向量w。這是?種創(chuàng)新地引入了語義維度、??實現(xiàn)了將原始的高維詞空間映射到低維的潛在i/丨義空間成'K題空間,從而挖掘文本潛??在的語義結構的方法。但是LSA在降維過程可能帶來分類受損問題,此外還存在無??法處理“?一詞多義”等問題。??針對這些缺點,?夫曼提出了一種基于吋靠的概率統(tǒng)計學的新方法,叫做概率潛??在語義分析(Probabilistic?Latent?Semantic?Analysis,PLSA)?也就是以統(tǒng)計學的角??度考慮LSA。兩者的區(qū)別在標準潛在語義分析(LSA)的表現(xiàn)形式是共現(xiàn)矩陣的??奇異值分解,而概率潛在語義分析則是基于派生自LCM的混合矩陣分解。簡單地說,??LSA中一個語義維度對應的是-?個特征向量,而PLSA中?個語義維度對應的是?個??詞典上的概率分布。PLSA的優(yōu)點包括可以區(qū)分單詞使用的不同意思和不同類型
LDA是一種非監(jiān)督學習的方法,rT以用來識別大規(guī)模文檔集(document?collection)??或語料庫(corpus)中潛藏的主題信息[9]。它是一個分層的貝葉斯模型,有文檔、主??題和詞三個層次,如圖1-3所示。其中,每一個文檔由多個隱含的主題按照一定概率??組成,而每一個主題又可以根據(jù)一定概率由文檔中的多個詞語進行表示[1°]。??文襠丨)?主題T?間語W???1?I?1:?':'?If-I?詞激.I??t?^?‘?......?‘??-n?1?mh?^?|?邱馭?|??圖1-3文檔-主題-詞語關系[1。]??通過LDA建模方法,對輸入的文本內容進行主題抽取,可以得到對應的兩個概??率分布:主題一詞多項式分布巾,以及文檔一主題多項式分布0。主題一詞分布0可??以獲得每個潛在主題的結構,這種結構由每個支持該主題的詞的概率值來表示,概率??值越大,代表該詞與主題的關聯(lián)程度越大,通過主題一詞分布可以實現(xiàn)主題層面的數(shù)??值計算,比如主題信息的熵計算、主題間的相似度度量等;而文檔一主題分布則可以??獲得每一t主題F的文檔支撐度(也就是在該主題下的文檔的條件概率值),該值越??大表明對應的文檔與主題的關聯(lián)程度越大
【相似文獻】
相關期刊論文 前10條
1 ;省汽車站車輛進站系統(tǒng)正式運行[J];廣東交通;2010年02期
2 南中;;信息系統(tǒng)建設審計中應注意的幾個問題[J];工業(yè)審計與會計;2007年01期
3 黃琦;彭武;;智慧與智慧信息系統(tǒng)[J];中國電子科學研究院學報;2018年06期
4 豆華;劉珂羽;張建龍;;有效利用信息系統(tǒng)提高企業(yè)競爭力[J];信息記錄材料;2018年12期
5 裘昱;潘登;;信息系統(tǒng)建設中數(shù)據(jù)工程作用淺析[J];電腦知識與技術;2019年01期
6 謝棟梁;李文源;譚劍;黃煌鏡;;基于微信小程序的健康小屋信息系統(tǒng)設計與實現(xiàn)[J];數(shù)字通信世界;2019年03期
7 關存云;;淺談數(shù)字化信息系統(tǒng)與物理教學的有效整合[J];課程教育研究;2019年17期
8 田琛;;試析醫(yī)院計算機信息存在的問題及對策[J];現(xiàn)代經濟信息;2017年22期
9 王海洋;;社會保險業(yè)務一體化信息系統(tǒng)之檔案管理子系統(tǒng)初探[J];中國管理信息化;2017年19期
10 楊曉磊;;智能化煤礦信息系統(tǒng)建設關鍵技術分析[J];山西能源學院學報;2017年04期
相關博士學位論文 前10條
1 沈張帆;基于復雜信息系統(tǒng)的界面輔助設計軟件架構及核心功能模塊研究[D];東南大學;2018年
2 余梅;基于失敗風險視角的政府信息系統(tǒng)質量控制研究[D];武漢大學;2015年
3 王姣;組織間信息系統(tǒng)協(xié)同形成機理研究[D];吉林大學;2008年
4 呂苗榮;信息提取與礦山信息系統(tǒng)的研究開發(fā)[D];中南大學;2003年
5 閻志華;虛擬企業(yè)信息系統(tǒng)若干關鍵技術研究[D];南京航空航天大學;2005年
6 梁愛民;大型信息系統(tǒng)柔性體系框架多簇理論研究[D];鐵道部科學研究院;2004年
7 黨毅;中國保健食品的整理研究及信息系統(tǒng)的建立[D];中國協(xié)和醫(yī)科大學;1999年
8 羅偉其;信息大系統(tǒng)的綜合集成方法研究與應用[D];華南理工大學;2000年
9 谷勇浩;信息系統(tǒng)風險管理理論及關鍵技術研究[D];北京郵電大學;2007年
10 胡勇;網絡信息系統(tǒng)風險評估方法研究[D];四川大學;2007年
相關碩士學位論文 前10條
1 呂彤暉;信息系統(tǒng)領域熱點研究主題演化及合作關系研究[D];北京郵電大學;2019年
2 徐亞平;鐵路信息系統(tǒng)虛擬化可用性技術研究和實現(xiàn)[D];中國鐵道科學研究院;2018年
3 龔圖南;示能性視角下自助醫(yī)療服務信息系統(tǒng)采納研究[D];昆明理工大學;2018年
4 陳李沁;數(shù)字化信息系統(tǒng)輔助中學物理實驗教學中的應用研究[D];四川師范大學;2018年
5 邢兆瀚;吉林省福彩中心信息系統(tǒng)運維管理研究[D];吉林大學;2018年
6 愛麗(Momina Mohamed Ali);信息系統(tǒng)和決策對吉布提銀行組織的績效的影響[D];首都經濟貿易大學;2018年
7 蘇林;基于智慧水務的呼和浩特市供排水信息系統(tǒng)改進[D];內蒙古大學;2018年
8 戴靖鈺;某物流公司倉儲管理信息系統(tǒng)的設計與實現(xiàn)[D];廈門大學;2017年
9 黃毅松;基于認知理論的SaaS信息系統(tǒng)用戶體驗設計與研究[D];湖南大學;2018年
10 劉永瑞;高校黨風廉政建設信息系統(tǒng)的設計與實現(xiàn)[D];湖南大學;2018年
本文編號:2835844
本文鏈接:http://sikaile.net/tushudanganlunwen/2835844.html