基于主題模型的專家檢索及應(yīng)用挖掘
本文關(guān)鍵詞:面向?qū)I(yè)領(lǐng)域的網(wǎng)絡(luò)信息采集及主題檢測(cè)技術(shù)研究與應(yīng)用,由筆耕文化傳播整理發(fā)布。
《云南大學(xué)》 2010年
基于主題模型的專家檢索及應(yīng)用挖掘
王美姣
【摘要】: 入21世紀(jì),人類社會(huì)正在由信息社會(huì)邁向知識(shí)社會(huì),掌握知識(shí)、勇于創(chuàng)新的人才成為企業(yè)和組織中最有價(jià)值的資源。無論是科學(xué)研究機(jī)構(gòu),還是社會(huì)生產(chǎn)部門(如企業(yè)、工廠),都需要那些擁有豐富專業(yè)知識(shí)、技能與經(jīng)驗(yàn)的領(lǐng)域?qū)<襾斫M織團(tuán)隊(duì),指導(dǎo)研發(fā),攻關(guān)技術(shù),以此來提高工作或生產(chǎn)效率,而如何通過有效的手段發(fā)現(xiàn)這些專家就日漸成為一個(gè)重要的科學(xué)問題。 作為一項(xiàng)檢索工作,專家檢索近年來受到了很多的關(guān)注,成為信息處理領(lǐng)域的研究熱點(diǎn)。本文先回顧了專家檢索的研究背景、現(xiàn)狀,闡述了其研究進(jìn)展,并就其研究方法如專家建模、鏈接分析、查詢擴(kuò)展、專家證據(jù)識(shí)別、隱含主題分析等作了分析和總結(jié),還統(tǒng)計(jì)分析了各類測(cè)試集,展望了該領(lǐng)域未來的研究方向。 針對(duì)特定的主題查詢已提出了很多排序候選專家的策略。其中最有效的方法是基于支持文檔的專家建模,但是這種方法建模查詢和候選專家關(guān)系時(shí)缺少捕獲查詢和候選專家的隱含語義聯(lián)系。本文提出潛在主題模型和支持文檔相結(jié)合的方法。該方法建模查詢和支持文檔為單詞-主題-文檔關(guān)系,而不是用語言模型建模單詞-文檔關(guān)系,另外,支持文檔的先驗(yàn)知識(shí)也被考慮來排序?qū)<。在元?shù)據(jù)語料庫上的實(shí)驗(yàn)結(jié)果顯示潛在主題模型能有效的捕獲查詢和候選專家的語義關(guān)系,因此提高了專家檢索的性能。文中給出了評(píng)審專家自動(dòng)分配策略和多類型指標(biāo)條件下的專家排名,實(shí)現(xiàn)了評(píng)審專家自動(dòng)化推薦,并公平可靠地分配候選專家。 潛在主題模型的應(yīng)用研究越來越多,本文所述在生物信息學(xué)領(lǐng)域的應(yīng)用就是一個(gè)很好的實(shí)例。生物信息學(xué)已經(jīng)發(fā)展了大約30年的時(shí)間,特別是在過去10年里,該領(lǐng)域的發(fā)展一日千里,也出現(xiàn)了許多研究工作。這一領(lǐng)域的無論是一個(gè)新手,還是著名學(xué)者,都希望能夠一睹這一領(lǐng)域的研究現(xiàn)狀,并對(duì)該領(lǐng)域獲得一個(gè)直觀和量化的了解。本文將利用潛在主題模型,挖掘出生物信息學(xué)領(lǐng)域的文獻(xiàn)來發(fā)現(xiàn)重要的研究課題,量化這些主題的演變來顯示這一領(lǐng)域的發(fā)展趨勢(shì)。
【關(guān)鍵詞】:
【學(xué)位授予單位】:云南大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2010
【分類號(hào)】:TP391.3
【目錄】:
下載全文 更多同類文獻(xiàn)
CAJ全文下載
(如何獲取全文? 歡迎:購買知網(wǎng)充值卡、在線充值、在線咨詢)
CAJViewer閱讀器支持CAJ、PDF文件格式
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前3條
1 石晶;胡明;石鑫;戴國忠;;基于LDA模型的文本分割[J];計(jì)算機(jī)學(xué)報(bào);2008年10期
2 孫海霞;成穎;;潛在語義標(biāo)引(LSI)研究綜述[J];現(xiàn)代圖書情報(bào)技術(shù);2007年09期
3 陸偉;趙浩鎮(zhèn);;基于文檔權(quán)重歸并法的企業(yè)專家檢索[J];現(xiàn)代圖書情報(bào)技術(shù);2008年07期
【共引文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 吳永輝;王曉龍;丁宇新;徐軍;郭鴻志;;基于主題的自適應(yīng)、在線網(wǎng)絡(luò)熱點(diǎn)發(fā)現(xiàn)方法及新聞推薦系統(tǒng)[J];電子學(xué)報(bào);2010年11期
2 段靈修;林俊;黃達(dá)臻;黃志華;;中文專利文本特征提取方法研究[J];福建電腦;2011年12期
3 胡艷麗;白亮;張維明;;網(wǎng)絡(luò)輿情中一種基于OLDA的在線話題演化方法[J];國防科技大學(xué)學(xué)報(bào);2012年01期
4 王小芳;王瑞芳;張樹功;;基于最優(yōu)化控制模型的文本主題域劃分[J];吉林大學(xué)學(xué)報(bào)(理學(xué)版);2009年04期
5 崔凱;周斌;賈焰;梁政;;一種基于LDA的在線主題演化挖掘模型[J];計(jì)算機(jī)科學(xué);2010年11期
6 石晶;李萬龍;;基于LDA模型的主題詞抽取方法[J];計(jì)算機(jī)工程;2010年19期
7 徐戈;王厚峰;;自然語言處理中主題模型的發(fā)展[J];計(jì)算機(jī)學(xué)報(bào);2011年08期
8 劉培奇;孫捷焓;;基于LDA主題模型的標(biāo)簽傳遞算法[J];計(jì)算機(jī)應(yīng)用;2012年02期
9 武浩;王美姣;馮佳明;裴以建;;專家檢索研究進(jìn)展[J];計(jì)算機(jī)應(yīng)用研究;2010年10期
10 楊柳;張文生;;專家搜索中關(guān)系證據(jù)的重要性研究[J];計(jì)算機(jī)應(yīng)用研究;2010年11期
中國重要會(huì)議論文全文數(shù)據(jù)庫 前3條
1 畢文靜;沈華偉;劉悅;許洪波;程學(xué)旗;;基于企業(yè)環(huán)境的專家檢索研究[A];第五屆全國信息檢索學(xué)術(shù)會(huì)議論文集[C];2009年
2 楊瀟;馬軍;楊同峰;杜言琦;邵海敏;;基于主題模型LDA的多文檔自動(dòng)摘要[A];第五屆全國信息檢索學(xué)術(shù)會(huì)議論文集[C];2009年
3 丁兆云;王暉;;一種詞位置相關(guān)的LDA模型[A];2013第一屆中國指揮控制大會(huì)論文集[C];2013年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 丁軼群;基于概率生成模型的文本主題建模及其應(yīng)用[D];浙江大學(xué);2010年
2 吳永輝;面向?qū)I(yè)領(lǐng)域的網(wǎng)絡(luò)信息采集及主題檢測(cè)技術(shù)研究與應(yīng)用[D];哈爾濱工業(yè)大學(xué);2010年
3 王小芳;文本主題域劃分與無監(jiān)督特征提取[D];吉林大學(xué);2009年
4 林琛;WEB環(huán)境下的社會(huì)網(wǎng)絡(luò)挖掘研究[D];復(fù)旦大學(xué);2009年
5 楊瀟;基于生成性概率模型的句法分析和多文檔自動(dòng)文摘研究[D];山東大學(xué);2009年
6 張冬梅;文本情感分類及觀點(diǎn)摘要關(guān)鍵問題研究[D];山東大學(xué);2012年
7 龔書;抽取式多文檔文摘的文本表示研究[D];北京交通大學(xué);2013年
8 胡德鵬;基于農(nóng)業(yè)本體問句分析的問答系統(tǒng)研究與架構(gòu)設(shè)計(jì)[D];中國農(nóng)業(yè)科學(xué)院;2013年
9 胡艷麗;在線社會(huì)網(wǎng)絡(luò)中的輿論演化關(guān)鍵技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2011年
10 朱沿旭;面向開源社區(qū)的Web數(shù)據(jù)抽取與挖掘關(guān)鍵技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2011年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 張廬穎;基于粗糙集的K-means研究[D];北京交通大學(xué);2011年
2 吳高;基于數(shù)據(jù)挖掘的商品資訊投送平臺(tái)研究與實(shí)現(xiàn)[D];電子科技大學(xué);2011年
3 張博;高校網(wǎng)絡(luò)突發(fā)事件應(yīng)急處置系統(tǒng)的研究[D];北京交通大學(xué);2011年
4 毛玉才;基于語義網(wǎng)技術(shù)的語義檢索系統(tǒng)模型研究[D];黑龍江大學(xué);2008年
5 馮穎;網(wǎng)絡(luò)輿情敏感話題發(fā)現(xiàn)平臺(tái)的研究[D];北京交通大學(xué);2009年
6 陳浩然;基于日志分析的信息檢索技術(shù)研究與實(shí)現(xiàn)[D];電子科技大學(xué);2009年
7 馬娟;文本自動(dòng)標(biāo)引方法研究與實(shí)現(xiàn)[D];西南交通大學(xué);2009年
8 王雪芬;基于社會(huì)網(wǎng)絡(luò)的科技咨詢專家?guī)鞓?gòu)建及其可視化研究[D];南京理工大學(xué);2010年
9 蔣瑩瑩;基于對(duì)話的主題提取研究[D];華中科技大學(xué);2009年
10 楚彥凌;基于數(shù)據(jù)聚類的語言模型研究[D];北京郵電大學(xué);2010年
【二級(jí)參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 趙順,遲呈英;基于LSI和Rough集的文本分類研究[J];鞍山科技大學(xué)學(xué)報(bào);2005年05期
2 王慧莉;隋丹妮;;基于潛在語義分析的長時(shí)工作記憶在語篇理解中的作用[J];北京航空航天大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版);2005年04期
3 王金鳳;一種基于特征聚合理論和LSI的文本分類新方法[J];北京理工大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版);2004年05期
4 林鴻飛,高仁璟;基于潛在語義索引的文本摘要方法[J];大連理工大學(xué)學(xué)報(bào);2001年06期
5 林鴻飛;丁洪文;楊志豪;趙晶;;基于概念和統(tǒng)計(jì)的問答系統(tǒng)實(shí)現(xiàn)機(jī)制[J];大連理工大學(xué)學(xué)報(bào);2006年02期
6 楊梁彬;文本檢索的潛在語義索引法初探[J];大學(xué)圖書館學(xué)報(bào);2003年06期
7 曾雪強(qiáng),王明文,陳素芬;一種基于潛在語義結(jié)構(gòu)的文本分類模型[J];華南理工大學(xué)學(xué)報(bào)(自然科學(xué)版);2004年S1期
8 袁磊,曹奎,馮玉才,吳永英;一種基于LSI的圖像語義檢索技術(shù)[J];華中科技大學(xué)學(xué)報(bào)(自然科學(xué)版);2002年02期
9 石晶;戴國忠;;基于PLSA模型的文本分割[J];計(jì)算機(jī)研究與發(fā)展;2007年02期
10 林鴻飛,李業(yè)麗,姚天順;中英文雙語交叉過濾的邏輯模型[J];計(jì)算機(jī)工程與應(yīng)用;2000年08期
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 鵬程;利用VC++改變文檔窗口的實(shí)現(xiàn)[J];電腦編程技巧與維護(hù);2005年02期
2 王海星;Word XP功能鍵集錦[J];電子與電腦;2003年02期
3 little fox;;快速編輯長文檔的不同部分[J];電腦迷;2008年18期
4 小白;;文章太長 我有定位神針[J];電腦迷;2009年15期
5 曹建;Gallery Effects連載之二 Gallery Effects的命令和工具[J];軟件世界;1996年03期
6 王水成;為Word文檔設(shè)置密碼[J];家庭電子;2003年07期
7 雨陽;網(wǎng)站高手必備 網(wǎng)頁設(shè)計(jì)新武器──GoLive[J];電子計(jì)算機(jī)與外部設(shè)備;2000年07期
8 李波;定位圖片2分鐘提交[J];電腦應(yīng)用文萃;2004年10期
9 申漢軍;熊耀華;;使用Excel制作可顯示和隱藏答案的練習(xí)文檔[J];中小學(xué)電教;2008年09期
10 張海,潘光斌;多文檔界面在雷達(dá)仿真軟件中的應(yīng)用[J];計(jì)算機(jī)應(yīng)用研究;1997年03期
中國重要會(huì)議論文全文數(shù)據(jù)庫 前2條
1 張春卯;邢岳林;;基于Flex的RIA技術(shù)在網(wǎng)絡(luò)教育中的應(yīng)用[A];中國電子學(xué)會(huì)第十七屆信息論學(xué)術(shù)年會(huì)論文集[C];2010年
2 范暉;曹俊武;;天氣雷達(dá)數(shù)據(jù)瀏覽器的設(shè)計(jì)[A];全國第20屆計(jì)算機(jī)技術(shù)與應(yīng)用學(xué)術(shù)會(huì)議(CACIS·2009)暨全國第1屆安全關(guān)鍵技術(shù)與應(yīng)用學(xué)術(shù)會(huì)議論文集(下冊(cè))[C];2009年
中國重要報(bào)紙全文數(shù)據(jù)庫 前10條
1 ;[N];電腦報(bào);2001年
2 廣州市 鐘征;[N];電子報(bào);2006年
3 W-W 阿寶 陳會(huì)安 阿@;[N];電腦報(bào);2003年
4 ;[N];電腦報(bào);2001年
5 飛子 徐穎 沙沙 姚楠;[N];電腦報(bào);2003年
6 陳會(huì)安;[N];中國電腦教育報(bào);2003年
7 浙江 徑山茶;[N];中國電腦教育報(bào);2005年
8 縱橫一笑;[N];中國電腦教育報(bào);2003年
9 若木;[N];中國國門時(shí)報(bào);2006年
10 陳智罡;[N];中國電腦教育報(bào);2003年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前2條
1 章偉國;基于GIS的配電生產(chǎn)管理信息系統(tǒng)[D];電子科技大學(xué);2011年
2 郭東波;基于偽文檔的潛在語義索引優(yōu)化技術(shù)的研究[D];沈陽航空工業(yè)學(xué)院;2010年
相關(guān)機(jī)構(gòu)
>電子科技大學(xué)
>沈陽航空工業(yè)學(xué)院
相關(guān)作者
>郭東波 >章偉國
《中國學(xué)術(shù)期刊(光盤版)》電子雜志社有限公司
同方知網(wǎng)數(shù)字出版技術(shù)股份有限公司
地址:北京清華大學(xué) 84-48信箱 大眾知識(shí)服務(wù)
京ICP證040441號(hào)
互聯(lián)網(wǎng)出版許可證 新出網(wǎng)證(京)字008號(hào)
出版物經(jīng)營許可證 新出發(fā)京批字第直0595號(hào)
訂購熱線:400-819-9993 010-62982499
服務(wù)熱線:010-62985026 010-62791813
在線咨詢:
傳真:010-62780361
京公網(wǎng)安備11010802020475號(hào)
本文關(guān)鍵詞:面向?qū)I(yè)領(lǐng)域的網(wǎng)絡(luò)信息采集及主題檢測(cè)技術(shù)研究與應(yīng)用,由筆耕文化傳播整理發(fā)布。
,本文編號(hào):127482
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/127482.html