天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 信息工程論文 >

基于主題模型的專家檢索及應(yīng)用挖掘

發(fā)布時(shí)間:2016-09-30 18:18

  本文關(guān)鍵詞:面向?qū)I(yè)領(lǐng)域的網(wǎng)絡(luò)信息采集及主題檢測(cè)技術(shù)研究與應(yīng)用,由筆耕文化傳播整理發(fā)布。


《云南大學(xué)》 2010年

基于主題模型的專家檢索及應(yīng)用挖掘

王美姣  

【摘要】: 入21世紀(jì),人類社會(huì)正在由信息社會(huì)邁向知識(shí)社會(huì),掌握知識(shí)、勇于創(chuàng)新的人才成為企業(yè)和組織中最有價(jià)值的資源。無論是科學(xué)研究機(jī)構(gòu),還是社會(huì)生產(chǎn)部門(如企業(yè)、工廠),都需要那些擁有豐富專業(yè)知識(shí)、技能與經(jīng)驗(yàn)的領(lǐng)域?qū)<襾斫M織團(tuán)隊(duì),指導(dǎo)研發(fā),攻關(guān)技術(shù),以此來提高工作或生產(chǎn)效率,而如何通過有效的手段發(fā)現(xiàn)這些專家就日漸成為一個(gè)重要的科學(xué)問題。 作為一項(xiàng)檢索工作,專家檢索近年來受到了很多的關(guān)注,成為信息處理領(lǐng)域的研究熱點(diǎn)。本文先回顧了專家檢索的研究背景、現(xiàn)狀,闡述了其研究進(jìn)展,并就其研究方法如專家建模、鏈接分析、查詢擴(kuò)展、專家證據(jù)識(shí)別、隱含主題分析等作了分析和總結(jié),還統(tǒng)計(jì)分析了各類測(cè)試集,展望了該領(lǐng)域未來的研究方向。 針對(duì)特定的主題查詢已提出了很多排序候選專家的策略。其中最有效的方法是基于支持文檔的專家建模,但是這種方法建模查詢和候選專家關(guān)系時(shí)缺少捕獲查詢和候選專家的隱含語義聯(lián)系。本文提出潛在主題模型和支持文檔相結(jié)合的方法。該方法建模查詢和支持文檔為單詞-主題-文檔關(guān)系,而不是用語言模型建模單詞-文檔關(guān)系,另外,支持文檔的先驗(yàn)知識(shí)也被考慮來排序?qū)<。在元?shù)據(jù)語料庫上的實(shí)驗(yàn)結(jié)果顯示潛在主題模型能有效的捕獲查詢和候選專家的語義關(guān)系,因此提高了專家檢索的性能。文中給出了評(píng)審專家自動(dòng)分配策略和多類型指標(biāo)條件下的專家排名,實(shí)現(xiàn)了評(píng)審專家自動(dòng)化推薦,并公平可靠地分配候選專家。 潛在主題模型的應(yīng)用研究越來越多,本文所述在生物信息學(xué)領(lǐng)域的應(yīng)用就是一個(gè)很好的實(shí)例。生物信息學(xué)已經(jīng)發(fā)展了大約30年的時(shí)間,特別是在過去10年里,該領(lǐng)域的發(fā)展一日千里,也出現(xiàn)了許多研究工作。這一領(lǐng)域的無論是一個(gè)新手,還是著名學(xué)者,都希望能夠一睹這一領(lǐng)域的研究現(xiàn)狀,并對(duì)該領(lǐng)域獲得一個(gè)直觀和量化的了解。本文將利用潛在主題模型,挖掘出生物信息學(xué)領(lǐng)域的文獻(xiàn)來發(fā)現(xiàn)重要的研究課題,量化這些主題的演變來顯示這一領(lǐng)域的發(fā)展趨勢(shì)。

【關(guān)鍵詞】:
【學(xué)位授予單位】:云南大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2010
【分類號(hào)】:TP391.3
【目錄】:

  • 摘要3-4
  • Abstract4-8
  • 第一章 緒論8-11
  • 1.1 研究背景與意義8-9
  • 1.2 研究現(xiàn)狀9-10
  • 1.3 本文的主要工作和內(nèi)容結(jié)構(gòu)10-11
  • 第二章 專家檢索研究進(jìn)展11-21
  • 2.1 引言11
  • 2.2 專家檢索模型研究11-16
  • 2.2.1 專家建模方法12-13
  • 2.2.2 鏈接分析方法13-14
  • 2.2.3 查詢擴(kuò)展方法14-15
  • 2.2.4 專家證據(jù)識(shí)別15-16
  • 2.3 專家檢索測(cè)試集16-19
  • 2.4 專家檢索未來方向19-20
  • 2.5 小結(jié)20-21
  • 第三章 基于主題模型的專家檢索21-37
  • 3.1 引言21-22
  • 3.2 專家檢索的背景技術(shù)22-27
  • 3.2.1 TF-IDF22-24
  • 3.2.2 潛在主題模型24-27
  • 3.2.2.1 先驗(yàn)概率和后驗(yàn)概率24
  • 3.2.2.2 馬爾可夫鏈24-25
  • 3.2.2.3 潛在的狄利克雷分布(LDA)25-26
  • 3.2.2.4 基于Gibbs抽樣的LDA26-27
  • 3.3 專家檢索的擴(kuò)展模型27-34
  • 3.3.1 基礎(chǔ)模型27-28
  • 3.3.2 候選專家和文檔關(guān)系建模28
  • 3.3.3 查詢和文檔關(guān)系建模28-29
  • 3.3.4 發(fā)掘文檔的先驗(yàn)知識(shí)29-30
  • 3.3.5 實(shí)驗(yàn)和討論30-34
  • 3.3.5.1 實(shí)驗(yàn)設(shè)置30-31
  • 3.3.5.2 評(píng)審專家檢索的LDA模型31-33
  • 3.3.5.3 評(píng)審支持文檔先驗(yàn)知識(shí)的發(fā)掘33-34
  • 3.4 評(píng)審專家推薦應(yīng)用34-36
  • 3.5 小結(jié)36-37
  • 第四章 主題模型的研究趨勢(shì)挖掘應(yīng)用37-46
  • 4.1 引言37
  • 4.2 在文檔集中檢測(cè)主題和發(fā)展趨勢(shì)的模型37-39
  • 4.3 評(píng)審生物信息學(xué)的研究趨勢(shì)39-45
  • 4.3.1 更加突出的主題40-41
  • 4.3.2 已經(jīng)下降的主題41
  • 4.3.3 高峰和波谷主題41-43
  • 4.3.4 生物信息學(xué)中的交叉學(xué)科技術(shù)43-45
  • 4.4 小結(jié)45-46
  • 第五章 結(jié)語46-47
  • 參考文獻(xiàn)47-52
  • 攻讀碩士期間發(fā)表論文與參與項(xiàng)目52-53
  • 致謝53
  • 下載全文 更多同類文獻(xiàn)

    CAJ全文下載

    (如何獲取全文? 歡迎:購買知網(wǎng)充值卡、在線充值、在線咨詢)

    CAJViewer閱讀器支持CAJ、PDF文件格式


    【參考文獻(xiàn)】

    中國期刊全文數(shù)據(jù)庫 前3條

    1 石晶;胡明;石鑫;戴國忠;;基于LDA模型的文本分割[J];計(jì)算機(jī)學(xué)報(bào);2008年10期

    2 孫海霞;成穎;;潛在語義標(biāo)引(LSI)研究綜述[J];現(xiàn)代圖書情報(bào)技術(shù);2007年09期

    3 陸偉;趙浩鎮(zhèn);;基于文檔權(quán)重歸并法的企業(yè)專家檢索[J];現(xiàn)代圖書情報(bào)技術(shù);2008年07期

    【共引文獻(xiàn)】

    中國期刊全文數(shù)據(jù)庫 前10條

    1 吳永輝;王曉龍;丁宇新;徐軍;郭鴻志;;基于主題的自適應(yīng)、在線網(wǎng)絡(luò)熱點(diǎn)發(fā)現(xiàn)方法及新聞推薦系統(tǒng)[J];電子學(xué)報(bào);2010年11期

    2 段靈修;林俊;黃達(dá)臻;黃志華;;中文專利文本特征提取方法研究[J];福建電腦;2011年12期

    3 胡艷麗;白亮;張維明;;網(wǎng)絡(luò)輿情中一種基于OLDA的在線話題演化方法[J];國防科技大學(xué)學(xué)報(bào);2012年01期

    4 王小芳;王瑞芳;張樹功;;基于最優(yōu)化控制模型的文本主題域劃分[J];吉林大學(xué)學(xué)報(bào)(理學(xué)版);2009年04期

    5 崔凱;周斌;賈焰;梁政;;一種基于LDA的在線主題演化挖掘模型[J];計(jì)算機(jī)科學(xué);2010年11期

    6 石晶;李萬龍;;基于LDA模型的主題詞抽取方法[J];計(jì)算機(jī)工程;2010年19期

    7 徐戈;王厚峰;;自然語言處理中主題模型的發(fā)展[J];計(jì)算機(jī)學(xué)報(bào);2011年08期

    8 劉培奇;孫捷焓;;基于LDA主題模型的標(biāo)簽傳遞算法[J];計(jì)算機(jī)應(yīng)用;2012年02期

    9 武浩;王美姣;馮佳明;裴以建;;專家檢索研究進(jìn)展[J];計(jì)算機(jī)應(yīng)用研究;2010年10期

    10 楊柳;張文生;;專家搜索中關(guān)系證據(jù)的重要性研究[J];計(jì)算機(jī)應(yīng)用研究;2010年11期

    中國重要會(huì)議論文全文數(shù)據(jù)庫 前3條

    1 畢文靜;沈華偉;劉悅;許洪波;程學(xué)旗;;基于企業(yè)環(huán)境的專家檢索研究[A];第五屆全國信息檢索學(xué)術(shù)會(huì)議論文集[C];2009年

    2 楊瀟;馬軍;楊同峰;杜言琦;邵海敏;;基于主題模型LDA的多文檔自動(dòng)摘要[A];第五屆全國信息檢索學(xué)術(shù)會(huì)議論文集[C];2009年

    3 丁兆云;王暉;;一種詞位置相關(guān)的LDA模型[A];2013第一屆中國指揮控制大會(huì)論文集[C];2013年

    中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條

    1 丁軼群;基于概率生成模型的文本主題建模及其應(yīng)用[D];浙江大學(xué);2010年

    2 吳永輝;面向?qū)I(yè)領(lǐng)域的網(wǎng)絡(luò)信息采集及主題檢測(cè)技術(shù)研究與應(yīng)用[D];哈爾濱工業(yè)大學(xué);2010年

    3 王小芳;文本主題域劃分與無監(jiān)督特征提取[D];吉林大學(xué);2009年

    4 林琛;WEB環(huán)境下的社會(huì)網(wǎng)絡(luò)挖掘研究[D];復(fù)旦大學(xué);2009年

    5 楊瀟;基于生成性概率模型的句法分析和多文檔自動(dòng)文摘研究[D];山東大學(xué);2009年

    6 張冬梅;文本情感分類及觀點(diǎn)摘要關(guān)鍵問題研究[D];山東大學(xué);2012年

    7 龔書;抽取式多文檔文摘的文本表示研究[D];北京交通大學(xué);2013年

    8 胡德鵬;基于農(nóng)業(yè)本體問句分析的問答系統(tǒng)研究與架構(gòu)設(shè)計(jì)[D];中國農(nóng)業(yè)科學(xué)院;2013年

    9 胡艷麗;在線社會(huì)網(wǎng)絡(luò)中的輿論演化關(guān)鍵技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2011年

    10 朱沿旭;面向開源社區(qū)的Web數(shù)據(jù)抽取與挖掘關(guān)鍵技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2011年

    中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條

    1 張廬穎;基于粗糙集的K-means研究[D];北京交通大學(xué);2011年

    2 吳高;基于數(shù)據(jù)挖掘的商品資訊投送平臺(tái)研究與實(shí)現(xiàn)[D];電子科技大學(xué);2011年

    3 張博;高校網(wǎng)絡(luò)突發(fā)事件應(yīng)急處置系統(tǒng)的研究[D];北京交通大學(xué);2011年

    4 毛玉才;基于語義網(wǎng)技術(shù)的語義檢索系統(tǒng)模型研究[D];黑龍江大學(xué);2008年

    5 馮穎;網(wǎng)絡(luò)輿情敏感話題發(fā)現(xiàn)平臺(tái)的研究[D];北京交通大學(xué);2009年

    6 陳浩然;基于日志分析的信息檢索技術(shù)研究與實(shí)現(xiàn)[D];電子科技大學(xué);2009年

    7 馬娟;文本自動(dòng)標(biāo)引方法研究與實(shí)現(xiàn)[D];西南交通大學(xué);2009年

    8 王雪芬;基于社會(huì)網(wǎng)絡(luò)的科技咨詢專家?guī)鞓?gòu)建及其可視化研究[D];南京理工大學(xué);2010年

    9 蔣瑩瑩;基于對(duì)話的主題提取研究[D];華中科技大學(xué);2009年

    10 楚彥凌;基于數(shù)據(jù)聚類的語言模型研究[D];北京郵電大學(xué);2010年

    【二級(jí)參考文獻(xiàn)】

    中國期刊全文數(shù)據(jù)庫 前10條

    1 趙順,遲呈英;基于LSI和Rough集的文本分類研究[J];鞍山科技大學(xué)學(xué)報(bào);2005年05期

    2 王慧莉;隋丹妮;;基于潛在語義分析的長時(shí)工作記憶在語篇理解中的作用[J];北京航空航天大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版);2005年04期

    3 王金鳳;一種基于特征聚合理論和LSI的文本分類新方法[J];北京理工大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版);2004年05期

    4 林鴻飛,高仁璟;基于潛在語義索引的文本摘要方法[J];大連理工大學(xué)學(xué)報(bào);2001年06期

    5 林鴻飛;丁洪文;楊志豪;趙晶;;基于概念和統(tǒng)計(jì)的問答系統(tǒng)實(shí)現(xiàn)機(jī)制[J];大連理工大學(xué)學(xué)報(bào);2006年02期

    6 楊梁彬;文本檢索的潛在語義索引法初探[J];大學(xué)圖書館學(xué)報(bào);2003年06期

    7 曾雪強(qiáng),王明文,陳素芬;一種基于潛在語義結(jié)構(gòu)的文本分類模型[J];華南理工大學(xué)學(xué)報(bào)(自然科學(xué)版);2004年S1期

    8 袁磊,曹奎,馮玉才,吳永英;一種基于LSI的圖像語義檢索技術(shù)[J];華中科技大學(xué)學(xué)報(bào)(自然科學(xué)版);2002年02期

    9 石晶;戴國忠;;基于PLSA模型的文本分割[J];計(jì)算機(jī)研究與發(fā)展;2007年02期

    10 林鴻飛,李業(yè)麗,姚天順;中英文雙語交叉過濾的邏輯模型[J];計(jì)算機(jī)工程與應(yīng)用;2000年08期

    【相似文獻(xiàn)】

    中國期刊全文數(shù)據(jù)庫 前10條

    1 鵬程;利用VC++改變文檔窗口的實(shí)現(xiàn)[J];電腦編程技巧與維護(hù);2005年02期

    2 王海星;Word XP功能鍵集錦[J];電子與電腦;2003年02期

    3 little fox;;快速編輯長文檔的不同部分[J];電腦迷;2008年18期

    4 小白;;文章太長 我有定位神針[J];電腦迷;2009年15期

    5 曹建;Gallery Effects連載之二 Gallery Effects的命令和工具[J];軟件世界;1996年03期

    6 王水成;為Word文檔設(shè)置密碼[J];家庭電子;2003年07期

    7 雨陽;網(wǎng)站高手必備 網(wǎng)頁設(shè)計(jì)新武器──GoLive[J];電子計(jì)算機(jī)與外部設(shè)備;2000年07期

    8 李波;定位圖片2分鐘提交[J];電腦應(yīng)用文萃;2004年10期

    9 申漢軍;熊耀華;;使用Excel制作可顯示和隱藏答案的練習(xí)文檔[J];中小學(xué)電教;2008年09期

    10 張海,潘光斌;多文檔界面在雷達(dá)仿真軟件中的應(yīng)用[J];計(jì)算機(jī)應(yīng)用研究;1997年03期

    中國重要會(huì)議論文全文數(shù)據(jù)庫 前2條

    1 張春卯;邢岳林;;基于Flex的RIA技術(shù)在網(wǎng)絡(luò)教育中的應(yīng)用[A];中國電子學(xué)會(huì)第十七屆信息論學(xué)術(shù)年會(huì)論文集[C];2010年

    2 范暉;曹俊武;;天氣雷達(dá)數(shù)據(jù)瀏覽器的設(shè)計(jì)[A];全國第20屆計(jì)算機(jī)技術(shù)與應(yīng)用學(xué)術(shù)會(huì)議(CACIS·2009)暨全國第1屆安全關(guān)鍵技術(shù)與應(yīng)用學(xué)術(shù)會(huì)議論文集(下冊(cè))[C];2009年

    中國重要報(bào)紙全文數(shù)據(jù)庫 前10條

    1 ;[N];電腦報(bào);2001年

    2 廣州市 鐘征;[N];電子報(bào);2006年

    3 W-W 阿寶 陳會(huì)安 阿@;[N];電腦報(bào);2003年

    4 ;[N];電腦報(bào);2001年

    5 飛子 徐穎 沙沙 姚楠;[N];電腦報(bào);2003年

    6 陳會(huì)安;[N];中國電腦教育報(bào);2003年

    7 浙江 徑山茶;[N];中國電腦教育報(bào);2005年

    8 縱橫一笑;[N];中國電腦教育報(bào);2003年

    9 若木;[N];中國國門時(shí)報(bào);2006年

    10 陳智罡;[N];中國電腦教育報(bào);2003年

    中國碩士學(xué)位論文全文數(shù)據(jù)庫 前2條

    1 章偉國;基于GIS的配電生產(chǎn)管理信息系統(tǒng)[D];電子科技大學(xué);2011年

    2 郭東波;基于偽文檔的潛在語義索引優(yōu)化技術(shù)的研究[D];沈陽航空工業(yè)學(xué)院;2010年

    中國知網(wǎng)廣告投放

    相關(guān)機(jī)構(gòu)

    >電子科技大學(xué)

    >沈陽航空工業(yè)學(xué)院

    相關(guān)作者

    >郭東波 >章偉國

    基于主題模型的專家檢索及應(yīng)用挖掘

    《中國學(xué)術(shù)期刊(光盤版)》電子雜志社有限公司
    同方知網(wǎng)數(shù)字出版技術(shù)股份有限公司
    地址:北京清華大學(xué) 84-48信箱 大眾知識(shí)服務(wù)
    京ICP證040441號(hào)
    互聯(lián)網(wǎng)出版許可證 新出網(wǎng)證(京)字008號(hào)
    出版物經(jīng)營許可證 新出發(fā)京批字第直0595號(hào)

    訂購熱線:400-819-9993 010-62982499
    服務(wù)熱線:010-62985026 010-62791813
    在線咨詢:
    傳真:010-62780361
    京公網(wǎng)安備11010802020475號(hào)



      本文關(guān)鍵詞:面向?qū)I(yè)領(lǐng)域的網(wǎng)絡(luò)信息采集及主題檢測(cè)技術(shù)研究與應(yīng)用,由筆耕文化傳播整理發(fā)布。

    ,

    本文編號(hào):127482

    資料下載
    論文發(fā)表

    本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/127482.html


    Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

    版權(quán)申明:資料由用戶6bde5***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com