天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 信息工程論文 >

《遼寧科技大學》2007年碩士論文

發(fā)布時間:2016-11-30 08:50

  本文關鍵詞:中文信息檢索中相關算法的研究,由筆耕文化傳播整理發(fā)布。


《遼寧科技大學》 2007年

中文信息檢索中相關算法的研究

薛靜  

【摘要】:隨著網絡技術的發(fā)展,網絡上電子可讀文本的日益增加,呈指數膨脹的文本信息資源,使得如何準確有效地獲取用戶所需要的信息成為人們關注的熱點,促進了文本處理領域的形成和發(fā)展。自動收集和整理所需要的各類信息成為信息產業(yè)面臨新的挑戰(zhàn)和新的發(fā)展契機,而信息檢索技術是解決這些問題的關鍵。根據不同的應用背景和不同的使用目的,信息檢索技術已經演化為信息檢索、信息過濾、信息分類、文本摘要,和問題回答等方向。 由于信息主要是以文本形式表示,本文主要討論中文文本檢索和相關應用的處理技術。文本檢索主要研究的對象是大規(guī)模、非結構化的真實文本,進行文本分類、文本檢索、文本過濾和文本摘要等方面處理,,以滿足用戶的信息需求。 本文主要討論的問題包括:提高文本檢索效率的索引文件系統(tǒng)和提高系統(tǒng)精度的相關反饋技術等。 文本分類既可以作為獨立應用系統(tǒng),也可以作為檢索系統(tǒng)的組件用以提高系統(tǒng)的效率。作者建議在檢索系統(tǒng)中采用層次分類方法。

【關鍵詞】:
【學位授予單位】:遼寧科技大學
【學位級別】:碩士
【學位授予年份】:2007
【分類號】:TP391.3
【目錄】:

  • 摘要4-5
  • Abstract5-8
  • 第一章 前言8-17
  • 1.1 文本檢索的背景8
  • 1.2 信息檢索的研究現(xiàn)狀8-16
  • 1.2.1 概念模型11
  • 1.2.2 文件結構11-12
  • 1.2.3 查詢操作12
  • 1.2.4 項操作12-13
  • 1.2.5 文獻操作13
  • 1.2.6 信息檢索系統(tǒng)的目標13-14
  • 1.2.7 信息檢索系統(tǒng)的評估14-16
  • 1.3 本文的組織結構16-17
  • 第二章 信息檢索模型17-27
  • 2.1 向量空間模型(Vector Space Model,VSM)17-22
  • 2.1.1 基本概念17-18
  • 2.1.2 項的選取18-20
  • 2.1.3 權重計算20-22
  • 2.2 布爾模型22-24
  • 2.3 概率模型24-26
  • 2.4 本章小結26-27
  • 第三章 檢索系統(tǒng)的結構27-32
  • 3.1 一般流程27-28
  • 3.2 一個VSM系統(tǒng)的結構28-29
  • 3.3 本章小結29-32
  • 第四章 檢索系統(tǒng)效率問題的研究32-47
  • 4.1 文獻分類概述32-34
  • 4.2 層次分類方法34-39
  • 4.2.1 層次分類方法34-35
  • 4.2.2 類別層次35-36
  • 4.2.3 概念層次36
  • 4.2.4 特征向量的壓縮方法36-38
  • 4.2.5 層次分類結果38-39
  • 4.3 倒排文件39-45
  • 4.3.1 B樹40
  • 4.3.2 PAT樹40-41
  • 4.3.3 利用有序數組實現(xiàn)倒排文件41-42
  • 4.3.4 快速倒排算法42-45
  • 4.4 本章小結45-47
  • 第五章 檢索系統(tǒng)中的相關反饋47-54
  • 5.1 相關反饋47-48
  • 5.2 基本概念48-53
  • 5.3 結論53-54
  • 第六章 結束語54-57
  • 6.1 對于文本檢索的認識54-55
  • 6.2 本文的主要工作55
  • 6.3 未來的工作55-57
  • 參考文獻57-61
  • 致謝61
  • 下載全文 更多同類文獻

    CAJ全文下載

    (如何獲取全文? 歡迎:購買知網充值卡、在線充值、在線咨詢)

    CAJViewer閱讀器支持CAJ、PDF文件格式


    【相似文獻】

    中國期刊全文數據庫 前10條

    1 ;文本檢索[J];計算機應用研究;1986年02期

    2 林鴻飛,戰(zhàn)學剛,姚天順;文本特征區(qū)域與文本過濾的匹配機制[J];計算機工程與應用;2000年07期

    3 張霞;于崇蘭;;醫(yī)學圖像檢索研究[J];醫(yī)學信息;2010年07期

    4 曹冬林;林達真;;文本檢索模型綜述[J];心智與計算;2007年04期

    5 劉永泰;全文文本檢索技術及其發(fā)展[J];中國信息導報;1998年04期

    6 喬冬梅;搜索引擎文本檢索界面設計分析[J];圖書情報知識;2003年06期

    7 劉永丹,曾海泉,李榮陸,胡運發(fā);基于語義分析的傾向性文本過濾[J];通信學報;2004年07期

    8 王衛(wèi)玲;趙秀麗;張燕紅;王鳳芹;;文本過濾中的特征選擇[J];微計算機信息;2010年21期

    9 陸?zhàn)?徐偉;自然語言計算機情報檢索的初探——一個自動文本檢索原型系統(tǒng)[J];現(xiàn)代圖書情報技術;1991年02期

    10 李斌;TREC-3:文本檢索會議[J];管理科學文摘;1997年05期

    中國重要會議論文全文數據庫 前10條

    1 黃萱菁;夏迎炬;吳立德;;基于向量空間模型的文本過濾系統(tǒng)[A];輝煌二十年——中國中文信息學會二十周年學術會議論文集[C];2001年

    2 吳立德;黃萱菁;;文本檢索會議簡介[A];自然語言理解與機器翻譯——全國第六屆計算語言學聯(lián)合學術會議論文集[C];2001年

    3 趙林;夏迎炬;黃萱菁;吳立德;;基于Winnow算法的文本過濾[A];語言計算與基于內容的文本處理——全國第七屆計算語言學聯(lián)合學術會議論文集[C];2003年

    4 周水庚;胡江滔;胡運發(fā);周傲英;;基于隱含語義索引的中文文本檢索[A];第十七屆全國數據庫學術會議論文集(研究報告篇)[C];2000年

    5 付瑞吉;秦兵;劉挺;;面向音樂領域的文本檢索與挖掘系統(tǒng)[A];第五屆全國青年計算語言學研討會論文集[C];2010年

    6 李振星;徐澤平;;基于興趣模型的WEB信息預測采集過濾方法[A];第一屆學生計算語言學研討會論文集[C];2002年

    7 陳憶群;曹瑾音;印鑒;;查詢擴展樹:關系數據庫中的文本檢索[A];第二十三屆中國數據庫學術會議論文集(技術報告篇)[C];2006年

    8 馬春雷;;基于向量空間模型的中文文本檢索研究[A];2007年河北省電子學會、河北省計算機學會、河北省自動化學會、河北省人工智能學會、河北省計算機輔助設計研究會、河北省軟件行業(yè)協(xié)會聯(lián)合學術年會論文集[C];2007年

    9 朱祥玉;侯德文;陳希;;基于雙重評估函數的文本特征提取方法[A];山東省計算機學會2005年信息技術與信息化研討會論文集(二)[C];2005年

    10 張敏;馬亮;馬少平;陳群秀;;TREC2002介紹及清華大學實驗研究[A];語言計算與基于內容的文本處理——全國第七屆計算語言學聯(lián)合學術會議論文集[C];2003年

    中國重要報紙全文數據庫 前10條

    1 記者 龔杰;[N];計算機世界;2000年

    2 何清 史忠植 王偉;[N];計算機世界;2006年

    3 燕舞;[N];中華讀書報;2008年

    4 ;[N];網絡世界;2001年

    5 商報記者 江文兵;[N];北京現(xiàn)代商報;2005年

    6 記者 徐建華;[N];中國質量報;2010年

    7 記者 徐建華;[N];中國質量報;2010年

    8 嚴恒元;[N];經濟日報;2002年

    9 汪玉凱;[N];中國高新技術產業(yè)導報;2003年

    10 記者 侯梅竹;[N];計算機世界;2004年

    中國博士學位論文全文數據庫 前10條

    1 夏迎炬;文本過濾關鍵技術研究[D];復旦大學;2003年

    2 朱振方;基于微粒群和遺傳優(yōu)化的文本過濾關鍵技術研究[D];山東師范大學;2012年

    3 程軍;基于統(tǒng)計的文本分類技術研究[D];中國科學院研究生院(文獻情報中心);2003年

    4 劉永丹;文檔數據庫若干關鍵技術研究[D];復旦大學;2004年

    5 王鑫印;無結構和半結構信息檢索相關技術研究[D];復旦大學;2007年

    6 史慶偉;基于小世界模型的P2P網絡文本檢索[D];天津大學;2008年

    7 胡佳妮;文本挖掘中若干關鍵問題的研究[D];北京郵電大學;2008年

    8 陳毅恒;文本檢索結果聚類及類別標簽抽取技術研究[D];哈爾濱工業(yè)大學;2010年

    9 趙玉茗;文本間語義相關性計算及其應用研究[D];哈爾濱工業(yè)大學;2009年

    10 王占一;Web文本挖掘中若干問題的研究[D];北京郵電大學;2012年

    中國碩士學位論文全文數據庫 前10條

    1 張斌;基于主題的文本檢索[D];北京郵電大學;2011年

    2 劉力;不良文本過濾系統(tǒng)的研究與實現(xiàn)[D];復旦大學;2011年

    3 周俊;一種不良文本過濾方法[D];電子科技大學;2012年

    4 周聚;基于網絡信息審計的文本過濾的研究與實現(xiàn)[D];蘇州大學;2010年

    5 邵建雙;基于概念格的文本過濾系統(tǒng)的設計與實現(xiàn)[D];大連海事大學;2010年

    6 孫浩;基于主動學習的文本過濾系統(tǒng)的研究[D];北京郵電大學;2011年

    7 鄒俊杰;受限域問答系統(tǒng)文本檢索研究[D];昆明理工大學;2011年

    8 薛靜;中文信息檢索中相關算法的研究[D];遼寧科技大學;2007年

    9 李霞;文本過濾防火墻技術研究[D];北方工業(yè)大學;2011年

    10 汪前秀;基于改進的VSM的不良文本過濾模型研究[D];東北財經大學;2010年


      本文關鍵詞:中文信息檢索中相關算法的研究,由筆耕文化傳播整理發(fā)布。



    本文編號:198878

    資料下載
    論文發(fā)表

    本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/198878.html


    Copyright(c)文論論文網All Rights Reserved | 網站地圖 |

    版權申明:資料由用戶88ef3***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com