基于自動分詞的企業(yè)文檔搜索引擎設(shè)計與實現(xiàn).pdf 全文免費在線閱讀
本文關(guān)鍵詞:基于自動分詞的企業(yè)文檔搜索引擎設(shè)計與實現(xiàn),由筆耕文化傳播整理發(fā)布。
文檔介紹:
西北工業(yè)大學(xué)碩士學(xué)位論文基于自動分詞的企業(yè)文檔搜索引擎設(shè)計與實現(xiàn)姓名:陳海波申請學(xué)位級別:碩士專業(yè):控制科學(xué)與工程指導(dǎo)教師:張新家20070301摘要隨著計算機(jī)和網(wǎng)絡(luò)的普及,越來越多的企業(yè)利用計算機(jī)對文檔進(jìn)行處理,在企業(yè)的運營過程中必然會產(chǎn)生大量的電子文檔。如何在大量的電子文檔中迅速而準(zhǔn)確的檢索出用戶所需要的信息成為擺在人們面前的一大難題,為了解決這一問題本文設(shè)計了一個應(yīng)用于企業(yè)文檔檢索的中英文文檔搜索引擎系統(tǒng)。搜索引擎的設(shè)計涉及到中文分詞、數(shù)據(jù)收集、索引組織、檢索結(jié)果排序、用戶行為分析等關(guān)鍵技術(shù)。從功能上看,搜索引擎主要由信息采集、索引、查詢?nèi)糠謽?gòu)成。搜索引擎首先通過信息采集器采集文檔數(shù)據(jù),然后通過索引器對采集數(shù)據(jù)進(jìn)行分析,并建立索引。檢索器負(fù)責(zé)接受用戶查詢請求,通過索引找到所有相關(guān)文檔,排序后返回給用戶。首先,本文對中文搜索引擎的基礎(chǔ)技術(shù)一中文分詞技術(shù)進(jìn)行了介紹,并對中文自動分詞的實現(xiàn)方法進(jìn)行了深入的研究。綜合各種分詞方法,實現(xiàn)了一種適用于企業(yè)文檔檢索的中文自動分詞系統(tǒng);同時本文對搜索引擎的關(guān)鍵技術(shù):索引技術(shù)和檢索模型進(jìn)行了深入探討,提出了一種可用于數(shù)據(jù)庫存儲的雙向索引結(jié)構(gòu),有效降低了索引組織的復(fù)雜度,通過...
內(nèi)容來自轉(zhuǎn)載請標(biāo)明出處.
本文關(guān)鍵詞:基于自動分詞的企業(yè)文檔搜索引擎設(shè)計與實現(xiàn),由筆耕文化傳播整理發(fā)布。
,本文編號:186261
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/186261.html