基于自動(dòng)分詞的企業(yè)文檔搜索引擎設(shè)計(jì)與實(shí)現(xiàn).pdf 全文免費(fèi)在線閱讀
本文關(guān)鍵詞:基于自動(dòng)分詞的企業(yè)文檔搜索引擎設(shè)計(jì)與實(shí)現(xiàn),由筆耕文化傳播整理發(fā)布。
文檔介紹:
西北工業(yè)大學(xué)碩士學(xué)位論文基于自動(dòng)分詞的企業(yè)文檔搜索引擎設(shè)計(jì)與實(shí)現(xiàn)姓名:陳海波申請(qǐng)學(xué)位級(jí)別:碩士專業(yè):控制科學(xué)與工程指導(dǎo)教師:張新家20070301摘要隨著計(jì)算機(jī)和網(wǎng)絡(luò)的普及,越來越多的企業(yè)利用計(jì)算機(jī)對(duì)文檔進(jìn)行處理,在企業(yè)的運(yùn)營過程中必然會(huì)產(chǎn)生大量的電子文檔。如何在大量的電子文檔中迅速而準(zhǔn)確的檢索出用戶所需要的信息成為擺在人們面前的一大難題,為了解決這一問題本文設(shè)計(jì)了一個(gè)應(yīng)用于企業(yè)文檔檢索的中英文文檔搜索引擎系統(tǒng)。搜索引擎的設(shè)計(jì)涉及到中文分詞、數(shù)據(jù)收集、索引組織、檢索結(jié)果排序、用戶行為分析等關(guān)鍵技術(shù)。從功能上看,搜索引擎主要由信息采集、索引、查詢?nèi)糠謽?gòu)成。搜索引擎首先通過信息采集器采集文檔數(shù)據(jù),然后通過索引器對(duì)采集數(shù)據(jù)進(jìn)行分析,并建立索引。檢索器負(fù)責(zé)接受用戶查詢請(qǐng)求,通過索引找到所有相關(guān)文檔,排序后返回給用戶。首先,本文對(duì)中文搜索引擎的基礎(chǔ)技術(shù)一中文分詞技術(shù)進(jìn)行了介紹,并對(duì)中文自動(dòng)分詞的實(shí)現(xiàn)方法進(jìn)行了深入的研究。綜合各種分詞方法,實(shí)現(xiàn)了一種適用于企業(yè)文檔檢索的中文自動(dòng)分詞系統(tǒng);同時(shí)本文對(duì)搜索引擎的關(guān)鍵技術(shù):索引技術(shù)和檢索模型進(jìn)行了深入探討,提出了一種可用于數(shù)據(jù)庫存儲(chǔ)的雙向索引結(jié)構(gòu),有效降低了索引組織的復(fù)雜度,通過...
內(nèi)容來自轉(zhuǎn)載請(qǐng)標(biāo)明出處.
本文關(guān)鍵詞:基于自動(dòng)分詞的企業(yè)文檔搜索引擎設(shè)計(jì)與實(shí)現(xiàn),由筆耕文化傳播整理發(fā)布。
,本文編號(hào):186261
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/186261.html