天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 搜索引擎論文 >

光盤庫搜索引擎的設(shè)計與實現(xiàn)

發(fā)布時間:2020-07-23 04:22
【摘要】:隨著大數(shù)據(jù)時代的到來,某些企業(yè)機構(gòu)迅速積累了大量重要數(shù)據(jù)。光盤庫為海量重要數(shù)據(jù)提供了長期保存和便捷使用的技術(shù)手段,主要應(yīng)用在數(shù)據(jù)備份、數(shù)據(jù)歸檔系統(tǒng)中。為便于數(shù)據(jù)管理和利用,以上兩種系統(tǒng)需要配備相應(yīng)的檢索機制。傳統(tǒng)的檢索機制根據(jù)人為添加的檢索信息查找文獻(xiàn),可利用的信息量少,處理效率低。搜索引擎多用于互聯(lián)網(wǎng)信息的檢索,且一般采用全文檢索技術(shù),可以幫助用戶在短時間內(nèi)根據(jù)關(guān)鍵字找到全面且準(zhǔn)確的網(wǎng)絡(luò)資源。在光盤庫系統(tǒng)中引入搜索引擎技術(shù),能為用戶提供更加便捷的檢索服務(wù),同時提升光盤庫的使用效率。 為了給光盤庫建立一個全文檢索系統(tǒng),研究了全文檢索搜索引擎的工作原理,分析了光盤庫系統(tǒng)架構(gòu)和多級存儲系統(tǒng)的性質(zhì),研究了常見的檢索模型。使用各類文本提取工具實現(xiàn)了不同類型文檔內(nèi)容的提取;使用ICTCLAS30分詞工具完成中文分詞的功能;按照傳統(tǒng)的倒排索引方案建立索引數(shù)據(jù)庫,結(jié)合光盤庫的文件管理數(shù)據(jù)庫共同構(gòu)成了光盤庫的索引系統(tǒng);為減少光盤庫換盤操作,給出了針對光盤庫檢索的排序方法;實現(xiàn)了支持布爾查詢與結(jié)果排序的檢索服務(wù)器;使用VC++6.0開發(fā)工具設(shè)計了客戶端查詢程序的界面,完成了客戶端查詢程序的功能。 經(jīng)測試,搜索引擎能正確給出與關(guān)鍵字相關(guān)的文檔列表,支持基本邏輯運算符的連接查詢,有較高的召回率和中等程度的精確率,并能在1秒以內(nèi)響應(yīng)用戶的查詢請求。
【學(xué)位授予單位】:華中科技大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2013
【分類號】:TP391.3
【圖文】:

光盤庫,行業(yè)市場,增長速度,單位


1994年的文獻(xiàn)記錄了應(yīng)用在麥迪根陸軍醫(yī)務(wù)中心(MAMC)圖片歸檔和交換系統(tǒng)(PACS)中的光盤庫存儲系統(tǒng)。他們使用的是KODAK 6800光盤庫,包含100個盤片兩個光驅(qū)。MAMC的光盤庫系統(tǒng)在1992年開始運行,當(dāng)時有500,000個圖片存放在該系統(tǒng)中[3]。近年來,由于單張光盤的存儲容量大大增加,光盤庫相較于常見的存儲設(shè)備如磁盤陣?yán)⒋艓斓葍r格性能優(yōu)勢越來越顯露出來。光盤庫作為一種存儲設(shè)備已開始漸漸被運用于各個領(lǐng)域,如銀行的票據(jù)影像存儲、保險機構(gòu)的資料存儲,以及其他所有的大容量近線資料存儲的場合。目前國外主流的光盤庫廠商有德國的 NETZON、DISC,美國的 PLASMON 以日本的 JVC。國內(nèi)的東波陣列信息公司研制的光盤庫樣機可智能存貯、管理 3000 張光盤,并能自動監(jiān)測、復(fù)制存儲信息,確保光盤永久保存。另外,通過外接若干個“光盤箱”,可存儲管理數(shù)萬甚至數(shù)十萬張光盤。圖 1.1 表明我國的光盤庫行業(yè)仍處于穩(wěn)步的增長中。

光盤庫,實物,換盤


2 相關(guān)理論與技術(shù)術(shù)有自動換盤機構(gòu)(機械手)的光盤網(wǎng)絡(luò)共機構(gòu)和驅(qū)動器三部分組成[7]。光盤庫一般光盤,因此能夠存放 50~600 片光盤。光盤庫通過高速 SCSI 端口與網(wǎng)絡(luò)服務(wù)器相聯(lián),自身接口與主機交換數(shù)據(jù)。用戶訪問光盤盤取出并放置到盤架上的指定位置,然后中。自動換盤機構(gòu)的換盤時間通常在秒級

光盤庫,關(guān)鍵字


(4) 響應(yīng)性能測試通過多客戶對搜索引擎在短時間的大量查詢訪問,測試搜索引擎在高負(fù)荷工作時的性能,即對用戶的相應(yīng)速度。這個實驗需要大量的數(shù)據(jù)進(jìn)行測試。測試程序從事先給出的關(guān)鍵詞表中隨機選擇一個關(guān)鍵詞進(jìn)行查詢。這樣不間斷的進(jìn)行 1000 次查詢,根據(jù)結(jié)果計算服務(wù)器的平均響應(yīng)時間。5.3 測試流程(1) 基本功能測試在查詢界面關(guān)鍵字的查詢框中輸入“光盤庫”作為關(guān)鍵字,然后點擊確定,返回了包含文件名、文件摘要、文件大小的文件列表,查詢結(jié)果如圖 5.1 所示。界面支持翻頁顯示,頁面中間顯示了頁號。界面下方顯示本次搜索耗時 436 毫秒,共搜到36 個文件。在查詢界面輸入“緩存”作為關(guān)鍵字,在 203 毫秒內(nèi)返回了 18 條結(jié)果。圖 5.2 顯示了結(jié)果列表的第二頁。

【參考文獻(xiàn)】

相關(guān)期刊論文 前7條

1 劉炫;何寧;陸體軍;賈惠波;;光盤鏡像技術(shù)在網(wǎng)絡(luò)光盤庫中的應(yīng)用研究[J];光電子·激光;2006年09期

2 何寧;;網(wǎng)絡(luò)化光盤庫在海量存儲系統(tǒng)中的應(yīng)用研究[J];記錄媒體技術(shù);2004年05期

3 陳俊杰,薛云,宋翰濤,陸玉昌,余雪麗;基于Agent的元搜索引擎的研究與設(shè)計[J];計算機工程與應(yīng)用;2003年10期

4 張衛(wèi)豐;徐寶文;周曉宇;許蕾;李東;;Web搜索引擎綜述[J];計算機科學(xué);2001年09期

5 孫文慧;魏幼平;;基于Xapian和PHP的高性能站內(nèi)搜索系統(tǒng)方案設(shè)計[J];計算機與現(xiàn)代化;2012年04期

6 馬張華;分類搜索引擎類目體系研究[J];圖書情報工作;2001年02期

7 張紅斌;曹義親;;混合多層分類和樸素貝葉斯模型的垂直搜索引擎分類器設(shè)計[J];現(xiàn)代圖書情報技術(shù);2011年03期



本文編號:2766843

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2766843.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶09d52***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com