油田網絡信息搜集與處理系統(tǒng)的設計與實現(xiàn)
發(fā)布時間:2018-01-22 18:47
本文關鍵詞: 油田 網絡情報 全文檢索 網絡信息收集引擎 出處:《電子科技大學》2012年碩士論文 論文類型:學位論文
【摘要】:當今世界是一個信息社會,信息成為政府、企業(yè)最重視的內容,而互聯(lián)網是一個巨大的網絡系統(tǒng),其中的信息浩如煙海,自然成了政府機關和企事業(yè)單位獲取信息的主要來源。 目前油田大多單位對互聯(lián)網信息的利用還停留在比較簡單的狀態(tài),,對互聯(lián)網信息最常見的應用就是通過搜索引擎去找;但是這種方式有很大的局限性:首先是不相關的信息太多,干擾了對正常信息的查找;其次是新舊信息混雜,很難找到最新的信息;而且搜索到的信息沒有經過分類整理,顯得特別雜亂無章。 為了滿足油田政府機關和企事業(yè)單位對專業(yè)網絡情報收集工作的要求,需要設計和實現(xiàn)油田網絡情報收集系統(tǒng)。 系統(tǒng)使用網絡信息收集引擎(Network Information Collect Engine),將預先指定的多個網站的內容即時復制到本地的數據庫,并利用全文檢索(Full-Text Search)技術和文檔相似性(Document Similarity)識別技術對信息庫內的信息進行識別,把內容基本一致的文檔歸并到一起,從而更有利于用戶檢索和使用。 系統(tǒng)的特色包括 1、搜集任務的靈活定制。 2、多目標數據源管理。 3、針對不同的目標數據源,進行不同的搜集配置,以確保能搜集到數據。 4、搜集任務調度管理,與目標站點同步更新,增量搜集。 5、搜集到數據結果,完成數據異構到同構的過程管理。 6、搜集結果發(fā)布管理。通過發(fā)布服務器,將數據發(fā)布到應用平臺。
[Abstract]:Today the world is an information society, information has become the government, enterprises attach the most importance to the content, and the Internet is a huge network system, in which the information is vast. Naturally, it has become a major source of information for government agencies, enterprises and institutions. At present, the use of Internet information by most oil field units is still in a relatively simple state. The most common application of Internet information is to find it through search engines. But this kind of way has the very big limitation: first is the irrelevant information too many, interferes to the normal information the search; The second is the mixture of new and old information, it is difficult to find the latest information; And search for information has not been sorted out, it is particularly chaotic. In order to meet the requirements of oil field government and enterprises for the collection of professional network information, it is necessary to design and implement the oil field network information collection system. The system uses Network Information Collect engine. Instantly copy the content of prespecified multiple Web sites to a local database. Full-Text search technique and document Similarityis also used to search the document in full text. Recognition technology to identify the information in the information base. It is more convenient for users to retrieve and use documents that are basically consistent in content. Features of the system include 1. Flexible customization of collection tasks. 2, multi-objective data source management. 3, for different target data sources, different collection configuration to ensure that data can be collected. 4, collection task scheduling management, and target site synchronization update, incremental collection. 5, collect the data result, complete the data isomorphism process management. 6, collect the result release management. Through the publishing server, the data will be published to the application platform.
【學位授予單位】:電子科技大學
【學位級別】:碩士
【學位授予年份】:2012
【分類號】:TP311.52
【參考文獻】
相關期刊論文 前3條
1 史庭俊 ,朱建明 ,馬建峰;網絡系統(tǒng)的安全和容錯模型的建立及分析[J];計算機工程與應用;2002年14期
2 陳衛(wèi),錢瑋,唐毅,方薇,馮立新;MIS開發(fā)相關技術研究[J];計算機工程與科學;2003年02期
3 張慶華;信息網絡動態(tài)安全體系模型綜述[J];計算機應用研究;2002年10期
本文編號:1455482
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1455482.html
教材專著