智慧搜索引擎軟件體系結(jié)構(gòu)設(shè)計及其關(guān)鍵技術(shù)研究
發(fā)布時間:2021-12-30 18:46
大數(shù)據(jù)應(yīng)用系統(tǒng)發(fā)展如火如荼,從互聯(lián)網(wǎng)、物聯(lián)網(wǎng)獲取數(shù)據(jù),提煉成信息或知識服務(wù)于各類用戶。網(wǎng)頁、感知數(shù)據(jù)集、數(shù)據(jù)集、各類結(jié)構(gòu)化數(shù)據(jù)、語義數(shù)據(jù)的查詢搜索是所有應(yīng)用系統(tǒng)的一項基本功能,而爬取、抽取、索引是其中的關(guān)鍵功能。本文圍繞以上幾點進行了如下工作:1、提出了智慧搜索引擎的軟件體系結(jié)構(gòu)。借鑒傳統(tǒng)搜索引擎模型的設(shè)計方法,分析智慧領(lǐng)域應(yīng)用,確定領(lǐng)域邊界、角色模型、業(yè)務(wù)模型、領(lǐng)域本體模型等,完成領(lǐng)域分析。在此基礎(chǔ)上,完成實體構(gòu)件、任務(wù)管理構(gòu)件、實體管理構(gòu)件、任務(wù)執(zhí)行構(gòu)件的設(shè)計。2、提出了基于本體的信息抽取方法。首先分析了各類網(wǎng)頁數(shù)據(jù)的異同,針對各自的特點選擇有針對性的方法進行網(wǎng)頁信息的抽取。重點研究使用基于統(tǒng)計的方法抽取自由文本中的領(lǐng)域知識,擴充本體實例庫。3、完成智慧搜索引擎原型系統(tǒng)的開發(fā)。以智慧安全領(lǐng)域為背景,利用已有的設(shè)計及數(shù)據(jù)資源,進行搜索引擎功能、界面的設(shè)計與實現(xiàn)。本文針對由互聯(lián)網(wǎng)與物聯(lián)網(wǎng)帶來的海量數(shù)據(jù),設(shè)計出能夠滿足智慧領(lǐng)域用戶多種需求的搜索引擎軟件體系結(jié)構(gòu),整合異構(gòu)數(shù)據(jù),提升搜索服務(wù)效果,支撐領(lǐng)域應(yīng)用。
【文章來源】:天津大學(xué)天津市 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:74 頁
【學(xué)位級別】:碩士
【部分圖文】:
搜索引擎發(fā)展歷史Archie可以看做是搜索引擎的祖先,它出現(xiàn)于1990年,McGill大學(xué)的學(xué)生
圖 3-1 平臺框架圖圖 3-1 定義了智慧搜索引擎的層次結(jié)構(gòu)及各層之間交互情況。平臺層次的劃分,規(guī)定了各部分的功能任務(wù),理清了平臺各部分間的界限。同時,從資源開始自底向上的劃分方式也展現(xiàn)了智慧搜索引擎從數(shù)據(jù)、信息、知識到最終支撐整個領(lǐng)域平臺的研究與設(shè)計路線。本平臺結(jié)構(gòu)總體上共分為資源層、獲取層、處理層、
圖 3-2 數(shù)據(jù)流圖如圖 3-2 所示,本節(jié)將具體分析領(lǐng)域系統(tǒng)內(nèi)的數(shù)據(jù)流。初始來源分為兩種,一種是互聯(lián)網(wǎng)的網(wǎng)頁數(shù)據(jù),一類是物聯(lián)網(wǎng)的感知數(shù)據(jù)。經(jīng)過爬取、抽取、本體實例擴充等環(huán)節(jié)的處理后,將數(shù)據(jù)轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù)并保存至相應(yīng)的數(shù)據(jù)庫中。整
【參考文獻】:
期刊論文
[1]創(chuàng)新2.0視野下的智慧城市[J]. 宋剛,鄔倫. 北京郵電大學(xué)學(xué)報(社會科學(xué)版). 2012(04)
[2]中文地名本體模型研究[J]. 蔣方玲,王文俊,楊鵬,徐佳佳. 計算機工程與應(yīng)用. 2011(25)
[3]Ontology自動創(chuàng)建中實例學(xué)習(xí)的研究[J]. 劉賀歡,劉椿年. 計算機應(yīng)用研究. 2006(03)
本文編號:3558773
【文章來源】:天津大學(xué)天津市 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:74 頁
【學(xué)位級別】:碩士
【部分圖文】:
搜索引擎發(fā)展歷史Archie可以看做是搜索引擎的祖先,它出現(xiàn)于1990年,McGill大學(xué)的學(xué)生
圖 3-1 平臺框架圖圖 3-1 定義了智慧搜索引擎的層次結(jié)構(gòu)及各層之間交互情況。平臺層次的劃分,規(guī)定了各部分的功能任務(wù),理清了平臺各部分間的界限。同時,從資源開始自底向上的劃分方式也展現(xiàn)了智慧搜索引擎從數(shù)據(jù)、信息、知識到最終支撐整個領(lǐng)域平臺的研究與設(shè)計路線。本平臺結(jié)構(gòu)總體上共分為資源層、獲取層、處理層、
圖 3-2 數(shù)據(jù)流圖如圖 3-2 所示,本節(jié)將具體分析領(lǐng)域系統(tǒng)內(nèi)的數(shù)據(jù)流。初始來源分為兩種,一種是互聯(lián)網(wǎng)的網(wǎng)頁數(shù)據(jù),一類是物聯(lián)網(wǎng)的感知數(shù)據(jù)。經(jīng)過爬取、抽取、本體實例擴充等環(huán)節(jié)的處理后,將數(shù)據(jù)轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù)并保存至相應(yīng)的數(shù)據(jù)庫中。整
【參考文獻】:
期刊論文
[1]創(chuàng)新2.0視野下的智慧城市[J]. 宋剛,鄔倫. 北京郵電大學(xué)學(xué)報(社會科學(xué)版). 2012(04)
[2]中文地名本體模型研究[J]. 蔣方玲,王文俊,楊鵬,徐佳佳. 計算機工程與應(yīng)用. 2011(25)
[3]Ontology自動創(chuàng)建中實例學(xué)習(xí)的研究[J]. 劉賀歡,劉椿年. 計算機應(yīng)用研究. 2006(03)
本文編號:3558773
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/3558773.html
最近更新
教材專著