科技政策領(lǐng)域的個性化語義檢索系統(tǒng)研究
本文關(guān)鍵詞:科技政策領(lǐng)域的個性化語義檢索系統(tǒng)研究
更多相關(guān)文章: 科技政策 領(lǐng)域本體 個性化 語義檢索
【摘要】:隨著國家科技水平的不斷發(fā)展提高,科技政策逐漸成為我國政策體系中至關(guān)重要的部分,科技政策的相關(guān)研究也逐漸引起我國學(xué)術(shù)界以及政界等眾多學(xué)者的關(guān)注和重視。對于科技政策研究者來說,如何在大量政策文件中快速定位到自己感興趣的信息是他們十分關(guān)注的問題。針對目前信息檢索技術(shù)中忽略對語義信息和用戶信息等方面因素的考慮而導(dǎo)致查全率和查準(zhǔn)率較低的問題,本文在以《河北省科技政策數(shù)據(jù)管理服務(wù)平臺》項(xiàng)目系統(tǒng)為依托的背景下,對基于科技政策領(lǐng)域本體的語義關(guān)聯(lián)和用戶個性化信息檢索展開研究,主要研究內(nèi)容包括:(1)科技政策領(lǐng)域本體的構(gòu)建。本文是基于科技政策領(lǐng)域的研究,在中國科學(xué)院頒布的公文主題詞表的基礎(chǔ)上,分析科技政策領(lǐng)域特點(diǎn)并主要參照七步法來構(gòu)建科技政策領(lǐng)域本體。(2)深入研究信息檢索以及本體的相關(guān)知識與技術(shù),提出基于科技政策領(lǐng)域本體的概念語義擴(kuò)展方法,根據(jù)領(lǐng)域本體概念以及概念間關(guān)系等方面對用戶輸入的查詢進(jìn)行語義擴(kuò)展,以提高信息檢索結(jié)果的查全率。(3)深入研究Lucene搜索引擎、個性化信息檢索的相關(guān)知識與技術(shù),基于用戶信息以及查詢記錄,利用LDA主題模型來建立用戶興趣模型,獲取用戶某段時期所關(guān)注的對象內(nèi)容,并根據(jù)用戶模型優(yōu)化Lucene文檔評分計算方法,設(shè)計了依據(jù)用戶興趣實(shí)現(xiàn)的個性化信息檢索系統(tǒng),給出用戶模型的建立過程以及檢索排序算法的優(yōu)化過程。(4)以《河北省科技政策數(shù)據(jù)管理服務(wù)平臺》項(xiàng)目系統(tǒng)為依托,增加其全文檢索功能并進(jìn)行優(yōu)化,采用JSP語言在Lucene開源框架的基礎(chǔ)上構(gòu)建個性化信息檢索功能模塊,通過爬蟲來搜集科技政策文件信息,整理存儲到數(shù)據(jù)庫,然后構(gòu)建索引及實(shí)現(xiàn)查詢,根據(jù)語義擴(kuò)展檢索詞以及用戶興趣模型進(jìn)行文檔相似度計算,使系統(tǒng)更好理解用戶查詢語義信息,并且把與用戶興趣有關(guān)的文檔得分升高,進(jìn)而影響文檔的排名。最后通過實(shí)驗(yàn)驗(yàn)證本文方法,能夠提高系統(tǒng)檢索功能的查全率、查準(zhǔn)率以及實(shí)現(xiàn)個性化檢索,增強(qiáng)用戶查詢滿意度。
【關(guān)鍵詞】:科技政策 領(lǐng)域本體 個性化 語義檢索
【學(xué)位授予單位】:石家莊鐵道大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:TP391.3
【目錄】:
- 摘要3-4
- Abstract4-8
- 第一章 緒論8-14
- 1.1 課題研究背景與意義8-9
- 1.2 國內(nèi)外研究現(xiàn)狀9-12
- 1.2.1 科技政策研究現(xiàn)狀9-10
- 1.2.2 本體相關(guān)研究現(xiàn)狀10-11
- 1.2.3 個性化信息檢索研究現(xiàn)狀11-12
- 1.3 主要研究內(nèi)容12-13
- 1.4 論文組織結(jié)構(gòu)13-14
- 第二章 相關(guān)基本知識和技術(shù)14-23
- 2.1 領(lǐng)域本體相關(guān)知識14-16
- 2.1.1 領(lǐng)域本體構(gòu)建準(zhǔn)則14
- 2.1.2 領(lǐng)域本體構(gòu)建方法14-15
- 2.1.3 領(lǐng)域本體構(gòu)建工具15-16
- 2.1.4 領(lǐng)域本體的描述語言16
- 2.2 Jena簡介16-17
- 2.3 Lucene搜索引擎17-19
- 2.3.1 Lucene簡介17
- 2.3.2 Lucene系統(tǒng)結(jié)構(gòu)17-19
- 2.4 用戶興趣模型概述19-22
- 2.4.1 個性化檢索中用戶興趣模型建立19-20
- 2.4.2 用戶興趣模型表示方法20
- 2.4.3 LDA主題模型20-22
- 2.5 本章小結(jié)22-23
- 第三章 科技政策領(lǐng)域本體構(gòu)建23-34
- 3.1 科技政策領(lǐng)域本體構(gòu)建流程設(shè)計23-24
- 3.2 科技政策領(lǐng)域本體構(gòu)建過程24-30
- 3.2.1 確定本體領(lǐng)域及范圍24
- 3.2.2 考慮現(xiàn)有本體重用24-25
- 3.2.3 確定科技政策領(lǐng)域本體概念25-26
- 3.2.4 領(lǐng)域本體概念間關(guān)系26-27
- 3.2.5 定義概念的屬性27-29
- 3.2.6 添加實(shí)例29-30
- 3.3 科技政策領(lǐng)域本體表示與存儲30-33
- 3.4 本章小結(jié)33-34
- 第四章 基于科技政策領(lǐng)域本體的語義擴(kuò)展及個性化處理34-46
- 4.1 本體擴(kuò)展查詢34-39
- 4.1.1 查詢擴(kuò)展概述34-35
- 4.1.2 本體擴(kuò)展查詢流程35-37
- 4.1.3 本體概念語義相似度計算37-39
- 4.2 用戶興趣模型的構(gòu)建39-42
- 4.2.1 用戶興趣數(shù)據(jù)的采集39-40
- 4.2.2 基于LDA的用戶興趣模型建立40-42
- 4.3 Lucene個性化排序算法的實(shí)現(xiàn)42-45
- 4.3.1 Lucene排序算法介紹42-44
- 4.3.2 基于用戶興趣模型的排序算法改進(jìn)44-45
- 4.4 本章小結(jié)45-46
- 第五章 個性化語義檢索系統(tǒng)設(shè)計及實(shí)驗(yàn)分析46-59
- 5.1 科技政策領(lǐng)域個性化語義檢索系統(tǒng)設(shè)計46-53
- 5.1.1 系統(tǒng)框架整體設(shè)計46-47
- 5.1.2 系統(tǒng)各模塊的實(shí)現(xiàn)47-53
- 5.2 系統(tǒng)開發(fā)平臺及實(shí)驗(yàn)53-58
- 5.2.1 系統(tǒng)開發(fā)平臺及工具53
- 5.2.2 查全率、查準(zhǔn)率以及F值對比實(shí)驗(yàn)53-56
- 5.2.3 個性化測試實(shí)驗(yàn)56-58
- 5.3 本章小結(jié)58-59
- 第六章 總結(jié)與展望59-61
- 6.1 總結(jié)59-60
- 6.2 展望60-61
- 參考文獻(xiàn)61-65
- 致謝65-66
- 個人簡歷、在學(xué)期間的科研成果以及發(fā)表的學(xué)術(shù)論文66
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 張慧;蔣開偉;馮玉珉;;圖像和視頻的語義檢索[J];科技信息;2006年10期
2 李晨光;;基于本體的網(wǎng)絡(luò)問答式語義檢索系統(tǒng)[J];科技情報開發(fā)與經(jīng)濟(jì);2008年32期
3 黃敏;賴茂生;;語義檢索研究綜述[J];圖書情報工作;2008年06期
4 胡哲;鄭誠;王艷玲;;語義檢索關(guān)鍵技術(shù)研究[J];計算機(jī)技術(shù)與發(fā)展;2008年10期
5 劉珊慧;萬韻;楊樂;;基于本體的農(nóng)業(yè)信息資源語義檢索過程研究[J];安徽農(nóng)業(yè)科學(xué);2009年23期
6 楚書來;張瑞;;基于本體的語義檢索技術(shù)研究[J];黑龍江科技信息;2010年24期
7 付苓;崔新春;謝娟;連慧平;;基于語義信息鏈的語義檢索研究[J];山東圖書館學(xué)刊;2010年04期
8 張世勇;陳運(yùn)啟;;基于概念匹配的語義檢索模型研究[J];重慶工商大學(xué)學(xué)報(自然科學(xué)版);2010年05期
9 馬中杰;鄭誠;蘇喻;;一種基于知識庫的語義檢索系統(tǒng)模型[J];微型機(jī)與應(yīng)用;2010年20期
10 李林;王紅;付宇;楊璇;王靜;;民航突發(fā)事件應(yīng)急案例語義檢索方法研究[J];計算機(jī)工程與設(shè)計;2011年03期
中國重要會議論文全文數(shù)據(jù)庫 前7條
1 王洪俊 ;沈水榮 ;黃,
本文編號:1094614
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1094614.html