專家發(fā)現(xiàn)平臺下搜索引擎的設計與實現(xiàn)
發(fā)布時間:2023-04-25 02:00
隨著地區(qū)經(jīng)濟增長速度放緩,區(qū)域創(chuàng)新與轉型已成為突破區(qū)域發(fā)展瓶頸的重要方向。而專家作為掌握最新學術知識與人才渠道的人,能夠對政府及企業(yè)進行指導建議,輸送人才,是區(qū)域創(chuàng)新中的重要角色。在實際的推動區(qū)域創(chuàng)新過程中,政府企業(yè)面對的主要問題就是如何在大量的學術數(shù)據(jù)中,定位滿足需求的專家信息。由于缺少可靠準確的信息源支持,政府與企業(yè)不能準確找到所需的專家人才,阻礙了區(qū)域創(chuàng)新發(fā)展。而專家信息的主要體現(xiàn)就是學術成果,通過獲取專家發(fā)表的學術論文數(shù)據(jù),分析專家的領域特征,構建出專家搜索引擎,就能夠幫助政府企業(yè)定位專家,推動區(qū)域創(chuàng)新發(fā)展。為了設計并實現(xiàn)專家搜索引擎,本文首先從知網(wǎng)獲取專家論文數(shù)據(jù)作為文本語料數(shù)據(jù),主要的研究工作包括:根據(jù)專家論文數(shù)據(jù)特征,研究專家檢索方法,引入作者主題模型,建立作者主題關系,并結合傳統(tǒng)的語言查詢模型,確定專家相關性的混合查詢模型;使用改進的PageRank網(wǎng)頁排序方法,進行專家重要性的排序;綜合相關性查詢模型和重要性排序模型,作為專家搜索引擎的檢索模型;處理專家論文數(shù)據(jù),并依照專家查詢模型,分別計算生成了語言模型倒排索引和作者主題模型倒排索引,存儲索引數(shù)據(jù),為專家搜索引擎提供...
【文章頁數(shù)】:64 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
縮略詞表
第一章 緒論
1.1 研究背景及意義
1.2 國內外研究現(xiàn)狀
1.2.1 專家檢索研究現(xiàn)狀
1.2.2 研究現(xiàn)狀小結
1.3 論文研究內容
1.4 論文組織結構
第二章 相關技術
2.1 搜索引擎相關概念
2.1.1 垂直搜索引擎的定義
2.1.2 垂直搜索引擎的特點
2.1.3 垂直搜索引擎的結構組成
2.2 搜索引擎技術
2.2.1 網(wǎng)絡爬蟲
2.2.2 倒排索引
2.2.3 鏈接分析
2.3 本章小結
第三章 專家檢索方法
3.1 語言查詢模型
3.2 主題查詢模型
3.2.1 主題模型
3.2.2 作者主題模型
3.2.3 基于作者主題模型的查詢方法
3.3 ExpertRank方法
3.3.1 PageRank
3.3.2 ExpertRank
3.3.3 算法設計與實現(xiàn)
3.4 綜合查詢方法
3.5 本章小結
第四章 專家倒排索引建立方法
4.1 數(shù)據(jù)獲取與預處理
4.1.1 爬取數(shù)據(jù)
4.1.2 數(shù)據(jù)預處理
4.2 索引建立方法的研究
4.2.1 建立語言查詢模型索引
4.2.2 建立作者主題查詢模型索引
4.2.3 索引存儲
4.3 本章小結
第五章 專家搜索引擎的設計實現(xiàn)
5.1 搜索引擎的總體設計
5.1.1 開發(fā)平臺
5.1.2 搜索引擎框架設計
5.1.3 搜索引擎流程設計
5.1.4 引擎數(shù)據(jù)庫設計
5.2 搜索引擎各模塊的設計與實現(xiàn)
5.2.1 數(shù)據(jù)獲取模塊
5.2.2 建立索引模塊
5.2.3 專家檢索模塊
5.2.4 專家排序模塊
5.3 搜索引擎展示
5.4 本章小結
第六章 驗證實驗及分析
6.1 作者主題聚類驗證
6.2 搜索引擎查詢驗證
6.2.1 查詢速度
6.2.2 查詢準確性
6.3 本章小結
第七章 總結與展望
7.1 總結
7.2 展望
致謝
參考文獻
本文編號:3800478
【文章頁數(shù)】:64 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
縮略詞表
第一章 緒論
1.1 研究背景及意義
1.2 國內外研究現(xiàn)狀
1.2.1 專家檢索研究現(xiàn)狀
1.2.2 研究現(xiàn)狀小結
1.3 論文研究內容
1.4 論文組織結構
第二章 相關技術
2.1 搜索引擎相關概念
2.1.1 垂直搜索引擎的定義
2.1.2 垂直搜索引擎的特點
2.1.3 垂直搜索引擎的結構組成
2.2 搜索引擎技術
2.2.1 網(wǎng)絡爬蟲
2.2.2 倒排索引
2.2.3 鏈接分析
2.3 本章小結
第三章 專家檢索方法
3.1 語言查詢模型
3.2 主題查詢模型
3.2.1 主題模型
3.2.2 作者主題模型
3.2.3 基于作者主題模型的查詢方法
3.3 ExpertRank方法
3.3.1 PageRank
3.3.2 ExpertRank
3.3.3 算法設計與實現(xiàn)
3.4 綜合查詢方法
3.5 本章小結
第四章 專家倒排索引建立方法
4.1 數(shù)據(jù)獲取與預處理
4.1.1 爬取數(shù)據(jù)
4.1.2 數(shù)據(jù)預處理
4.2 索引建立方法的研究
4.2.1 建立語言查詢模型索引
4.2.2 建立作者主題查詢模型索引
4.2.3 索引存儲
4.3 本章小結
第五章 專家搜索引擎的設計實現(xiàn)
5.1 搜索引擎的總體設計
5.1.1 開發(fā)平臺
5.1.2 搜索引擎框架設計
5.1.3 搜索引擎流程設計
5.1.4 引擎數(shù)據(jù)庫設計
5.2 搜索引擎各模塊的設計與實現(xiàn)
5.2.1 數(shù)據(jù)獲取模塊
5.2.2 建立索引模塊
5.2.3 專家檢索模塊
5.2.4 專家排序模塊
5.3 搜索引擎展示
5.4 本章小結
第六章 驗證實驗及分析
6.1 作者主題聚類驗證
6.2 搜索引擎查詢驗證
6.2.1 查詢速度
6.2.2 查詢準確性
6.3 本章小結
第七章 總結與展望
7.1 總結
7.2 展望
致謝
參考文獻
本文編號:3800478
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3800478.html
最近更新
教材專著