天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 搜索引擎論文 >

面向微博的醫(yī)學(xué)健康智能搜索的研究與應(yīng)用

發(fā)布時(shí)間:2017-06-06 20:16

  本文關(guān)鍵詞:面向微博的醫(yī)學(xué)健康智能搜索的研究與應(yīng)用,,由筆耕文化傳播整理發(fā)布。


【摘要】:隨著互聯(lián)網(wǎng)的廣泛應(yīng)用,web上的數(shù)據(jù)信息正在呈指數(shù)級(jí)增長(zhǎng),因此,如何在這種海量級(jí)的數(shù)據(jù)中查找到目標(biāo)信息并對(duì)其進(jìn)行自動(dòng)處理已成為當(dāng)前重點(diǎn)的研究課題,F(xiàn)在信息速度急劇上升,以微博、微信等新媒體所產(chǎn)生的巨大的碎片化信息極具代表性,新的研究方向是將這些傳統(tǒng)的領(lǐng)域知識(shí)與智能技術(shù)相結(jié)合,從而產(chǎn)生基于海量數(shù)據(jù)的智能搜索引擎。 本文主要介紹web上微博信息的采集與存儲(chǔ)、智能信息檢索的原理及相關(guān)算法與實(shí)現(xiàn)、數(shù)據(jù)挖掘中聚類算法與應(yīng)用等。利用新浪微博的API接口按照事先定義好的字段抓取相關(guān)內(nèi)容,將信息批量存入非關(guān)系型數(shù)據(jù)庫MongoDB中,利用Lucene4.0工具對(duì)MongoDB數(shù)據(jù)庫中已存入的信息建立索引文件并存放在本地,使用carrot2開源框架與建立好的索引文件進(jìn)行關(guān)聯(lián),carrot2是一個(gè)庫包,利用它可以建立一個(gè)基于聚類的搜索引擎,只要向這個(gè)基于聚類的搜索引擎提供搜索關(guān)鍵詞即可獲得相關(guān)結(jié)果集,對(duì)返回的結(jié)果集使用Lingo聚類算法對(duì)其進(jìn)行聚類操作,給用戶展現(xiàn)樹狀形式的聚類結(jié)果圖。通過上述實(shí)現(xiàn)的各個(gè)模塊,并且伴隨著生物醫(yī)學(xué)模式向“生物-心理-社會(huì)醫(yī)學(xué)”模式轉(zhuǎn)變以及人們對(duì)健康的要求越來越高,人們的認(rèn)識(shí)也從以疾病為中心轉(zhuǎn)向以患者或人為中心。最終本文建立起面向微博的基于醫(yī)學(xué)健康信息的智能搜索系統(tǒng)。 本論文在最后對(duì)系統(tǒng)中聚類結(jié)果進(jìn)行了優(yōu)化操作,主要對(duì)系統(tǒng)中Lingo聚類算法所引用的字典文件以及停用詞文件進(jìn)行修正,可以得到優(yōu)化后的聚類結(jié)果圖。為了本文中實(shí)現(xiàn)的智能搜索引擎系統(tǒng)能夠在未來應(yīng)用中得到擴(kuò)展,分析并提出了幾點(diǎn)可以改進(jìn)的意見,可以使系統(tǒng)在性能和功能上更加健壯、完善。
【關(guān)鍵詞】:微博MongoDB 智能信息檢索 carrot2 文本聚類 Lingo算法
【學(xué)位授予單位】:北京郵電大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2014
【分類號(hào)】:TP391.3
【目錄】:
  • 摘要4-5
  • ABSTRACT5-9
  • 第一章 緒論9-13
  • 1.1 研究背景和研究意義9-10
  • 1.2 研究的現(xiàn)狀和問題的提出10-11
  • 1.2.1 國(guó)內(nèi)外研究現(xiàn)狀10
  • 1.2.2 問題的提出10-11
  • 1.3 研究?jī)?nèi)容11-12
  • 1.3.1 主要研究?jī)?nèi)容11
  • 1.3.2 當(dāng)前研究重點(diǎn)11-12
  • 1.3.3 本文的創(chuàng)新之處12
  • 1.4 論文結(jié)構(gòu)12-13
  • 第二章 關(guān)鍵技術(shù)的研究13-42
  • 2.1 智能信息檢索的基本原理與組成13-25
  • 2.1.1 概述13
  • 2.1.2 Web信息采集13-14
  • 2.1.3 詞項(xiàng)詞典和文檔分析14-16
  • 2.1.4 索引構(gòu)建和壓縮16-18
  • 2.1.5 文檔的評(píng)分18-20
  • 2.1.6 信息檢索反饋20
  • 2.1.7 聚類算法20-24
  • 2.1.8 Web智能搜索24-25
  • 2.2 微博信息抓取技術(shù)的研究25-27
  • 2.2.1 新浪微博概述25-26
  • 2.2.2 新浪微博API接口26-27
  • 2.3 信息存儲(chǔ)技術(shù)的研究27-32
  • 2.3.1 海量數(shù)據(jù)介紹27-28
  • 2.3.2 數(shù)據(jù)存儲(chǔ)方式分類28-31
  • 2.3.3 Mongodb數(shù)據(jù)庫的應(yīng)用31-32
  • 2.4 索引的應(yīng)用32-35
  • 2.4.1 索引的概念32
  • 2.4.2 Lucene工具32-33
  • 2.4.3 索引的建立33-35
  • 2.5 搜索引擎中聚類算法的研究和應(yīng)用35-38
  • 2.5.1 聚類介紹35
  • 2.5.2 聚類算法的選擇和應(yīng)用35-38
  • 2.6 信息搜索技術(shù)的研究與應(yīng)用38-41
  • 2.6.1 搜索的定義38
  • 2.6.2 基于概率搜索的研究38-39
  • 2.6.3 基于語言建模的信息搜索技術(shù)的研究39-40
  • 2.6.4 搜索的應(yīng)用40-41
  • 2.7 本章小結(jié)41-42
  • 第三章 智能搜索系統(tǒng)的設(shè)計(jì)42-49
  • 3.1 智能搜索系統(tǒng)的需求概述42
  • 3.2 智能搜索系統(tǒng)的總體結(jié)構(gòu)設(shè)計(jì)42-44
  • 3.2.1 總體框架42-43
  • 3.2.2 Carrot2介紹43-44
  • 3.3 智能搜索系統(tǒng)的數(shù)據(jù)存儲(chǔ)設(shè)計(jì)44-47
  • 3.4 智能搜索系統(tǒng)的開發(fā)和運(yùn)行環(huán)境47-48
  • 3.5 系統(tǒng)開發(fā)的可行性分析48
  • 3.6 本章小結(jié)48-49
  • 第四章 智能搜索系統(tǒng)的實(shí)現(xiàn)49-64
  • 4.1 微博信息抓取模塊49-50
  • 4.2 微博信息存儲(chǔ)模塊50-54
  • 4.3 用戶創(chuàng)建索引模塊54-57
  • 4.4 微博信息搜索模塊57-61
  • 4.5 微博信息聚類模塊61-63
  • 4.6 本章小結(jié)63-64
  • 第五章 智能搜索系統(tǒng)的性能測(cè)試與優(yōu)化64-66
  • 第六章 總結(jié)與展望66-68
  • 6.1 課題研究小結(jié)66-67
  • 6.2 下一步研究工作展望67-68
  • 參考文獻(xiàn)68-69
  • 致謝69-70
  • 攻讀學(xué)位期間發(fā)表的學(xué)術(shù)論文目錄70

【參考文獻(xiàn)】

中國(guó)期刊全文數(shù)據(jù)庫 前6條

1 劉文婷;滕奇志;;后綴樹聚類在專用搜索引擎中的應(yīng)用研究與改進(jìn)[J];成都信息工程學(xué)院學(xué)報(bào);2010年03期

2 李虎;田金文;王緩緩;石勇;;基于Ontology的數(shù)據(jù)庫自然語言查詢接口的研究[J];計(jì)算機(jī)科學(xué);2010年06期

3 蘇坤,夏旭;搜索引擎分類研究的現(xiàn)狀與發(fā)展[J];圖書館論壇;2005年01期

4 張興華;智能搜索引擎的機(jī)理、實(shí)現(xiàn)技術(shù)及發(fā)展趨勢(shì)[J];現(xiàn)代情報(bào);2003年12期

5 雷立異,岳一平;重視醫(yī)院社會(huì)屬性,促進(jìn)醫(yī)院管理模式的轉(zhuǎn)變[J];西北民族學(xué)院學(xué)報(bào)(自然科學(xué)版);2002年02期

6 馬勇;;一種改進(jìn)的K-means聚類分析算法在醫(yī)院信息系統(tǒng)中的應(yīng)用研究[J];信息資源管理學(xué)報(bào);2012年03期


  本文關(guān)鍵詞:面向微博的醫(yī)學(xué)健康智能搜索的研究與應(yīng)用,由筆耕文化傳播整理發(fā)布。



本文編號(hào):427425

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/427425.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶514de***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com