天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于Web的人物信息搜索關(guān)鍵問(wèn)題研究

發(fā)布時(shí)間:2017-04-25 02:11

  本文關(guān)鍵詞:基于Web的人物信息搜索關(guān)鍵問(wèn)題研究,由筆耕文化傳播整理發(fā)布。


【摘要】:互聯(lián)網(wǎng)技術(shù)的快速發(fā)展和網(wǎng)絡(luò)數(shù)據(jù)的爆發(fā)式增長(zhǎng),使得Web上積累了海量的信息資源,Web成為人們獲取信息的重要渠道。人是客觀活動(dòng)的主體,人物信息是一種很重要的資源,通過(guò)Web對(duì)人物信息進(jìn)行搜索是一種很常見(jiàn)的行為。但是海量的信息存在同時(shí)增加信息搜索的難度,如何準(zhǔn)確、快速、全面的把人們所需要的信息呈現(xiàn)出來(lái)是一個(gè)急需解決的問(wèn)題。 通用搜索技術(shù)某種程度上滿足了人們對(duì)人物信息搜索需求,但仍存在著一些問(wèn)題:社交媒體上存在大量的人物信息,但由于其特殊性,普通的信息獲取方式并不適用;人物存在重名現(xiàn)象,通用搜索引擎基于關(guān)鍵字匹配的排名方式,使得其對(duì)人物重名問(wèn)題的解決無(wú)能為力。 本文對(duì)上述兩個(gè)關(guān)鍵問(wèn)題進(jìn)行了研究,具體研究?jī)?nèi)容如下: 面向社交網(wǎng)站的個(gè)人信息搜索方法研究:對(duì)社交網(wǎng)站平臺(tái)和相關(guān)技術(shù)進(jìn)行了詳細(xì)調(diào)研,提出網(wǎng)頁(yè)解析和API查詢相結(jié)合的方法。實(shí)現(xiàn)了跨平臺(tái)的社交網(wǎng)站個(gè)人信息搜索系統(tǒng),該系統(tǒng)通過(guò)屬性匹配的方式解決人名歧義問(wèn)題,并對(duì)提取的信息進(jìn)行建模保存。 Web人物搜索中的人名消歧方法研究:在總結(jié)前人相關(guān)工作的基礎(chǔ)上,提出了一種基于組合特征的Web人名消歧方法,該方法通過(guò)提取人物網(wǎng)頁(yè)不同的特征信息,利用空間向量模型構(gòu)造組合特征向量,依據(jù)特征向量間的相似度比較,運(yùn)用層次聚類的方法實(shí)現(xiàn)人名消歧。 Web人名消歧原型系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn):在對(duì)Web人名消歧方法進(jìn)行研究的基礎(chǔ)上,研發(fā)了一個(gè)Web人名消歧原型系統(tǒng)。該工具接收人名輸入,運(yùn)用本文所提的人名消歧方法對(duì)通用搜索引擎的人名檢索結(jié)果進(jìn)行人名消歧,實(shí)現(xiàn)以聚類特征為標(biāo)簽的再排功能。在該原型系統(tǒng)上的實(shí)驗(yàn)表明,通過(guò)特征組合的方式增加聚類特征的準(zhǔn)確性,可以有效地提高人名消歧效果。
【關(guān)鍵詞】:Web人物搜索 社交網(wǎng)站 信息搜索 人名消歧 層次聚類
【學(xué)位授予單位】:中國(guó)科學(xué)技術(shù)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類號(hào)】:TP393.092
【目錄】:
  • 摘要5-6
  • ABSTRACT6-12
  • 第1章 引言12-18
  • 1.1 研究背景與意義12-13
  • 1.2 國(guó)內(nèi)外研究現(xiàn)狀13-16
  • 1.3 研究?jī)?nèi)容16-17
  • 1.4 論文結(jié)構(gòu)17-18
  • 第2章 相關(guān)概念與技術(shù)基礎(chǔ)18-26
  • 2.1 信息檢索簡(jiǎn)介18-19
  • 2.1.1 信息檢索18
  • 2.1.2 Web信息檢索18-19
  • 2.2 社交網(wǎng)絡(luò)相關(guān)概念19-22
  • 2.2.1 Deep Web概念19-20
  • 2.2.2 Deep Web數(shù)據(jù)獲取技術(shù)20-21
  • 2.2.3 OAuth授權(quán)21-22
  • 2.3 網(wǎng)頁(yè)清洗技術(shù)22-23
  • 2.4 文本表示模型23-24
  • 2.5 小結(jié)24-26
  • 第3章 社交網(wǎng)絡(luò)人物信息搜索方法研究26-38
  • 3.1 社交網(wǎng)絡(luò)平臺(tái)特殊性26
  • 3.2 社交網(wǎng)絡(luò)人物信息搜索方法26-29
  • 3.3 社交網(wǎng)絡(luò)人物信息搜索系統(tǒng)29-36
  • 3.3.1 社交網(wǎng)絡(luò)人物信息搜索系統(tǒng)設(shè)計(jì)29-30
  • 3.3.2 社交網(wǎng)絡(luò)人物信息搜索系統(tǒng)實(shí)現(xiàn)30-35
  • 3.3.3 實(shí)驗(yàn)與分析35-36
  • 3.4 小結(jié)36-38
  • 第4章 基于組合特征的Web人名消歧方法研究38-46
  • 4.1 Web人名消歧定義38-39
  • 4.2 Web人名消歧框架及方法39-45
  • 4.2.1 網(wǎng)頁(yè)預(yù)處理40
  • 4.2.2 特征提取40-41
  • 4.2.3 組合特征向量構(gòu)建41-43
  • 4.2.4 聚類算法43-45
  • 4.3 小結(jié)45-46
  • 第5章 Web人名消歧原型系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)46-60
  • 5.1 Web人名消歧系統(tǒng)總體設(shè)計(jì)46-47
  • 5.2 Web人名消歧系統(tǒng)詳細(xì)設(shè)計(jì)與實(shí)現(xiàn)47-53
  • 5.2.1 Web人物網(wǎng)頁(yè)獲取模塊47-49
  • 5.2.2 網(wǎng)頁(yè)文本處理模塊49-50
  • 5.2.3 人名消歧模塊50-51
  • 5.2.4 主要類結(jié)構(gòu)51-53
  • 5.3 實(shí)驗(yàn)與分析53-59
  • 5.3.1 實(shí)驗(yàn)數(shù)據(jù)53-54
  • 5.3.2 評(píng)測(cè)標(biāo)準(zhǔn)54
  • 5.3.3 實(shí)驗(yàn)過(guò)程與分析54-59
  • 5.4 小結(jié)59-60
  • 第6章 總結(jié)與展望60-62
  • 6.1 總結(jié)60-61
  • 6.2 展望61-62
  • 參考文獻(xiàn)62-66
  • 致謝66-68
  • 在讀期間發(fā)表的學(xué)術(shù)論文與取得的研究成果68

【參考文獻(xiàn)】

中國(guó)期刊全文數(shù)據(jù)庫(kù) 前5條

1 郎君;秦兵;宋巍;劉龍;劉挺;李生;;基于社會(huì)網(wǎng)絡(luò)的人名檢索結(jié)果重名消解[J];計(jì)算機(jī)學(xué)報(bào);2009年07期

2 王英帥;李培峰;朱巧明;;一種基于LDA和上下文摘要的Web人名消歧方法[J];計(jì)算機(jī)應(yīng)用與軟件;2011年07期

3 楊欣欣;李培峰;朱巧明;;基于網(wǎng)頁(yè)文本依存特征的人名消歧[J];計(jì)算機(jī)工程;2012年19期

4 李廣建,黃];元搜索引擎及其主要技術(shù)[J];情報(bào)科學(xué);2002年02期

5 肖冬梅;垂直搜索引擎研究[J];圖書(shū)館學(xué)研究;2003年02期


  本文關(guān)鍵詞:基于Web的人物信息搜索關(guān)鍵問(wèn)題研究,,由筆耕文化傳播整理發(fā)布。



本文編號(hào):325391

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/ydhl/325391.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶c961f***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com