臺海領(lǐng)域的人立方關(guān)系搜索引擎的研究與實現(xiàn).pdf 全文免費在線閱讀
本文關(guān)鍵詞:臺海領(lǐng)域的人立方關(guān)系搜索引擎的研究與實現(xiàn),由筆耕文化傳播整理發(fā)布。
網(wǎng)友quality近日為您收集整理了關(guān)于臺海領(lǐng)域的人立方關(guān)系搜索引擎的研究與實現(xiàn)的文檔,希望對您的工作和學(xué)習(xí)有所幫助。以下是文檔介紹:密級:保密期限:辨言卻童大警碩士研究生學(xué)位論文題目:魚篷堡墊笪厶童友差丕墊塞互l莖數(shù)嬰塞皇塞理學(xué)號:.QZ5ZZ2一姓名:固懸專業(yè):鹽篡扭型堂皇堇丕.導(dǎo)師:王拍學(xué)院:讓篡扭堂院2010年1月12日2J—J_‘I/嬲愀獨創(chuàng)性(或創(chuàng)新性)聲明本人聲明所呈交的論文是本人在導(dǎo)師指導(dǎo)下進(jìn)行的研究工作及取得的研究成果。盡我所知,除了文中特別加以標(biāo)注和致謝中所羅列的內(nèi)容以外,論文中不包含其他人已經(jīng)發(fā)表或撰寫過的研究成果,也不包含為獲得北京郵電大學(xué)或其他教育機構(gòu)的學(xué)位或證書而使用過的材料。與我一同工作的同志對本研究所做的任何貢獻(xiàn)均已在論文中作了明確的說明并表示了謝意。申請學(xué)位論文與資料若有不實之處,本人承擔(dān)一切相關(guān)責(zé)任。本人簽名:均岔日期1.堡Z堡季珥岔關(guān)于論文使用授權(quán)的說明學(xué)位論文作者完全了解北京郵電大學(xué)有關(guān)保留和使用學(xué)位論文的規(guī)定,即:研究生在校攻讀學(xué)位期間論文工作的知識產(chǎn)權(quán)單位屬北京郵電大學(xué)。學(xué)校有權(quán)保留并向國家有關(guān)部門或機構(gòu)送交論文的復(fù)印件和磁盤,允許學(xué)位論文被查閱和借閱;學(xué)?梢怨紝W(xué)位論文的全部或部分內(nèi)容,可以允許采用影印、縮印或其它復(fù)制手段保存、匯編學(xué)位論文。(保密的學(xué)位論文在解密后遵守此規(guī)定)保密論文注釋:本學(xué)位論文屬于保密在年解密后適用本授權(quán)書。非保密論文注釋:本學(xué)位本人簽名:導(dǎo)師簽名:適用本授權(quán)書。日期:日期:4一北京郵電大學(xué)碩十學(xué)位論文臺海領(lǐng)域的人立方關(guān)系搜索引擎的研究與實現(xiàn)摘要搜索引擎技術(shù)可以提供信息檢索服務(wù),使得用戶在互聯(lián)網(wǎng)中可以快速,準(zhǔn)確地獲取感興趣的數(shù)據(jù)。隨著時間的發(fā)展,傳統(tǒng)的全文搜索引擎和垂直搜索引擎已經(jīng)不能滿足用戶的所有需求,一種新的搜索模式必將產(chǎn)生。特定領(lǐng)域的人立方關(guān)系搜索引擎是基于對象級別的垂直搜索引擎,它致力于將Web信息抽取、社會網(wǎng)絡(luò)分析等技術(shù)和傳統(tǒng)的檢索技術(shù)相結(jié)合,為用戶提供強大的檢索和社會網(wǎng)絡(luò)分析可視化能力。本文以臺海領(lǐng)域的新聞網(wǎng)頁作為研究數(shù)據(jù),針對搜索引擎、信息抽取的研究熱點及其相關(guān)技術(shù)進(jìn)行了深入的分析和研究,取得了如下研究成果:關(guān)系搜索引擎的網(wǎng)絡(luò)爬蟲。本文研究了網(wǎng)絡(luò)爬蟲的爬行算法、主題采集策略和遍歷優(yōu)先策略,提出了基于配置文件的定制爬行方法,實現(xiàn)了臺海領(lǐng)域主題的新聞網(wǎng)頁爬蟲。關(guān)系搜索引擎的網(wǎng)頁解析和主題過濾。在網(wǎng)頁解析方面,本文提出了一種結(jié)合HtmlParser技術(shù),基于特征的網(wǎng)頁解析方法;在主題過濾方面,本文采取了傳統(tǒng)的文本分類方法。關(guān)系搜索引擎信息抽取。本文實現(xiàn)了命名實體識別和實體關(guān)系提取。命名實體識別采取了基于最大熵模型的面向特定領(lǐng)域的實體識別方法,實體關(guān)系抽取則采用的是基于向量空間的實體關(guān)系提取方法。關(guān)系搜索引擎社會網(wǎng)絡(luò)的分析和展示。人立方關(guān)系搜索引擎力圖在互聯(lián)網(wǎng)的臺海領(lǐng)域中記錄人的社會活動信息,并揭示人與人之間關(guān)系的動態(tài)結(jié)構(gòu)圖景。本文提供了幾種社會網(wǎng)絡(luò)的分析方法,并支持可視化功能。最后,在對上述問題的研究和應(yīng)用的基礎(chǔ)上,本文構(gòu)建了一個臺海領(lǐng)域的人立方關(guān)系搜索引擎系統(tǒng),并對系統(tǒng)進(jìn)行了功能可用性驗證。關(guān)鍵詞:關(guān)系搜索引擎網(wǎng)絡(luò)爬蟲網(wǎng)頁解析信息抽取社會網(wǎng)絡(luò)分析.面向臺海關(guān)系的人立方系統(tǒng)的研究’J實現(xiàn)jjLI北京郵電人學(xué)頌L學(xué)位論文THERESEARCHANDIMPLEMENTATIONOFCU舊ICRELATIONSHIPSEARCHENGD厄INTAIⅥechnologycallprovideinformationretrievalservices,.Asthetimeby,thetraditionalfull-textsearchenginesandverticalsearchenginescannolongermeetalltheneedsofusers,andanewsearchpatternisboundtoproduce.CubicrelationshipsearchengineinTaiwanfieldisaverticalsearchenginebasedonobject-level.bineswebinformationextraction,workanalysisandthetraditionalsearchtechnologytoprovideuserswithmanypowerfulcapabilities,suchassearch,workanalysisandvisualization.Inthispaper,basedonthedataofChinesenewsinTaiwanfield,Wehavestudiedsearchengine,informationextractionandotherrelatedtechnologies,plementedarelationshipsearchenginewebcrawler.Thispaperhasstudiedcrawlingalgorithms,pagethemecollectionandpagetraversalstrategyinwebcrawler.plementedapageparserandpagethemefilterinrelationshipsearchengine.Parsingthewebpage,biningHTMLParsertechnology.Inthepagethemefiltering,plementedwebinformationextractioninrelationshipsearchengine.Webinformationextractionincludesnamedentityrecognitionandentityrelationshipextraction.Inthispaper,biningspecialfieldrules,plementedtheanalysisandvisualizationfunction.Therelationshipsearchengineistryingtorecordthepeople’.work.workanalysismethods,and北京郵電大學(xué)碩一l:workvisualization.Excepttheworkintroducedabove,thispaperhasimplementedthesystemofcubicrelationshipsearchengineinTaiwanfield.Atlast,thispapervalidatedthefunctionandapplicationofsystemwithsomecases.KEYWORDS:workanalysisJI北京郵電人學(xué)碩十學(xué)位論文目錄第一章緒論????????????????????????????l1.1選題背景及意義??????????????????????..11.2國內(nèi)外研究現(xiàn)狀??????????????????????..21.3本文主要工作????????????????????????31.4本文結(jié)構(gòu)??????????????????????????.
12>
播放器加載中,,請稍候...
系統(tǒng)無法檢測到您的Adobe Flash Player版本
建議您在線安裝最新版本的Flash Player 在線安裝
本文關(guān)鍵詞:臺海領(lǐng)域的人立方關(guān)系搜索引擎的研究與實現(xiàn),由筆耕文化傳播整理發(fā)布。
本文編號:157091
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/157091.html