基于HTML5的文檔大綱分析器的設(shè)計(jì)與實(shí)現(xiàn)
本文關(guān)鍵詞:基于HTML5的文檔大綱分析器的設(shè)計(jì)與實(shí)現(xiàn)
【摘要】:迅猛發(fā)展的計(jì)算機(jī)、多媒體技術(shù),使得互聯(lián)網(wǎng)已成為人們?cè)L問(wèn)信息的數(shù)據(jù)的最大來(lái)源。目前,大多數(shù)互聯(lián)網(wǎng)的應(yīng)用程序檢索信息中,始終是以互聯(lián)網(wǎng)上網(wǎng)頁(yè)被視為無(wú)法再分的整體,信息存儲(chǔ)和檢索都是以網(wǎng)頁(yè)為最小基本單位進(jìn)行的。但寫成的Web頁(yè)和Web內(nèi)容變得更加復(fù)雜多樣,網(wǎng)頁(yè)往往包含了很多復(fù)雜的多種信息,但是網(wǎng)頁(yè)往往因?yàn)闉榱嗣烙^有過(guò)多的修飾,或者摻雜著一些無(wú)關(guān)緊要的廣告等與人們需要的信息毫無(wú)關(guān)系的內(nèi)容。 上述影響返回內(nèi)容的精度的信息仍然存在于信息檢索系統(tǒng)所得到的最后結(jié)果中,當(dāng)檢索系統(tǒng)將檢索出的網(wǎng)頁(yè)準(zhǔn)確的反饋給用戶,用戶在面對(duì)一篇龐大而復(fù)雜的新網(wǎng)頁(yè)是,就會(huì)眼花繚亂,很多時(shí)候,本地保存的文檔更是不含有檢索功能的,用戶想要找到所需的內(nèi)容必須將文檔從頭翻到最后,仍然有可能一無(wú)所獲。所以,正確提取網(wǎng)頁(yè)及文檔的主題信息有著重要的意義,可以幫助用戶快速了解網(wǎng)頁(yè)及文檔的內(nèi)容。 本文主要包括以下研究?jī)?nèi)容: 1、通過(guò)分析國(guó)內(nèi)外的信息化發(fā)展,分了目前信息檢索系統(tǒng)存在的問(wèn)題和難點(diǎn),鑒于此提出課題的研究目的、內(nèi)容和意義,并且論述了信息提取的技術(shù)在國(guó)內(nèi)外的研究現(xiàn)狀。 2、對(duì)系統(tǒng)設(shè)計(jì)過(guò)程中理論基礎(chǔ)和所使用的關(guān)鍵技術(shù)進(jìn)行介紹,包括它們的特點(diǎn)、使用平臺(tái)等。 3、主要是分析和介紹了系統(tǒng)的需求分析。HTML5文檔大綱分析器的需求分析主要包括系統(tǒng)的是否可行,包括運(yùn)行是否可行和技術(shù)是否可行;然后著重介紹并分析了本系統(tǒng)中主要的功能模塊需求。接著,從非功能方面對(duì)系統(tǒng)需求進(jìn)行了分析,介紹了系統(tǒng)的設(shè)計(jì)原則與注意事項(xiàng)。 4、主要是介紹系統(tǒng)設(shè)計(jì)開(kāi)發(fā)及代碼實(shí)現(xiàn)方面的工作。按照軟件開(kāi)發(fā)的嚴(yán)格流程,本章從系統(tǒng)的設(shè)計(jì)目標(biāo)入手,接著介紹系統(tǒng)的概要設(shè)計(jì),介紹了系統(tǒng)的功能結(jié)構(gòu)設(shè)計(jì),并對(duì)這部分進(jìn)行了設(shè)計(jì),介紹了所需要的實(shí)現(xiàn)內(nèi)容以及設(shè)計(jì)思路以及代碼實(shí)現(xiàn)。 5、總結(jié)了設(shè)計(jì)和實(shí)現(xiàn)該套系統(tǒng)的最終效果和成果,并且分析了系統(tǒng)中存在的問(wèn)題,并進(jìn)行了進(jìn)一步的展望以及下一步的工作?傊,通過(guò)對(duì)該課題的研究,并在企業(yè)采購(gòu)部成功實(shí)施PDM系統(tǒng),為同行業(yè)的信息化建設(shè)提供成功的應(yīng)用示范和經(jīng)驗(yàn),為促進(jìn)同行業(yè)產(chǎn)業(yè)結(jié)構(gòu)的調(diào)整和管理機(jī)制的創(chuàng)新奠定了基礎(chǔ)。
【學(xué)位授予單位】:吉林大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類號(hào)】:TP311.52
【參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 張彥超;劉云;李勇;沈波;;基于自動(dòng)生成模板的Web信息抽取技術(shù)[J];北京交通大學(xué)學(xué)報(bào);2009年05期
2 肖繪酈;李建偉;勾學(xué)榮;;基于課程領(lǐng)域本體智能答疑的應(yīng)用研究[J];北京郵電大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版);2008年01期
3 馬海龍;曾慶軍;;互聯(lián)網(wǎng)協(xié)議和技術(shù)的新進(jìn)展[J];廣播電視信息;2014年02期
4 周必水;蔣鵬;;基于語(yǔ)義網(wǎng)的電子政務(wù)文檔檢索技術(shù)的實(shí)現(xiàn)[J];杭州電子科技大學(xué)學(xué)報(bào);2006年04期
5 李蕾;王勁林;白鶴;胡晶晶;;基于FFT的網(wǎng)頁(yè)正文提取算法研究與實(shí)現(xiàn)[J];計(jì)算機(jī)工程與應(yīng)用;2007年30期
6 王志琪;王永成;;HTML文件的文本信息預(yù)處理技術(shù)[J];計(jì)算機(jī)工程;2006年05期
7 于滿泉,陳鐵睿,許洪波;基于分塊的網(wǎng)頁(yè)信息解析器的研究與設(shè)計(jì)[J];計(jì)算機(jī)應(yīng)用;2005年04期
8 熊圣芬;賀智明;王俊;;基于JavaScript和DOM的動(dòng)態(tài)表單設(shè)計(jì)及數(shù)據(jù)提交[J];江西理工大學(xué)學(xué)報(bào);2009年01期
9 王海波;張潤(rùn);王兆華;;支持HTML5結(jié)構(gòu)分析的語(yǔ)義Web框架JenaPro[J];計(jì)算機(jī)與現(xiàn)代化;2013年06期
10 丁晟春,顧德訪;Jena在實(shí)現(xiàn)基于Ontology的語(yǔ)義檢索中的應(yīng)用研究[J];現(xiàn)代圖書情報(bào)技術(shù);2005年10期
,本文編號(hào):1166782
本文鏈接:http://sikaile.net/wenyilunwen/guanggaoshejilunwen/1166782.html