天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

面向教學(xué)的Web信息集成技術(shù)研究

發(fā)布時(shí)間:2017-11-17 07:18

  本文關(guān)鍵詞:面向教學(xué)的Web信息集成技術(shù)研究


  更多相關(guān)文章: 教育 Web信息集成 分詞 試題分類(lèi)


【摘要】:隨著Web2.0和網(wǎng)絡(luò)技術(shù)的發(fā)展,網(wǎng)絡(luò)用戶(hù)不僅是Web信息的消費(fèi)者,也是Web信息的生產(chǎn)者,這就導(dǎo)致了網(wǎng)絡(luò)上的信息量呈爆炸性增長(zhǎng)。如何有效利用Web信息資源成為需要面對(duì)和解決的重要問(wèn)題。對(duì)于這個(gè)問(wèn)題,學(xué)者們也進(jìn)行了Web信息集成方面的一些研究,但是這些研究工作主要集中在新聞、電影、音樂(lè)、博客等領(lǐng)域,而面向教育領(lǐng)域的工作卻不多;诖,本文提出了一種面向教學(xué)的試題抽取與分類(lèi)方法,該方法基于用戶(hù)輸入的書(shū)籍名稱(chēng)和作者信息以及題型,自動(dòng)在Web中爬取相關(guān)的書(shū)籍目錄和試題,并通過(guò)計(jì)算書(shū)籍目錄和題目之間的相似度來(lái)進(jìn)行題目分類(lèi),從而可以達(dá)到自動(dòng)化地建立試題庫(kù)的目的。本文的主要工作如下:(1)提出了面向教學(xué)的書(shū)籍目錄抽取方法。通過(guò)研究發(fā)現(xiàn),由于亞馬遜上的書(shū)籍目錄相對(duì)其他網(wǎng)站(當(dāng)當(dāng)網(wǎng)、京東網(wǎng)等)比較完整,本文選擇了亞馬遜作為書(shū)籍目錄的數(shù)據(jù)源。當(dāng)用戶(hù)輸入書(shū)籍的名稱(chēng)和作者名時(shí),通過(guò)PHP語(yǔ)言的simplehtmldom爬蟲(chóng)技術(shù)和模式匹配,能夠從亞馬遜上爬取該書(shū)籍的目錄信息,然后通過(guò)DOM技術(shù)解析獲得該書(shū)籍的章節(jié)信息;(2)提出了面向教學(xué)的書(shū)籍試題抽取方法。本文主要在百度文庫(kù)上進(jìn)行書(shū)籍試題抽取,通過(guò)用戶(hù)輸入書(shū)籍名稱(chēng)和試題類(lèi)型來(lái)獲得該書(shū)籍的相關(guān)試題,在這個(gè)過(guò)程中,需要對(duì)爬取過(guò)的文本和鏈接通過(guò)隊(duì)列進(jìn)行去重,過(guò)濾之前已經(jīng)爬取得信息,然后對(duì)爬取得信息進(jìn)行解析,最后獲得每一道試題;(3)提出了面向教學(xué)的試題分類(lèi)方法,在爬取書(shū)籍目錄和書(shū)籍試題之后,通過(guò)下面步驟來(lái)進(jìn)行試題分類(lèi):首先,本文需要利用PHPAnalysis和TF-IDF方法對(duì)書(shū)籍目錄和試題進(jìn)行分詞和計(jì)算關(guān)鍵詞,然后使用Jaccard方法進(jìn)行相似度計(jì)算,獲得每道試題的所屬的章,即對(duì)試題進(jìn)行按章分類(lèi),最后存入試題庫(kù),達(dá)到按章出題的目的;(4)基于上面這些方法,本文使用PHP語(yǔ)言設(shè)計(jì)和開(kāi)發(fā)了一個(gè)原型系統(tǒng),原型系統(tǒng)主要包括兩方面的內(nèi)容:手動(dòng)輸入試題和自動(dòng)從網(wǎng)上集成試題,最后分類(lèi)到試題庫(kù)中。本文經(jīng)過(guò)實(shí)驗(yàn)驗(yàn)證了這些方法的準(zhǔn)確性和可行性。
【學(xué)位授予單位】:天津理工大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類(lèi)號(hào)】:TP311.52;TP393.09

【參考文獻(xiàn)】

中國(guó)期刊全文數(shù)據(jù)庫(kù) 前7條

1 王宇穎,侯爽,郭茂祖;題庫(kù)系統(tǒng)試卷自動(dòng)生成算法研究[J];哈爾濱工業(yè)大學(xué)學(xué)報(bào);2003年03期

2 袁占亭,張愛(ài)民,張秋余;基于概念的Web信息檢索[J];計(jì)算機(jī)工程與應(yīng)用;2003年36期

3 孟小峰;Web信息集成技術(shù)研究[J];計(jì)算機(jī)應(yīng)用與軟件;2003年11期

4 黃春毅;鄧紅軍;;一種自適應(yīng)搜索引擎的構(gòu)建研究[J];情報(bào)雜志;2006年02期

5 張科;;多次Hash快速分詞算法[J];計(jì)算機(jī)工程與設(shè)計(jì);2007年07期

6 沈賀丹;潘亞楠;邵良杉;;關(guān)于搜索引擎的研究綜述[J];計(jì)算機(jī)技術(shù)與發(fā)展;2006年04期

7 鄒嵩;趙詩(shī)陽(yáng);周新志;;垂直搜索引擎中分詞技術(shù)的算法研究[J];計(jì)算機(jī)技術(shù)與發(fā)展;2012年02期

中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前1條

1 趙寧;面向語(yǔ)義的信息集成中對(duì)查詢(xún)處理問(wèn)題的研究[D];山東大學(xué);2005年



本文編號(hào):1195229

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/ydhl/1195229.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶(hù)9da2a***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com