天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

信息抽取技術(shù)在移動(dòng)學(xué)習(xí)資源建設(shè)中的應(yīng)用研究

發(fā)布時(shí)間:2022-01-11 22:37
  在網(wǎng)絡(luò)教學(xué)資源極為豐富的今天,從網(wǎng)頁(yè)中自動(dòng)抽取多媒體類及文本類教學(xué)資源切片,建立移動(dòng)學(xué)習(xí)資源庫(kù),既充分提高了現(xiàn)有資源的利用率,也為現(xiàn)有電子書(shū)包等移動(dòng)學(xué)習(xí)終端提供了豐富的資源來(lái)源。文章結(jié)合移動(dòng)學(xué)習(xí)微內(nèi)容設(shè)計(jì)要求,根據(jù)多媒體HTML標(biāo)簽特點(diǎn),及文本類資源遞歸表達(dá)特征,提出了基于信息抽取的移動(dòng)學(xué)習(xí)資源片段自動(dòng)抽取的技術(shù)方案,該方案可以實(shí)時(shí)自動(dòng)地從Web頁(yè)面中抽取圖片、音視頻等多媒體資源切片及填空、選擇題等移動(dòng)學(xué)習(xí)資源切片。實(shí)驗(yàn)結(jié)果表明,方案整體準(zhǔn)確率達(dá)85.4%,召回率達(dá)79.0%,時(shí)間性能上,可以在113.9小時(shí)內(nèi)獲取186,133個(gè)移動(dòng)學(xué)習(xí)資源切片。該自動(dòng)化的移動(dòng)學(xué)習(xí)資源抽取技術(shù)方案具有較高的實(shí)用性,也是現(xiàn)有大數(shù)據(jù)技術(shù)在資源建設(shè)方面的應(yīng)用之一。 

【文章來(lái)源】:電化教育研究. 2018,39(03)北大核心CSSCI

【文章頁(yè)數(shù)】:7 頁(yè)

【部分圖文】:

信息抽取技術(shù)在移動(dòng)學(xué)習(xí)資源建設(shè)中的應(yīng)用研究


Web 教學(xué)資源微型化技術(shù)方案

行為模式,遞歸,標(biāo)簽


?2.多媒體資源抽取課件、圖片、音頻、視頻等資源在文件實(shí)體上相對(duì)獨(dú)立,所以可以直接根據(jù)其在網(wǎng)頁(yè)HTML源碼中的標(biāo)簽、屬性等,利用相應(yīng)的正則表達(dá)式進(jìn)行抽取,非文本類多媒體資源相應(yīng)的HTML5標(biāo)簽與屬性特征見(jiàn)表1。早期版本的HTML4標(biāo)簽、屬性與此類似,這里不再贅述。表1非文本類切片資源抽取標(biāo)簽與表1相對(duì)應(yīng)的HTML多媒體標(biāo)簽的模式匹配,可以用正則表達(dá)式來(lái)表示,見(jiàn)表2。表2基于正則表達(dá)式的多媒體資源抽取方法舉例(三)長(zhǎng)文本分割行業(yè)文檔都有其規(guī)律性特征,該特征可以概括為用戶的遞歸行為模式[23],如圖2所示。圖2用戶的遞歸行為模式教案(知識(shí)點(diǎn),知識(shí)目標(biāo),情感目標(biāo),過(guò)程與方法,教學(xué)重難點(diǎn),教學(xué)內(nèi)容,來(lái)源站點(diǎn)……)填空(知識(shí)點(diǎn),題干,答案,來(lái)源站點(diǎn)……)選擇題(知識(shí)點(diǎn),題干,選項(xiàng)A,選項(xiàng)B,選項(xiàng)C,選項(xiàng)D,來(lái)源站點(diǎn)……)文獻(xiàn)(知識(shí)點(diǎn),正文,來(lái)源站點(diǎn)……)(2)資源類型抽取規(guī)則標(biāo)簽屬性HTML源碼舉例課件ppt、swf、gsp等類型超級(jí)鏈接ahref、alt<ahref='./uploads/temp-late/sibianxing-bianhua.gsp'>幾何畫(huà)板演示平行四邊形的變化</a>圖片img類標(biāo)簽src所指向圖片網(wǎng)址imgsrc、alt<imgalt="荷塘月色圖片"src="/pic/lotus.jpg"/>音頻音頻標(biāo)簽audiosrc、title<audiosrc="/i/horse.wav"controls="controls"Title="Horse">視頻視頻標(biāo)簽videosrc、title<videosrc="/i/bear.ogg"controls="controls"title="bear">正則表達(dá)式說(shuō)明匹配內(nèi)容<h1.*?</h1>網(wǎng)頁(yè)中標(biāo)題,如:<h1>教育資源</h1><.+?>HTML標(biāo)簽,如:<img>、<audio>、<video>等標(biāo)簽(href|src)\s*=\s*[“’][^”’#]+[“’]網(wǎng)頁(yè)中的超鏈接,如:href=“http://baidu.com”92

實(shí)驗(yàn)軟件,環(huán)境,實(shí)驗(yàn)結(jié)果,基礎(chǔ)教育資源


蟹指、微型?腦歟??⒎岣壞囊貧??習(xí)資源庫(kù)。實(shí)驗(yàn)方案既要驗(yàn)證各環(huán)節(jié)算法的可靠性,還需對(duì)方案的數(shù)據(jù)采集性能和資源切片、提取的整體性能進(jìn)行分析,具體包括數(shù)據(jù)采集、網(wǎng)頁(yè)解析與多媒體資源提取和文本類資源分割、微型化的時(shí)間性能,以及相應(yīng)的準(zhǔn)確率和召回率。(一)實(shí)驗(yàn)環(huán)境研究中,實(shí)驗(yàn)硬件環(huán)境是8臺(tái)PC機(jī)建立的Hadoop大數(shù)據(jù)集群,PC的配置是Core22.53GHzCPU+4GB內(nèi)存,其中1臺(tái)配置為NameNode,另外7臺(tái)配置為DataNode,DataNode同時(shí)承擔(dān)HBase非結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)和Map/Reduce分布式數(shù)據(jù)處理任務(wù),軟件環(huán)境架構(gòu)如圖3所示。圖3中,DataNode承擔(dān)基礎(chǔ)教育資源網(wǎng)站表層數(shù)據(jù)采集、網(wǎng)頁(yè)解析與多媒體資源提娶文本資源切片等任務(wù)。數(shù)據(jù)采集工具是在Nutch開(kāi)源工具基礎(chǔ)上,結(jié)合主題相關(guān)度計(jì)算進(jìn)行了二次開(kāi)發(fā),該工具采用插件的方式解決了JavaScript腳本解析和AJAX動(dòng)態(tài)腳本問(wèn)題,與Map/Reduce分布式計(jì)算可以很好地集成為一體。圖3實(shí)驗(yàn)軟件環(huán)境(二)實(shí)驗(yàn)結(jié)果實(shí)驗(yàn)種子網(wǎng)站是全國(guó)31個(gè)盛自治區(qū)、直轄市教育廳(委員會(huì))網(wǎng)站,不包括香港、澳門、臺(tái)灣。經(jīng)過(guò)廣度優(yōu)先搜索,共提取出基礎(chǔ)教育資源相關(guān)網(wǎng)站28756個(gè),如:查字典語(yǔ)文網(wǎng)(https://yuwen.chazidian.com)、當(dāng)知備課網(wǎng)(http://beike.dangzhi.com)、7C教育資源網(wǎng)(http://www.7cxk.net)等。再?gòu)倪@些基礎(chǔ)教育資源網(wǎng)站進(jìn)行深度優(yōu)先搜索,得到53,186,246個(gè)URL,經(jīng)過(guò)主題(主題詞共21660個(gè)詞條[16],包括Fd、Fm、Ff等特征詞條)相關(guān)性過(guò)濾,與基礎(chǔ)教育資源直接相關(guān)的URL共有354,679個(gè),并在此基礎(chǔ)上,從網(wǎng)頁(yè)中抽取多媒體資源和文本類教學(xué)資源進(jìn)行分割后,得到的資源片段總數(shù)為186,133個(gè),累計(jì)用時(shí)113.9(78.5+35.4)小時(shí)(約4.7天),通過(guò)開(kāi)放測(cè)試和封閉測(cè)試,得到的實(shí)驗(yàn)結(jié)果見(jiàn)?

【參考文獻(xiàn)】:
期刊論文
[1]基于Heritrix與Lucene的地震專業(yè)搜索引擎設(shè)計(jì)[J]. 孫靜,李亞龍,萬(wàn)杰.  地震地磁觀測(cè)與研究. 2016(05)
[2]基于Heritrix的視頻垂直搜索引擎[J]. 張林.  計(jì)算機(jī)系統(tǒng)應(yīng)用. 2016(09)
[3]基于知識(shí)庫(kù)和主題爬蟲(chóng)的南海輿情實(shí)時(shí)監(jiān)測(cè)研究[J]. 丁晟春,龔思蘭,周文杰,王曰芬.  情報(bào)雜志. 2016(05)
[4]電子課本與電子書(shū)包標(biāo)準(zhǔn)規(guī)范、關(guān)鍵技術(shù)及應(yīng)用創(chuàng)新的研究[J]. 吳永和,何超,楊瑛,馬曉玲,余云濤,劉曉丹,祝智庭.  華東師范大學(xué)學(xué)報(bào)(自然科學(xué)版). 2014(02)
[5]模糊規(guī)則算法在教育信息分類中的應(yīng)用[J]. 梁文超,徐朝軍,沈書(shū)生.  現(xiàn)代圖書(shū)情報(bào)技術(shù). 2011(01)
[6]微型學(xué)習(xí)理論指導(dǎo)下移動(dòng)學(xué)習(xí)材料設(shè)計(jì)的研究[J]. 穆肅,閆振中.  現(xiàn)代遠(yuǎn)距離教育. 2010(02)
[7]基于分塊和統(tǒng)計(jì)相結(jié)合的新聞?wù)某槿J]. 李烯,徐朝軍.  情報(bào)理論與實(shí)踐. 2010(01)
[8]網(wǎng)絡(luò)課程資源自動(dòng)量化評(píng)價(jià)研究[J]. 王滿,徐朝軍.  現(xiàn)代圖書(shū)情報(bào)技術(shù). 2010(01)
[9]Edupage:一個(gè)基于本體的基礎(chǔ)教育網(wǎng)站搜索引擎[J]. 曹卓文,楊曉江.  中國(guó)遠(yuǎn)程教育. 2008(05)
[10]基于微格式的信息組織與處理框架[J]. 李書(shū)寧.  圖書(shū)情報(bào)工作. 2007(08)



本文編號(hào):3583573

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/jiaoyulunwen/xuekejiaoyulunwen/3583573.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶c033f***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com
色涩一区二区三区四区| 在线精品首页中文字幕亚洲| 亚洲精品蜜桃在线观看| 激情五月天深爱丁香婷婷| 国产欧美日本在线播放| 久久精品国产亚洲av久按摩| 99久热只有精品视频最新| 国产精品不卡高清在线观看| 在线观看免费无遮挡大尺度视频 | 中文字幕一区二区三区中文| 亚洲精品日韩欧美精品| av中文字幕一区二区三区在线 | 亚洲一二三四区免费视频| 正在播放玩弄漂亮少妇高潮| 日韩精品日韩激情日韩综合| 精品人妻一区二区三区免费| 懂色一区二区三区四区| 日本人妻免费一区二区三区| 日韩黄色大片免费在线| 精品日韩av一区二区三区| 99国产高清不卡视频| 一区二区三区四区亚洲专区| 亚洲国产成人一区二区在线观看| 国产欧美一区二区三区精品视 | 久久精品福利在线观看| 人妻少妇久久中文字幕久久| 丁香六月婷婷基地伊人| 在线视频免费看你懂的| 国产av大片一区二区三区| 欧美日韩国产精品第五页| 欧美精品亚洲精品日韩专区| 亚洲一区二区三区日韩91| 亚洲精品一二三区不卡| 久久精品中文字幕人妻中文| 天堂av一区一区一区| 免费观看日韩一级黄色大片| 日本不卡片一区二区三区| 精品丝袜一区二区三区性色| 色哟哟精品一区二区三区| 欧美成人欧美一级乱黄| 亚洲中文在线中文字幕91|