基于Heritrix的視頻垂直搜索引擎
本文關(guān)鍵詞:基于Heritrix的視頻垂直搜索引擎
更多相關(guān)文章: 垂直搜索引擎 視頻 lucene heritrix
【摘要】:針對(duì)目前精品課程網(wǎng)站視頻信息多、分布散的特點(diǎn),通過lucene與heritrix,設(shè)計(jì)了專門針對(duì)視頻信息的垂直搜索引擎,使用BKDRHash算法,實(shí)現(xiàn)了對(duì)視頻信息的針對(duì)性搜索.搜索時(shí)將網(wǎng)頁抓取、內(nèi)容篩選和建立索引的過程結(jié)合在一起,大大減少了系統(tǒng)的開銷,改變了以往傳統(tǒng)搜索引擎網(wǎng)頁全文收錄的做法,篩選了無用信息,對(duì)頁面信息的提取,以及播放鏈接的提取過程具有一定的創(chuàng)新性.
【作者單位】: 商洛學(xué)院數(shù)學(xué)與計(jì)算機(jī)應(yīng)用學(xué)院;
【關(guān)鍵詞】: 垂直搜索引擎 視頻 lucene heritrix
【基金】:陜西省自然科學(xué)基金(2014JM2-6122)
【分類號(hào)】:TP391.3
【正文快照】: 從上世紀(jì)80年代開始,國家在教育信息化建設(shè)方面投入大量資金,推出了基礎(chǔ)教育資源庫、高等教育精品課程資源庫等許多優(yōu)秀資源共享系統(tǒng),力圖通過這些手段來縮小各地區(qū)之前的教育資源差距,平衡教育發(fā)展.有數(shù)據(jù)顯示,國家投入了大量的資金建立的精品課程網(wǎng),卻遠(yuǎn)沒有達(dá)到期望的利用
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前7條
1 于娟;劉強(qiáng);;主題網(wǎng)絡(luò)爬蟲研究綜述[J];計(jì)算機(jī)工程與科學(xué);2015年02期
2 王帥;周國民;王健;;主題爬蟲相關(guān)度算法研究綜述[J];計(jì)算機(jī)與現(xiàn)代化;2013年04期
3 白玉昭;梁久禎;;基于概率模型的主題爬蟲的研究和實(shí)現(xiàn)[J];計(jì)算機(jī)工程與科學(xué);2013年01期
4 朱敏;羅省賢;;基于Heritrix的面向特定主題的聚焦爬蟲研究[J];計(jì)算機(jī)技術(shù)與發(fā)展;2012年02期
5 白坤;耿國華;;基于Lucene/Heritrix的垂直搜索引擎的研究與應(yīng)用[J];計(jì)算機(jī)應(yīng)用與軟件;2009年01期
6 嚴(yán)莉莉;王倩倩;孟杰;張燕平;;基于聚類的個(gè)性化元搜索引擎設(shè)計(jì)[J];計(jì)算機(jī)技術(shù)與發(fā)展;2007年04期
7 沈賀丹;潘亞楠;邵良杉;;關(guān)于搜索引擎的研究綜述[J];計(jì)算機(jī)技術(shù)與發(fā)展;2006年04期
【共引文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 馮勁苗;張恩海;王鐸;洪滿;;基于移動(dòng)流量的用戶偏好模型設(shè)計(jì)與實(shí)現(xiàn)[J];信息技術(shù);2016年09期
2 胡博;蔣宗禮;;融合位置相關(guān)和概率排序的Lucene排序算法改進(jìn)[J];計(jì)算機(jī)科學(xué);2016年09期
3 張林;;基于Heritrix的視頻垂直搜索引擎[J];計(jì)算機(jī)系統(tǒng)應(yīng)用;2016年09期
4 荊文鵬;王育堅(jiān);董偉偉;;自適應(yīng)遺傳算法在主題爬蟲搜索策略中的應(yīng)用研究[J];計(jì)算機(jī)科學(xué);2016年08期
5 孫國超;;主題搜索引擎中網(wǎng)絡(luò)爬蟲的實(shí)現(xiàn)研究[J];電腦知識(shí)與技術(shù);2016年17期
6 丁晟春;龔思蘭;周文杰;王曰芬;;基于知識(shí)庫和主題爬蟲的南海輿情實(shí)時(shí)監(jiān)測研究[J];情報(bào)雜志;2016年05期
7 李應(yīng);;基于Hadoop的分布式主題網(wǎng)絡(luò)爬蟲研究[J];軟件導(dǎo)刊;2016年03期
8 黎柯;蔡永香;干佳林;王居遠(yuǎn);楊鼎;胡森勇;;行業(yè)動(dòng)態(tài)信息采集系統(tǒng)關(guān)鍵問題解決方案[J];測繪科學(xué);2016年03期
9 陳旺;徐天晟;;互聯(lián)網(wǎng)個(gè)人信息垂直搜索系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J];科技創(chuàng)新與應(yīng)用;2015年26期
10 張瀚馳;楊璐;方雄武;鄭麗敏;;基于本體的食品安全新聞爬蟲的設(shè)計(jì)與實(shí)現(xiàn)[J];農(nóng)業(yè)網(wǎng)絡(luò)信息;2015年05期
【二級(jí)參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 王帥;周國民;王健;;主題爬蟲相關(guān)度算法研究綜述[J];計(jì)算機(jī)與現(xiàn)代化;2013年04期
2 白玉昭;梁久禎;;基于概率模型的主題爬蟲的研究和實(shí)現(xiàn)[J];計(jì)算機(jī)工程與科學(xué);2013年01期
3 宋海洋;劉曉然;錢�?�;;一種新的主題網(wǎng)絡(luò)爬蟲爬行策略[J];計(jì)算機(jī)應(yīng)用與軟件;2011年11期
4 蔣國瑞;王秋利;;基于本體的TBT電子信息產(chǎn)品領(lǐng)域主題爬蟲研究[J];情報(bào)雜志;2011年07期
5 唐蘇;劉循;;基于超鏈接引導(dǎo)和鏈接圖分析的主題搜索引擎[J];計(jì)算機(jī)技術(shù)與發(fā)展;2011年02期
6 楊頌;歐陽柳波;;基于Heritrix的面向電子商務(wù)網(wǎng)站增量爬蟲研究[J];軟件導(dǎo)刊;2010年07期
7 張翔;周明全;李智杰;董麗麗;;基于PageRank與Bagging的主題爬蟲研究[J];計(jì)算機(jī)工程與設(shè)計(jì);2010年14期
8 胡富茂;;平行語料庫在商務(wù)信函機(jī)器翻譯中的應(yīng)用[J];中國商貿(mào);2010年14期
9 曾廣樸;范會(huì)聯(lián);;基于遺傳算法的聚焦爬蟲搜索策略[J];計(jì)算機(jī)工程;2010年11期
10 彭濤;孟宇;左萬利;王英;胡亮;;主題爬行中的隧道穿越技術(shù)[J];計(jì)算機(jī)研究與發(fā)展;2010年04期
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 楊堅(jiān)爭;李朝平;;垂直搜索引擎及其應(yīng)用[J];電子商務(wù);2006年10期
2 羅麗姍;;垂直搜索引擎發(fā)展概述[J];圖書館學(xué)研究;2006年12期
3 嚴(yán)宏偉;何俊;;基于房源分析系統(tǒng)的垂直搜索引擎關(guān)鍵技術(shù)的探討[J];中國科技信息;2007年05期
4 胡華梁;何進(jìn);鐘元生;;圖書垂直搜索引擎的設(shè)計(jì)[J];計(jì)算機(jī)與現(xiàn)代化;2007年08期
5 鄭凱明;李義杰;;垂直搜索引擎及其應(yīng)用價(jià)值[J];信息技術(shù);2008年04期
6 畢建濤;霍云福;;垂直搜索引擎贏利模式探討[J];大連大學(xué)學(xué)報(bào);2008年03期
7 許鑫;黃仲清;;垂直搜索引擎應(yīng)用中的若干策略探討——以12580餐飲垂直搜索為例[J];現(xiàn)代圖書情報(bào)技術(shù);2009年02期
8 孔祥春;李義杰;鄭凱明;;垂直搜索引擎應(yīng)用研究[J];計(jì)算機(jī)系統(tǒng)應(yīng)用;2009年07期
9 楊皖蘇;閆冬;;垂直搜索引擎發(fā)展策略探討[J];商業(yè)時(shí)代;2009年23期
10 肖婷;;垂直搜索引擎與旅游行業(yè)探討[J];農(nóng)業(yè)網(wǎng)絡(luò)信息;2009年11期
中國重要會(huì)議論文全文數(shù)據(jù)庫 前4條
1 褚蓓蓓;劉丹;;垂直搜索引擎:搜索引擎發(fā)展方向[A];2007年河北省電子學(xué)會(huì)、河北省計(jì)算機(jī)學(xué)會(huì)、河北省自動(dòng)化學(xué)會(huì)、河北省人工智能學(xué)會(huì)、河北省計(jì)算機(jī)輔助設(shè)計(jì)研究會(huì)、河北省軟件行業(yè)協(xié)會(huì)聯(lián)合學(xué)術(shù)年會(huì)論文集[C];2007年
2 林歡歡;王文杰;史忠植;;移動(dòng)環(huán)境下垂直搜索引擎[A];第三屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2007年
3 王上;于海;王鉦旋;;Deep Web垂直搜索引擎設(shè)計(jì)與實(shí)現(xiàn)[A];第26屆中國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(B輯)[C];2009年
4 毛華揚(yáng);劉衛(wèi);;會(huì)計(jì)信息搜索方法研究[A];第十屆全國會(huì)計(jì)信息化年會(huì)論文集[C];2011年
中國重要報(bào)紙全文數(shù)據(jù)庫 前10條
1 北大縱橫管理顧問公司高級(jí)顧問戴曉東;“商搜”變法 垂直搜索引擎的春天還遠(yuǎn)嗎?[N];中國經(jīng)營報(bào);2006年
2 王艷;垂直搜索引擎市場看好[N];中國旅游報(bào);2000年
3 王靖;賽迪網(wǎng)推出垂直搜索引擎[N];人民日?qǐng)?bào)海外版;2000年
4 楊國民;國內(nèi)生物醫(yī)藥行業(yè) 垂直搜索引擎誕生[N];經(jīng)濟(jì)日?qǐng)?bào);2007年
5 本報(bào)記者 王曉雁;垂直搜索引擎著作權(quán)之爭未破題[N];法制日?qǐng)?bào);2009年
6 電子工業(yè)出版社 董婭 工業(yè)和信息化部電子科學(xué)技術(shù)情報(bào)研究所 周峻松;用開源軟件建垂直搜索引擎[N];計(jì)算機(jī)世界;2010年
7 中新;生意寶推“生意搜”攪局電子商務(wù)搜索市場[N];經(jīng)理日?qǐng)?bào);2008年
8 源訊 編譯;搜索巨頭的下一步[N];計(jì)算機(jī)世界;2006年
9 賽迪網(wǎng) 方剛;不只是網(wǎng)站才垂直[N];中國計(jì)算機(jī)報(bào);2000年
10 ;沱沱網(wǎng)“亮劍”國際消費(fèi)電子博覽會(huì) 專業(yè)服務(wù)帶來B2B差異化變革[N];中國貿(mào)易報(bào);2007年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前5條
1 王曄;垂直搜索引擎若干問題研究[D];復(fù)旦大學(xué);2011年
2 吳羽;面向時(shí)間敏感對(duì)象的垂直搜索引擎關(guān)鍵技術(shù)研究[D];浙江大學(xué);2011年
3 胡宜敏;農(nóng)業(yè)垂直搜索引擎語義化若干問題的研究與實(shí)現(xiàn)[D];中國科學(xué)技術(shù)大學(xué);2012年
4 陳竹敏;面向垂直搜索引擎的主題爬行技術(shù)研究[D];山東大學(xué);2008年
5 王桂紅;農(nóng)產(chǎn)品市場價(jià)格web信息分析方法研究[D];沈陽農(nóng)業(yè)大學(xué);2013年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 韓冰;垂直搜索引擎?zhèn)€性化推薦研究與應(yīng)用[D];大連理工大學(xué);2009年
2 關(guān)小敏;垂直搜索引擎的研究與實(shí)現(xiàn)[D];北京郵電大學(xué);2012年
3 吳燕瑋;基于行業(yè)知識(shí)垂直搜索引擎的研究與實(shí)現(xiàn)[D];北京郵電大學(xué);2012年
4 柳力麗;旅游垂直搜索引擎的品牌傳播研究[D];西南大學(xué);2015年
5 錢永杰;面向網(wǎng)絡(luò)文學(xué)的垂直搜索引擎的研究與實(shí)現(xiàn)[D];曲阜師范大學(xué);2015年
6 袁鳳云;垂直搜索引擎關(guān)鍵技術(shù)研究與實(shí)現(xiàn)[D];電子科技大學(xué);2014年
7 任睿麗;面向旅游業(yè)的垂直搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)[D];電子科技大學(xué);2014年
8 張高偉;基于ElasticSearch的分布式視頻垂直搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)[D];哈爾濱工業(yè)大學(xué);2014年
9 朱鵬;英文語料庫垂直搜索引擎的研究與實(shí)現(xiàn)[D];北京郵電大學(xué);2015年
10 楊小丹;面向教育資源c\索引擎的研究與實(shí)現(xiàn)[D];電子科技大學(xué);2015年
,本文編號(hào):553828
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/553828.html