基于Nutch的Web數(shù)學(xué)公式提取
[Abstract]:In this paper, the methods of recognizing and extracting mathematical formulas in mathematical search engine based on formulas are studied, and the characteristics of MathML-Open-MathMath LaTexinfix format when they appear in web pages are summarized. A formula recognition and extraction method based on feature and heuristic rules is proposed. The feasibility and accuracy of the method are illustrated by experiments.
【作者單位】: 蘭州大學(xué)信息科學(xué)與工程學(xué)院;
【基金】:國家自然科學(xué)基金資助項目(61003139,60903102) 蘭州大學(xué)中央高校基本科研業(yè)務(wù)費專項資金(lzujbky-2010-90)
【分類號】:TP391.3
【參考文獻】
相關(guān)碩士學(xué)位論文 前1條
1 景珂;網(wǎng)絡(luò)數(shù)學(xué)搜索中的數(shù)學(xué)查詢語言與索引的研究[D];蘭州大學(xué);2009年
【共引文獻】
相關(guān)期刊論文 前2條
1 聶俊;陳天瑩;符紅光;;基于Latex的互聯(lián)網(wǎng)數(shù)學(xué)公式搜索引擎[J];計算機應(yīng)用;2010年S2期
2 蔡川;蘇偉;李廉;;Presentation數(shù)學(xué)公式到Content轉(zhuǎn)換關(guān)鍵問題研究[J];計算機應(yīng)用與軟件;2012年08期
相關(guān)碩士學(xué)位論文 前2條
1 郭作勇;電子公式詞典的設(shè)計[D];汕頭大學(xué);2011年
2 崔林衛(wèi);Web數(shù)學(xué)公式提取方法的研究[D];蘭州大學(xué);2012年
【相似文獻】
相關(guān)期刊論文 前10條
1 聶俊;陳天瑩;符紅光;;基于Latex的互聯(lián)網(wǎng)數(shù)學(xué)公式搜索引擎[J];計算機應(yīng)用;2010年S2期
2 蔡建超;郭一平;王亮;;基于Lucene.Net校園網(wǎng)搜索引擎的設(shè)計與實現(xiàn)[J];計算機技術(shù)與發(fā)展;2006年11期
3 李艷紅;;淺談搜索引擎的研究現(xiàn)狀[J];才智;2009年35期
4 譚愛平;成亞玲;;搜索引擎技術(shù)綜述[J];湖南工業(yè)職業(yè)技術(shù)學(xué)院學(xué)報;2008年03期
5 劉運強;;垂直搜索引擎的研究與設(shè)計[J];計算機應(yīng)用與軟件;2010年07期
6 邵雄凱;梁云靜;劉建舟;;基于遺傳算法的主題信息搜索研究[J];網(wǎng)絡(luò)安全技術(shù)與應(yīng)用;2009年11期
7 謝能付;王文生;段延娥;;基于概念空間的領(lǐng)域信息爬蟲設(shè)計研究[J];江西師范大學(xué)學(xué)報(自然科學(xué)版);2008年02期
8 宋妍;搜索引擎:大眾趣味探測劑[J];互聯(lián)網(wǎng)周刊;2004年04期
9 汪小棟,董紅斌;一種基于Linux平臺的搜索引擎初探[J];計算機應(yīng)用研究;2002年06期
10 盧托;于俊清;廖兆存;聶江;;基于Web的數(shù)學(xué)公式檢索系統(tǒng)設(shè)計與實現(xiàn)[J];微處理機;2008年02期
相關(guān)會議論文 前10條
1 梁循;楊健;陳華;曾月卿;;互聯(lián)網(wǎng)金融信息搜索[A];中國優(yōu)選法統(tǒng)籌法與經(jīng)濟數(shù)學(xué)研究會第七屆全國會員代表大會暨第七屆中國管理科學(xué)學(xué)術(shù)年會論文集[C];2005年
2 彭軻;廖聞劍;;淺析搜索引擎[A];中國通信學(xué)會第五屆學(xué)術(shù)年會論文集[C];2008年
3 李丹;;如何利用搜索引擎查找中醫(yī)藥信息[A];中國中醫(yī)藥信息研究會第二屆理事大會暨學(xué)術(shù)交流會議論文匯編[C];2003年
4 鄧長壽;郭景峰;楊焱林;鄧安遠;;下一代Web搜索引擎初探[A];第十八屆全國數(shù)據(jù)庫學(xué)術(shù)會議論文集(研究報告篇)[C];2001年
5 維尼拉·木沙江;吐爾洪·吾司曼;;維、哈、柯文搜索引擎中網(wǎng)頁爬行器的設(shè)計與實現(xiàn)[A];少數(shù)民族青年自然語言處理技術(shù)研究與進展——第三屆全國少數(shù)民族青年自然語言信息處理、第二屆全國多語言知識庫建設(shè)聯(lián)合學(xué)術(shù)研討會論文集[C];2010年
6 湯薇;曾艷;;構(gòu)建校園網(wǎng)搜索引擎必要性分析[A];廣西計算機學(xué)會2008年年會論文集[C];2008年
7 姚樹宇;趙少東;;一種使用分布式技術(shù)的搜索引擎[A];2005年全國開放式分布與并行計算學(xué)術(shù)會議論文集[C];2005年
8 倪俊峰;;基于黃頁搜索引擎的關(guān)鍵字排名廣告系統(tǒng)的設(shè)計與實現(xiàn)[A];2005年中國索引學(xué)會年會暨學(xué)術(shù)研討會論文集[C];2005年
9 張怡;查貴庭;;SEO在信息服務(wù)中的應(yīng)用研究[A];2010年中國索引學(xué)會年會暨學(xué)術(shù)研討會論文集[C];2010年
10 陳援非;何哲;朱珍民;;基于普適計算的個性化搜索技術(shù)[A];第二屆和諧人機環(huán)境聯(lián)合學(xué)術(shù)會議(HHME2006)——第2屆中國普適計算學(xué)術(shù)會議(PCC'06)論文集[C];2006年
相關(guān)重要報紙文章 前10條
1 李一鑫;搜索排名的紅與黑[N];財經(jīng)時報;2007年
2 周文林;搜狗3.0能否撼動搜索市場[N];經(jīng)濟參考報;2007年
3 惠正一;比爾·蓋茨:微軟不怕Google[N];第一財經(jīng)日報;2005年
4 賽迪顧問股份有限公司互聯(lián)網(wǎng)與電子商務(wù)咨詢中心 常燕杰;搜索,,還是門戶[N];中國計算機報;2005年
5 陳珊;浙江移動推出手機搜索引擎服務(wù)[N];人民郵電;2005年
6 趙法忠;搜索引擎還需悠著點[N];中國經(jīng)營報;2005年
7 金朝力;搜索引擎火拼搜索質(zhì)量[N];北京商報;2006年
8 本報記者 趙曉輝 孟昭麗;搜索引擎駛?cè)搿氨茱L(fēng)港”[N];中國證券報;2006年
9 孫t;搜索引擎驚喜侵權(quán)官司止于“避風(fēng)港”?[N];第一財經(jīng)日報;2006年
10 姜蕊;問天下誰識搜索?[N];中國高新技術(shù)產(chǎn)業(yè)導(dǎo)報;2006年
相關(guān)博士學(xué)位論文 前10條
1 岑榮偉;基于用戶行為分析的搜索引擎評價研究[D];清華大學(xué);2010年
2 李群;主題搜索引擎聚類算法的研究[D];北京林業(yè)大學(xué);2011年
3 蘇君華;面向搜索引擎的技術(shù)接受模型研究[D];南京大學(xué);2011年
4 劉佐達;分布協(xié)作式搜索引擎模型及算法研究[D];清華大學(xué);2011年
5 陳旭毅;基于索引云的企業(yè)搜索引擎實現(xiàn)研究[D];武漢大學(xué);2011年
6 郭眈;中文互聯(lián)網(wǎng)視頻搜索引擎系統(tǒng)策略研究[D];北京交通大學(xué);2012年
7 王昤璞;基于用戶體驗的互聯(lián)網(wǎng)搜索引擎醫(yī)學(xué)信息檢索可用性評估研究[D];吉林大學(xué);2010年
8 李莎莎;面向搜索引擎的自然語言處理關(guān)鍵技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2011年
9 蘇偉;基于Web的數(shù)學(xué)公式輸入及可訪問性關(guān)鍵問題研究[D];蘭州大學(xué);2010年
10 白玉琪;空間信息搜索引擎研究[D];中國科學(xué)院研究生院(遙感應(yīng)用研究所);2003年
相關(guān)碩士學(xué)位論文 前10條
1 劉志偉;數(shù)學(xué)搜索引擎研究[D];蘭州大學(xué);2011年
2 羅偉;基于移動Agent的主題搜索引擎研究[D];中南民族大學(xué);2008年
3 薛云;Internet上元搜索引擎的研究與設(shè)計[D];太原理工大學(xué);2003年
4 王春花;基于Nutch的農(nóng)業(yè)搜索引擎檢索結(jié)果排序策略的研究[D];西北農(nóng)林科技大學(xué);2010年
5 李雷;基于Nutch的農(nóng)業(yè)信息搜索引擎實現(xiàn)和優(yōu)化[D];吉林大學(xué);2011年
6 董晨;基于模糊聚類的個性化搜索引擎的研究[D];福州大學(xué);2005年
7 封俊;基于Hadoop的分布式搜索引擎研究與實現(xiàn)[D];太原理工大學(xué);2010年
8 李浩;分布式教育網(wǎng)信息檢索系統(tǒng)的研究和實現(xiàn)[D];華南理工大學(xué);2010年
9 尉建興;基于Lucene搜索引擎的研究與應(yīng)用[D];太原理工大學(xué);2011年
10 李建平;智能化WEB信息搜索引擎的研究與實現(xiàn)[D];大慶石油學(xué)院;2003年
本文編號:2174969
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2174969.html