基于Nutch的Web數(shù)學(xué)公式提取
[Abstract]:In this paper, the methods of recognizing and extracting mathematical formulas in mathematical search engine based on formulas are studied, and the characteristics of MathML-Open-MathMath LaTexinfix format when they appear in web pages are summarized. A formula recognition and extraction method based on feature and heuristic rules is proposed. The feasibility and accuracy of the method are illustrated by experiments.
【作者單位】: 蘭州大學(xué)信息科學(xué)與工程學(xué)院;
【基金】:國(guó)家自然科學(xué)基金資助項(xiàng)目(61003139,60903102) 蘭州大學(xué)中央高;究蒲袠I(yè)務(wù)費(fèi)專項(xiàng)資金(lzujbky-2010-90)
【分類號(hào)】:TP391.3
【參考文獻(xiàn)】
相關(guān)碩士學(xué)位論文 前1條
1 景珂;網(wǎng)絡(luò)數(shù)學(xué)搜索中的數(shù)學(xué)查詢語(yǔ)言與索引的研究[D];蘭州大學(xué);2009年
【共引文獻(xiàn)】
相關(guān)期刊論文 前2條
1 聶俊;陳天瑩;符紅光;;基于Latex的互聯(lián)網(wǎng)數(shù)學(xué)公式搜索引擎[J];計(jì)算機(jī)應(yīng)用;2010年S2期
2 蔡川;蘇偉;李廉;;Presentation數(shù)學(xué)公式到Content轉(zhuǎn)換關(guān)鍵問(wèn)題研究[J];計(jì)算機(jī)應(yīng)用與軟件;2012年08期
相關(guān)碩士學(xué)位論文 前2條
1 郭作勇;電子公式詞典的設(shè)計(jì)[D];汕頭大學(xué);2011年
2 崔林衛(wèi);Web數(shù)學(xué)公式提取方法的研究[D];蘭州大學(xué);2012年
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 聶俊;陳天瑩;符紅光;;基于Latex的互聯(lián)網(wǎng)數(shù)學(xué)公式搜索引擎[J];計(jì)算機(jī)應(yīng)用;2010年S2期
2 蔡建超;郭一平;王亮;;基于Lucene.Net校園網(wǎng)搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)[J];計(jì)算機(jī)技術(shù)與發(fā)展;2006年11期
3 李艷紅;;淺談搜索引擎的研究現(xiàn)狀[J];才智;2009年35期
4 譚愛(ài)平;成亞玲;;搜索引擎技術(shù)綜述[J];湖南工業(yè)職業(yè)技術(shù)學(xué)院學(xué)報(bào);2008年03期
5 劉運(yùn)強(qiáng);;垂直搜索引擎的研究與設(shè)計(jì)[J];計(jì)算機(jī)應(yīng)用與軟件;2010年07期
6 邵雄凱;梁云靜;劉建舟;;基于遺傳算法的主題信息搜索研究[J];網(wǎng)絡(luò)安全技術(shù)與應(yīng)用;2009年11期
7 謝能付;王文生;段延娥;;基于概念空間的領(lǐng)域信息爬蟲設(shè)計(jì)研究[J];江西師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2008年02期
8 宋妍;搜索引擎:大眾趣味探測(cè)劑[J];互聯(lián)網(wǎng)周刊;2004年04期
9 汪小棟,董紅斌;一種基于Linux平臺(tái)的搜索引擎初探[J];計(jì)算機(jī)應(yīng)用研究;2002年06期
10 盧托;于俊清;廖兆存;聶江;;基于Web的數(shù)學(xué)公式檢索系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[J];微處理機(jī);2008年02期
相關(guān)會(huì)議論文 前10條
1 梁循;楊健;陳華;曾月卿;;互聯(lián)網(wǎng)金融信息搜索[A];中國(guó)優(yōu)選法統(tǒng)籌法與經(jīng)濟(jì)數(shù)學(xué)研究會(huì)第七屆全國(guó)會(huì)員代表大會(huì)暨第七屆中國(guó)管理科學(xué)學(xué)術(shù)年會(huì)論文集[C];2005年
2 彭軻;廖聞劍;;淺析搜索引擎[A];中國(guó)通信學(xué)會(huì)第五屆學(xué)術(shù)年會(huì)論文集[C];2008年
3 李丹;;如何利用搜索引擎查找中醫(yī)藥信息[A];中國(guó)中醫(yī)藥信息研究會(huì)第二屆理事大會(huì)暨學(xué)術(shù)交流會(huì)議論文匯編[C];2003年
4 鄧長(zhǎng)壽;郭景峰;楊焱林;鄧安遠(yuǎn);;下一代Web搜索引擎初探[A];第十八屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2001年
5 維尼拉·木沙江;吐爾洪·吾司曼;;維、哈、柯文搜索引擎中網(wǎng)頁(yè)爬行器的設(shè)計(jì)與實(shí)現(xiàn)[A];少數(shù)民族青年自然語(yǔ)言處理技術(shù)研究與進(jìn)展——第三屆全國(guó)少數(shù)民族青年自然語(yǔ)言信息處理、第二屆全國(guó)多語(yǔ)言知識(shí)庫(kù)建設(shè)聯(lián)合學(xué)術(shù)研討會(huì)論文集[C];2010年
6 湯薇;曾艷;;構(gòu)建校園網(wǎng)搜索引擎必要性分析[A];廣西計(jì)算機(jī)學(xué)會(huì)2008年年會(huì)論文集[C];2008年
7 姚樹宇;趙少東;;一種使用分布式技術(shù)的搜索引擎[A];2005年全國(guó)開放式分布與并行計(jì)算學(xué)術(shù)會(huì)議論文集[C];2005年
8 倪俊峰;;基于黃頁(yè)搜索引擎的關(guān)鍵字排名廣告系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[A];2005年中國(guó)索引學(xué)會(huì)年會(huì)暨學(xué)術(shù)研討會(huì)論文集[C];2005年
9 張怡;查貴庭;;SEO在信息服務(wù)中的應(yīng)用研究[A];2010年中國(guó)索引學(xué)會(huì)年會(huì)暨學(xué)術(shù)研討會(huì)論文集[C];2010年
10 陳援非;何哲;朱珍民;;基于普適計(jì)算的個(gè)性化搜索技術(shù)[A];第二屆和諧人機(jī)環(huán)境聯(lián)合學(xué)術(shù)會(huì)議(HHME2006)——第2屆中國(guó)普適計(jì)算學(xué)術(shù)會(huì)議(PCC'06)論文集[C];2006年
相關(guān)重要報(bào)紙文章 前10條
1 李一鑫;搜索排名的紅與黑[N];財(cái)經(jīng)時(shí)報(bào);2007年
2 周文林;搜狗3.0能否撼動(dòng)搜索市場(chǎng)[N];經(jīng)濟(jì)參考報(bào);2007年
3 惠正一;比爾·蓋茨:微軟不怕Google[N];第一財(cái)經(jīng)日?qǐng)?bào);2005年
4 賽迪顧問(wèn)股份有限公司互聯(lián)網(wǎng)與電子商務(wù)咨詢中心 常燕杰;搜索,,還是門戶[N];中國(guó)計(jì)算機(jī)報(bào);2005年
5 陳珊;浙江移動(dòng)推出手機(jī)搜索引擎服務(wù)[N];人民郵電;2005年
6 趙法忠;搜索引擎還需悠著點(diǎn)[N];中國(guó)經(jīng)營(yíng)報(bào);2005年
7 金朝力;搜索引擎火拼搜索質(zhì)量[N];北京商報(bào);2006年
8 本報(bào)記者 趙曉輝 孟昭麗;搜索引擎駛?cè)搿氨茱L(fēng)港”[N];中國(guó)證券報(bào);2006年
9 孫t;搜索引擎驚喜侵權(quán)官司止于“避風(fēng)港”?[N];第一財(cái)經(jīng)日?qǐng)?bào);2006年
10 姜蕊;問(wèn)天下誰(shuí)識(shí)搜索?[N];中國(guó)高新技術(shù)產(chǎn)業(yè)導(dǎo)報(bào);2006年
相關(guān)博士學(xué)位論文 前10條
1 岑榮偉;基于用戶行為分析的搜索引擎評(píng)價(jià)研究[D];清華大學(xué);2010年
2 李群;主題搜索引擎聚類算法的研究[D];北京林業(yè)大學(xué);2011年
3 蘇君華;面向搜索引擎的技術(shù)接受模型研究[D];南京大學(xué);2011年
4 劉佐達(dá);分布協(xié)作式搜索引擎模型及算法研究[D];清華大學(xué);2011年
5 陳旭毅;基于索引云的企業(yè)搜索引擎實(shí)現(xiàn)研究[D];武漢大學(xué);2011年
6 郭眈;中文互聯(lián)網(wǎng)視頻搜索引擎系統(tǒng)策略研究[D];北京交通大學(xué);2012年
7 王昤璞;基于用戶體驗(yàn)的互聯(lián)網(wǎng)搜索引擎醫(yī)學(xué)信息檢索可用性評(píng)估研究[D];吉林大學(xué);2010年
8 李莎莎;面向搜索引擎的自然語(yǔ)言處理關(guān)鍵技術(shù)研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2011年
9 蘇偉;基于Web的數(shù)學(xué)公式輸入及可訪問(wèn)性關(guān)鍵問(wèn)題研究[D];蘭州大學(xué);2010年
10 白玉琪;空間信息搜索引擎研究[D];中國(guó)科學(xué)院研究生院(遙感應(yīng)用研究所);2003年
相關(guān)碩士學(xué)位論文 前10條
1 劉志偉;數(shù)學(xué)搜索引擎研究[D];蘭州大學(xué);2011年
2 羅偉;基于移動(dòng)Agent的主題搜索引擎研究[D];中南民族大學(xué);2008年
3 薛云;Internet上元搜索引擎的研究與設(shè)計(jì)[D];太原理工大學(xué);2003年
4 王春花;基于Nutch的農(nóng)業(yè)搜索引擎檢索結(jié)果排序策略的研究[D];西北農(nóng)林科技大學(xué);2010年
5 李雷;基于Nutch的農(nóng)業(yè)信息搜索引擎實(shí)現(xiàn)和優(yōu)化[D];吉林大學(xué);2011年
6 董晨;基于模糊聚類的個(gè)性化搜索引擎的研究[D];福州大學(xué);2005年
7 封俊;基于Hadoop的分布式搜索引擎研究與實(shí)現(xiàn)[D];太原理工大學(xué);2010年
8 李浩;分布式教育網(wǎng)信息檢索系統(tǒng)的研究和實(shí)現(xiàn)[D];華南理工大學(xué);2010年
9 尉建興;基于Lucene搜索引擎的研究與應(yīng)用[D];太原理工大學(xué);2011年
10 李建平;智能化WEB信息搜索引擎的研究與實(shí)現(xiàn)[D];大慶石油學(xué)院;2003年
本文編號(hào):2174969
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2174969.html