基于iOS平臺(tái)的文本型圖像的檢索與實(shí)現(xiàn)
本文選題:OCR識(shí)別 + Lucene檢索。 參考:《北京郵電大學(xué)》2016年碩士論文
【摘要】:在線教育是目前互聯(lián)網(wǎng)應(yīng)用的熱點(diǎn),各種各樣的搜題軟件越來(lái)越多,通過(guò)手機(jī)拍攝照片,可以迅速搜出幾乎所有作業(yè)及試題的正確答案和解析過(guò)程進(jìn)行自學(xué)。搜題的技術(shù)基礎(chǔ)建立在圖像識(shí)別與機(jī)器學(xué)習(xí)上,這些技術(shù)正是人工智能的組成部分。本文也將利用圖像識(shí)別、文本檢索技術(shù),初步實(shí)現(xiàn)一個(gè)搜題應(yīng)用。論文實(shí)現(xiàn)了一種基于C/S架構(gòu)的搜題應(yīng)用,通過(guò)iPhone手機(jī)進(jìn)行題目拍照,拍照后的圖片一般包括很多對(duì)識(shí)別題目無(wú)用的信息,如邊框空白信息,噪聲信息等,需要對(duì)圖像進(jìn)行裁剪濾波等預(yù)處理,然后使用OCR技術(shù)對(duì)文本型圖像進(jìn)行識(shí)別,得到題目信息。得到題目信息后,通過(guò)手機(jī)網(wǎng)絡(luò)上傳到后臺(tái)服務(wù)器,后臺(tái)服務(wù)器根據(jù)數(shù)據(jù)庫(kù)中的題目信息,進(jìn)行題目的檢索匹配工作。客戶端采用OCR實(shí)現(xiàn)圖像識(shí)別。服務(wù)器端采用Windows+PHP+Apache+Mysql的技術(shù)架構(gòu),Apache服務(wù)器提供網(wǎng)絡(luò)服務(wù)供終端訪問(wèn),php技術(shù)實(shí)現(xiàn)服務(wù)器端邏輯,由于Lucene檢索引擎是由Java語(yǔ)言實(shí)現(xiàn)的,所以需要在PHP中調(diào)用Java語(yǔ)言,可以使用PHP-Java-bridge庫(kù),在Java代碼中需要操作mysql數(shù)據(jù)庫(kù),進(jìn)行索引的建立,數(shù)據(jù)的檢索等。
[Abstract]:Online education is the hot spot of Internet application at present. There are more and more kinds of search software. By taking photos by mobile phone, we can quickly find out the correct answers and analysis process of almost all homework and test questions for self-study. The technology of searching problems is based on image recognition and machine learning, which are the components of artificial intelligence. This paper will also use image recognition, text retrieval technology, the preliminary implementation of a search application. In this paper, a problem searching application based on C / S architecture is implemented. The photo taken by iPhone usually includes many useless information, such as border blank information, noise information and so on. It is necessary to preprocess the image such as clipping and filtering, and then use OCR technology to recognize the text image and get the title information. After getting the title information, it is uploaded to the background server through the mobile phone network, and the background server carries on the retrieval matching work according to the subject information in the database. The client uses OCR to realize image recognition. The server uses the technical framework of Apache MySQL to provide network services for terminal access to the server logic. Because the Lucene search engine is implemented by the Java language, it is necessary to call the Java language in Apache. PHP-Java-bridge library can be used to operate mysql database, index building, data retrieval and so on.
【學(xué)位授予單位】:北京郵電大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TP391.41
【參考文獻(xiàn)】
相關(guān)期刊論文 前6條
1 王文華;;淺談OCR技術(shù)的發(fā)展和應(yīng)用[J];福建電腦;2012年06期
2 劉巖;薛濤;李周;張小英;;圖像處理和文字識(shí)別技術(shù)在手機(jī)軟件自動(dòng)化測(cè)試系統(tǒng)中的應(yīng)用[J];現(xiàn)代電信科技;2009年07期
3 李牧;閆繼宏;朱延河;趙杰;;一種改進(jìn)的大津法在機(jī)器視覺(jué)中的應(yīng)用[J];吉林大學(xué)學(xué)報(bào)(工學(xué)版);2008年04期
4 費(fèi)嵐;張桂香;;遠(yuǎn)程教育與信息推送技術(shù)[J];電腦知識(shí)與技術(shù);2006年11期
5 李了了 ,鄧善熙 ,丁興號(hào);基于大津法的圖像分塊二值化算法[J];微計(jì)算機(jī)信息;2005年14期
6 王惠琴,李明,王燕;基于Web的數(shù)據(jù)庫(kù)安全管理技術(shù)與實(shí)現(xiàn)[J];計(jì)算機(jī)應(yīng)用研究;2002年03期
相關(guān)碩士學(xué)位論文 前3條
1 張偉杰;基于iOS平臺(tái)的新聞應(yīng)用的設(shè)計(jì)與實(shí)現(xiàn)[D];北京交通大學(xué);2014年
2 夏夢(mèng);基于iOS的車聯(lián)網(wǎng)手機(jī)客戶端的設(shè)計(jì)與實(shí)現(xiàn)[D];南昌大學(xué);2014年
3 趙淼;基于Telematics的iPhone手機(jī)客戶端系統(tǒng)的研究及應(yīng)用[D];吉林大學(xué);2014年
,本文編號(hào):2027838
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2027838.html