計(jì)算機(jī)視覺(Computer Version,CV)、模式識(shí)別、人工智能
本文關(guān)鍵詞:計(jì)算機(jī)視覺核心技術(shù)現(xiàn)狀與展望,由筆耕文化傳播整理發(fā)布。
計(jì)算機(jī)視覺(Computer Version,CV)、模式識(shí)別、人工智能
一、計(jì)算機(jī)視覺
Divid Marr將計(jì)算機(jī)視覺系統(tǒng)的開發(fā)問題歸納為3個(gè)要素:
(1)數(shù)學(xué)理論
考慮數(shù)學(xué)計(jì)算層面的目標(biāo)及可以引入的合理約束條件。
(2)描述和算法
重點(diǎn)解決計(jì)算機(jī)視覺中的輸入輸出的數(shù)據(jù)格式問題,并設(shè)計(jì)合理的算法實(shí)現(xiàn)其系統(tǒng)功能。
(3)硬件的合理使用
使用符合算法要求的硬件并考慮該硬件對(duì)所需要的算法和描述的反作用。
計(jì)算機(jī)視覺系統(tǒng)框架
1.1 圖像數(shù)據(jù)處理層
對(duì)圖像像素或者頻域進(jìn)行相應(yīng)處理,比如圖像獲取、傳輸、壓縮、降噪、裝換、存儲(chǔ)、增強(qiáng)和復(fù)原等。
1.3圖像識(shí)別獲取層
圖像識(shí)別是指利用計(jì)算機(jī)對(duì)圖像進(jìn)行處理、分析和理解,以識(shí)別不同模式的目標(biāo)和對(duì)象的技術(shù),主要包括圖像匹配和機(jī)器學(xué)習(xí)。
圖像匹配的研究?jī)?nèi)容大致集中在三個(gè)方面:特征空間;相似性度量;搜索策略
機(jī)器學(xué)習(xí):是一門人工智能的科學(xué),該領(lǐng)域的主要研究的是人工智能,特別是如何在經(jīng)驗(yàn)學(xué)習(xí)中改善具體算法的性能。
研究如何使用計(jì)算機(jī)模擬或?qū)崿F(xiàn)人類的學(xué)習(xí)活動(dòng)。
二、模式識(shí)別廣義上來說,模式是供模仿用的完美無缺的標(biāo)本,通常,把通過對(duì)具體的個(gè)別事物進(jìn)行觀察所得的具有時(shí)間和空間分布的信息稱之為模式;而把模式所屬的類別或同一類中模式的總體稱之為模式類。模式識(shí)別是對(duì)表征事物或現(xiàn)象的各種形式的(數(shù)值的、文字的和邏輯關(guān)系的)信息進(jìn)行處理和分析,以對(duì)事物或現(xiàn)象進(jìn)行描述、辨認(rèn)、分類和解釋的過程,是信息科學(xué)和人工智能的重要組成部分。
模式識(shí)別主要集中在兩個(gè)方面,一是研究生物(包括人)是如何感知對(duì)象的,二是在給定的任務(wù)下,如何用計(jì)算機(jī)實(shí)現(xiàn)模式識(shí)別的理論和方法。
人工智能是專門研究用機(jī)器人模擬人的動(dòng)作、感覺和思維過程與規(guī)律的一門科學(xué),而模式識(shí)別則是利用計(jì)算機(jī)專門對(duì)物理量及其變化過程進(jìn)行描述與分類,通常用來對(duì)圖像、文字、相片以及聲音等信息進(jìn)行處理、分類和識(shí)別。
模式識(shí)別系統(tǒng)
模式識(shí)別方法:
1.統(tǒng)計(jì)模式識(shí)別
2.結(jié)構(gòu)模式識(shí)別
3.模糊模式識(shí)別
4.人工神經(jīng)網(wǎng)絡(luò)模式識(shí)別
5.模板匹配模式識(shí)別
6.支持向量機(jī)的模式識(shí)別
三、人工智能美國(guó)斯坦福大學(xué)著名的人工智能研究中心尼爾遜教授這樣定義人工智能“人工智能是關(guān)于知識(shí)的學(xué)科---怎樣表示知識(shí)以及怎樣獲取知識(shí)并使用知識(shí)的學(xué)科”,另一名著名的美國(guó)MIT的winston教授認(rèn)為“人工智能就是研究如何使計(jì)算機(jī)去做過去只有人才能做的智能工作”。
人工智能的研究與應(yīng)用:
問題求解
專家系統(tǒng)
機(jī)器學(xué)習(xí)
神經(jīng)網(wǎng)絡(luò)
模式識(shí)別
人工生命
未完待續(xù)。。。。。。。。。。。。。。。。。。。。
參考文獻(xiàn)
[1]許志杰,王晶,劉穎,范九倫. 計(jì)算機(jī)視覺核心技術(shù)現(xiàn)狀與展望[J]. 西安郵電學(xué)院學(xué)報(bào),2012,06:1-8.
[2]王道累,陳軍,吳懋亮. 計(jì)算機(jī)視覺原理分析及其應(yīng)用[J]. 上海電力學(xué)院學(xué)報(bào),2016,03:283-287.
[3]范會(huì)敏,王浩. 模式識(shí)別方法概述[J]. 電子設(shè)計(jì)工程,2012,19:48-51.
計(jì)算機(jī)視覺補(bǔ)充:
計(jì)算機(jī)視覺與機(jī)器視覺
計(jì)算機(jī)視覺是一門研究如何使機(jī)器“看”的科學(xué),更進(jìn)一步的說,就是是指用攝影機(jī)和電腦代替人眼對(duì)目標(biāo)進(jìn)行識(shí)別、跟蹤和測(cè)量等機(jī)器視覺,并進(jìn)一步做圖形處理,使電腦處理成為更適合人眼觀察或傳送給儀器檢測(cè)的圖像。計(jì)算機(jī)視覺也可以看作是研究如何使人工系統(tǒng)從圖像或多維數(shù)據(jù)中“感知”的科學(xué)。它的最終研究目標(biāo)就是使計(jì)算機(jī)能象人那樣通過視覺觀察和理解世界,具有自主適應(yīng)環(huán)境的能力。
機(jī)器視覺就是用機(jī)器代替人眼來做測(cè)量和判斷。機(jī)器視覺系統(tǒng)是通過機(jī)器視覺產(chǎn)品(即圖像攝取裝置,分CMOS和CCD兩種)將被攝取目標(biāo)轉(zhuǎn)換成圖像信號(hào),傳送給專用的圖像處理系統(tǒng),得到被攝目標(biāo)的形態(tài)信息,根據(jù)像素分布和亮度、顏色等信息,轉(zhuǎn)變成數(shù)字化信號(hào);圖像系統(tǒng)對(duì)這些信號(hào)進(jìn)行各種運(yùn)算來抽取目標(biāo)的特征,進(jìn)而根據(jù)判別的結(jié)果來控制現(xiàn)場(chǎng)的設(shè)備動(dòng)作。
從學(xué)科分類上,二者都被認(rèn)為是ArtificialIntelligence下屬科目,不過計(jì)算機(jī)視覺偏軟件,通過算法對(duì)圖像進(jìn)行識(shí)別分析,而機(jī)器視覺軟硬件都包括(采集設(shè)備,光源,鏡頭,控制,機(jī)構(gòu),算法等),指的是系統(tǒng),更偏實(shí)際應(yīng)用。簡(jiǎn)單的說,我們可以認(rèn)為計(jì)算機(jī)視覺是研究“讓機(jī)器怎么看”的科學(xué),而機(jī)器視覺是研究“看了之后怎么用”的科學(xué)。
隨著硬件、算法及大數(shù)據(jù)的不斷發(fā)展,整個(gè)人工智能領(lǐng)域面臨前所未有的規(guī)模增長(zhǎng),也促使了國(guó)外的許多創(chuàng)業(yè)公司被大公司收購(gòu)。
5月,美國(guó)亞馬遜公司收購(gòu)了一支歐洲頂級(jí)機(jī)器視覺團(tuán)隊(duì)用于無人機(jī)領(lǐng)域研究。無獨(dú)有偶,英特爾收購(gòu)了俄羅斯計(jì)算機(jī)視覺公司Itseez,用于無人駕駛領(lǐng)域。ARM宣布以3.5億美元收購(gòu)英國(guó)嵌入式計(jì)算機(jī)視覺技術(shù)公司Apical。此前,Snapchat收購(gòu)計(jì)算機(jī)視覺公司Seene;Pinterest收購(gòu)視覺創(chuàng)業(yè)公司VisualGraph;Twitter收購(gòu)基于深度學(xué)習(xí)的計(jì)算機(jī)視覺創(chuàng)業(yè)公司Madbits。
同時(shí)圖像識(shí)別的能力越來越強(qiáng),錯(cuò)誤率越來越低,國(guó)內(nèi)也陸續(xù)爆發(fā)了大批優(yōu)秀的計(jì)算機(jī)視覺(ComputerVision)創(chuàng)業(yè)公司。
1、曠視科技:讓機(jī)器看懂世界
北京曠視科技有限公司成立于2012年11月,公司專注于人臉識(shí)別技術(shù)和相關(guān)產(chǎn)品應(yīng)用研究,面向開發(fā)者提供服務(wù),能提供一整套人臉檢測(cè)、人臉識(shí)別、人臉分析以及人臉3D技術(shù)的視覺技術(shù)服務(wù),主要通過提供云端API、離線SDK、以及面向用戶的自主研發(fā)產(chǎn)品形式,將人臉識(shí)別技術(shù)廣泛應(yīng)用到互聯(lián)網(wǎng)及移動(dòng)應(yīng)用場(chǎng)景中。
Face++通過和眾多互聯(lián)網(wǎng)公司合作,并通過“脫敏”技術(shù)掌握到了500萬張人臉圖片數(shù)據(jù)庫(kù),在互聯(lián)網(wǎng)圖片人臉識(shí)別LFW的準(zhǔn)確率達(dá)到99.6%,,合作伙伴包括阿里、360等一批大型的圖片、社交、設(shè)備類企業(yè)。
2、云從科技:源自計(jì)算機(jī)視覺之父的人臉識(shí)別技術(shù)
廣州云從信息科技有限公司(簡(jiǎn)稱云從科技)是一家專注于計(jì)算機(jī)視覺與人工智能的高科技企業(yè),核心技術(shù)源于四院院士、計(jì)算機(jī)視覺之父——ThomasS.Huang黃煦濤教授。核心團(tuán)隊(duì)曾于2007年到2011年6次斬獲智能識(shí)別世界冠軍,得到上市公司佳都科技與香港杰翱資本的戰(zhàn)略投資。
公司主要技術(shù)團(tuán)隊(duì)來自中國(guó)科學(xué)院重慶分院,是中科院研發(fā)實(shí)力最雄厚的人臉識(shí)別團(tuán)隊(duì),并作為中科院戰(zhàn)略性先導(dǎo)科技專項(xiàng)的唯一人臉識(shí)別團(tuán)隊(duì),代表參與了新疆喀什等地安防布控。
3、格林深瞳:讓計(jì)算機(jī)看懂世界
格靈深瞳是一家將計(jì)算機(jī)視覺和深度學(xué)習(xí)技術(shù)應(yīng)用于商業(yè)領(lǐng)域的科技公司,自主研發(fā)的深瞳技術(shù)在人和車的檢測(cè)、跟蹤與識(shí)別方面居于世界領(lǐng)先水平。公司借助海量數(shù)據(jù),讓計(jì)算機(jī)像人一樣看懂這個(gè)世界,實(shí)時(shí)獲取自然世界正在發(fā)生的一切,打造自然世界的搜索引擎。
posted @
本文關(guān)鍵詞:計(jì)算機(jī)視覺核心技術(shù)現(xiàn)狀與展望,由筆耕文化傳播整理發(fā)布。
本文編號(hào):240086
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/240086.html