科學(xué)網(wǎng)[轉(zhuǎn)載]自動化學(xué)報(bào)
本文關(guān)鍵詞:引入視覺注意機(jī)制的目標(biāo)跟蹤方法綜述,由筆耕文化傳播整理發(fā)布。
《自動化學(xué)報(bào)》40卷4期網(wǎng)刊已經(jīng)發(fā)布, 敬請關(guān)注, 謝謝: )祝工作順利, 萬事如意!
========================================================================
綜述
========================================================================
【文題】: 引入視覺注意機(jī)制的目標(biāo)跟蹤方法綜述
【作者】: 黎萬義, 王鵬, 喬紅
【摘要】: 視覺跟蹤在無人飛行器、移動機(jī)器人、智能監(jiān)控等領(lǐng)域有著廣泛的應(yīng)用, 但由于目標(biāo)外觀和環(huán)境的變化, 以及背景干擾等因素的存在, 使得復(fù)雜場景下的魯棒實(shí)時(shí)的目標(biāo)跟蹤成為一項(xiàng)極具挑戰(zhàn)性的任務(wù). 視覺注意是人類視覺信息處理過程中的一項(xiàng)重要的心理調(diào)節(jié)機(jī)制, 在視覺注意的引導(dǎo)下, 人類能夠從眾多的視覺信息中快速地選擇那些最重要、最有用、與當(dāng)前行為最相關(guān)的感興趣的視覺信息, 特別地, 人類能夠快速指向感興趣的目標(biāo), 從而可以輕松地實(shí)現(xiàn)對目標(biāo)的穩(wěn)定跟蹤.因此, 將視覺注意機(jī)制引入到復(fù)雜場景下的目標(biāo)跟蹤中, 有利于實(shí)現(xiàn)更為穩(wěn)定和接近于人類認(rèn)知機(jī)制的視覺跟蹤算法.本文旨在對引入了視覺注意機(jī)制的目標(biāo)跟蹤方法進(jìn)行綜述. 首先, 介紹了視覺注意的基本概念及其代表性的計(jì)算模型; 其次, 對視覺注意與跟蹤的內(nèi)在關(guān)系進(jìn)行了闡述; 然后, 對引入視覺注意機(jī)制的目標(biāo)跟蹤方法進(jìn)行歸納、總結(jié)和分類, 對代表性的方法進(jìn)行介紹和分析; 最后, 對該類方法的特點(diǎn)和優(yōu)勢進(jìn)行了討論, 并對未來的研究趨勢進(jìn)行了展望.
【全文鏈接】: ?attachType=PDF&id=18323
【引用格式】: LI Wan-Yi, WANG Peng, QIAO Hong. A Survey of Visual Attention Based Methods for Object Tracking. Acta Automatica Sinica, 2014, 40(4): 561-576
(黎萬義, 王鵬, 喬紅. 引入視覺注意機(jī)制的目標(biāo)跟蹤方法綜述. 自動化學(xué)報(bào), 2014, 40(4): 561-576)
========================================================================
【文題】: 蛋白質(zhì)相互作用網(wǎng)絡(luò)功能模塊檢測的研究綜述
【作者】: 冀俊忠, 劉志軍, 劉紅欣, 劉椿年
【摘要】: 蛋白質(zhì)相互作用(Protein-protein interaction, PPI)網(wǎng)絡(luò)是生命活動中一種極其重要的生物分子關(guān)系網(wǎng)絡(luò), 利用計(jì)算方法從PPI網(wǎng)絡(luò)中檢測功能模塊是目前生物信息學(xué)中一項(xiàng)重要的研究課題. 本文首先總結(jié)了功能模塊檢測過程的基本流程, 說明了預(yù)處理和后處理的作用; 其次, 提出了一種模塊檢測方法的分類體系, 并對其中一些代表性的檢測算法進(jìn)行了闡述; 再次, 給出了模塊檢測常用的數(shù)據(jù)庫、評價(jià)指標(biāo)和相關(guān)軟件工具, 并通過實(shí)驗(yàn)對代表性算法進(jìn)行了性能對比. 最后, 通過對該領(lǐng)域挑戰(zhàn)性問題的分析預(yù)測了模塊檢測未來的研究方向, 以期對相關(guān)研究提供一定的參考.
【全文鏈接】: ?attachType=PDF&id=18324
【引用格式】: JI Jun-Zhong, LIU Zhi-Jun, LIU Hong-Xin, LIU Chun-Nian. An Overview of Research on Functional Module Detection for Protein-protein Interaction Networks. Acta Automatica Sinica, 2014, 40(4): 577-593
(冀俊忠, 劉志軍, 劉紅欣, 劉椿年. 蛋白質(zhì)相互作用網(wǎng)絡(luò)功能模塊檢測的研究綜述. 自動化學(xué)報(bào), 2014, 40(4): 577-593)
========================================================================
論文
========================================================================
【文題】: 基于多尺度結(jié)構(gòu)自相似性的單幅圖像超分辨率算法
【作者】: 潘宗序, 禹晶, 胡少興, 孫衛(wèi)東
【摘要】: 多尺度結(jié)構(gòu)自相似性是指同一幅圖像中存在相同尺度或不同尺度的相似結(jié)構(gòu), 這種多尺度圖像結(jié)構(gòu)自相似性廣泛存在于遙感圖像中.本文提出了一種基于多尺度結(jié)構(gòu)自相似性的單幅圖像超分辨率(Super resolution, SR)算法, 該算法結(jié)合了壓縮感知框架與圖像結(jié)構(gòu)自相似性, 利用非局部方法和基于圖像金字塔的K-SVD字典學(xué)習(xí)方法, 將蘊(yùn)含在相同尺度和不同尺度相似圖像塊中的附加信息在壓縮感知的框架下加入到重構(gòu)圖像中.本文算法的優(yōu)勢在于, 它僅借助于單幅低分辨率圖像自身所蘊(yùn)含的信息, 實(shí)現(xiàn)了空間分辨率的提升.實(shí)驗(yàn)表明, 與CSSS算法和ASDSAR算法相比, 本文算法更有效地提升了遙感圖像的空間分辨率.
【全文鏈接】: ?attachType=PDF&id=18325
【引用格式】: PAN Zong-Xu, YU Jing, HU Shao-Xing, SUN Wei-Dong. Single Image Super Resolution Based on Multi-scale Structural Self-similarity. Acta Automatica Sinica, 2014, 40(4): 594-603
(潘宗序, 禹晶, 胡少興, 孫衛(wèi)東. 基于多尺度結(jié)構(gòu)自相似性的單幅圖像超分辨率算法. 自動化學(xué)報(bào), 2014, 40(4): 594-603)
========================================================================
【文題】: 基于混沌特征的運(yùn)動模式分割和動態(tài)紋理分類
【作者】: 王勇, 胡士強(qiáng)
【摘要】: 采用混沌理論對動態(tài)紋理中的像素值序列建模, 提取動態(tài)紋理中的像素值序列的相關(guān)特征量, 將視頻用特征向量矩陣表示. 通過均值漂移(Mean shift)算法對矩陣中的特征向量聚類, 實(shí)現(xiàn)對視頻中的運(yùn)動模式分割. 然后, 采用地球移動距離(Earth mover’s distance, EMD)度量不同視頻的差異, 對動態(tài)紋理視頻分類. 本文對多個(gè)數(shù)據(jù)庫測試表明: 1)分割算法可以分割出視頻中不同的運(yùn)動模式; 2)提出的特征向量可以很好地描述動態(tài)紋理系統(tǒng); 3)分類算法可以對動態(tài)紋理視頻分類, 且對視頻中噪聲干擾具有一定的魯棒性.
【全文鏈接】: ?attachType=PDF&id=18326
【引用格式】: WANG Yong, HU Shi-Qiang. Chaotic Features for Motion Pattern Segmentation and Dynamic Texture Classification. Acta Automatica Sinica, 2014, 40(4): 604-614
(王勇, 胡士強(qiáng). 基于混沌特征的運(yùn)動模式分割和動態(tài)紋理分類. 自動化學(xué)報(bào), 2014, 40(4): 604-614)
========================================================================
【文題】: 融合局部與全局信息的頭發(fā)形狀模型
【作者】: 王楠, 艾海舟
【摘要】: 頭發(fā)在人體表觀中具有重要作用, 然而, 因?yàn)槿鄙儆行У男螤钅P? 頭發(fā)分割仍然是一個(gè)非常具有挑戰(zhàn)性的問題. 本文提出了一種基于部件的模型, 它對頭發(fā)形狀以及環(huán)境變化更加魯棒. 該模型將局部與全局信息相結(jié)合以描述頭發(fā)的形狀.局部模型通過一系列算法構(gòu)建, 包括全局形狀詞表生成, 詞表分類器學(xué)習(xí)以及參數(shù)優(yōu)化; 而全局模型刻畫不同的發(fā)型, 采用支持向量機(jī)(Support vector machine, SVM)來學(xué)習(xí), 它為所有潛在的發(fā)型配置部件并確定勢函數(shù). 在消費(fèi)者圖片上的實(shí)驗(yàn)證明了本文算法在頭發(fā)形狀多變和復(fù)雜環(huán)境等條件下的準(zhǔn)確性與有效性.
【全文鏈接】: ?attachType=PDF&id=18327
【引用格式】: WANG Nan, AI Hai-Zhou. Combining Local and Global Information for Hair Shape Modeling. Acta Automatica Sinica, 2014, 40(4): 615-623
(王楠, 艾海舟. 融合局部與全局信息的頭發(fā)形狀模型. 自動化學(xué)報(bào), 2014, 40(4): 615-623)
========================================================================
【文題】: 基于級聯(lián)重排序的漢語音字轉(zhuǎn)換
【作者】: 李鑫鑫, 王軒, 姚霖, 關(guān)鍵
【摘要】: N元語言模型是解決漢字音字轉(zhuǎn)換問題最常用的方法. 但在解析過程中, 每一個(gè)新詞的確定只依賴于前面的鄰近詞, 缺乏長距離詞之間的句法和語法約束. 我們引入詞性標(biāo)注和依存句法等子模型等來加強(qiáng)這種約束關(guān)系, 并采用兩個(gè)重排序方法來利用這些子模型提供的信息: 1)線性重排序方法, 采用最小錯誤學(xué)習(xí)方法來得到各個(gè)子模型的權(quán)重, 然后產(chǎn)生候選詞序列的概率; 2)采用平均感知器方法對候選詞序列進(jìn)行重排序, 能夠利用詞性、依存關(guān)系等復(fù)雜特征. 實(shí)驗(yàn)結(jié)果顯示, 兩種方法都能有效地提高詞N元語言模型的性能. 而將這兩種方法進(jìn)行級聯(lián), 即首先采用線性重排序方法, 然后把產(chǎn)生的概率作為感知器重排序方法的初始概率時(shí)性能取得最優(yōu).
【全文鏈接】: ?attachType=PDF&id=18328
【引用格式】: LI Xin-Xin, WANG Xuan, YAO Lin, GUAN Jian. Chinese Pinyin-to-character Conversion Based on Cascaded Reranking. Acta Automatica Sinica, 2014, 40(4): 624-634
(李鑫鑫, 王軒, 姚霖, 關(guān)鍵. 基于級聯(lián)重排序的漢語音字轉(zhuǎn)換. 自動化學(xué)報(bào), 2014, 40(4): 624-634)
========================================================================
【文題】: 基于指數(shù)損失和0-1損失的在線Boosting算法
【作者】: 侯杰, 茅耀斌, 孫金生
【摘要】: 推導(dǎo)了使用指數(shù)損失函數(shù)和0-1損失函數(shù)的Boosting 算法的嚴(yán)格在線形式, 證明這兩種在線Boosting算法最大化樣本間隔期望、最小化樣本間隔方差.通過增量估計(jì)樣本間隔的期望和方差, Boosting算法可應(yīng)用于在線學(xué)習(xí)問題而不損失分類準(zhǔn)確性. UCI數(shù)據(jù)集上的實(shí)驗(yàn)表明, 指數(shù)損失在線Boosting算法的分類準(zhǔn)確性與批量自適應(yīng) Boosting (AdaBoost)算法接近, 遠(yuǎn)優(yōu)于傳統(tǒng)的在線Boosting; 0-1損失在線Boosting算法分別最小化正負(fù)樣本誤差, 適用于不平衡數(shù)據(jù)問題, 并且在噪聲數(shù)據(jù)上分類性能更為穩(wěn)定.
【全文鏈接】: ?attachType=PDF&id=18329
【引用格式】: HOU Jie, MAO Yao-Bin, SUN Jin-Sheng. Online Boosting Algorithms Based on Exponential and 0-1 Loss. Acta Automatica Sinica, 2014, 40(4): 635-642
(侯杰, 茅耀斌, 孫金生. 基于指數(shù)損失和0-1損失的在線Boosting算法. 自動化學(xué)報(bào), 2014, 40(4): 635-642)
========================================================================
【文題】: 基于HEIV模型的攝像機(jī)一維標(biāo)定
【作者】: 王亮, 段福慶, 呂科
【摘要】: 多攝像機(jī)系統(tǒng)廣泛應(yīng)用于文化創(chuàng)意產(chǎn)業(yè), 其高精度標(biāo)定是迫切需要解決的一個(gè)關(guān)鍵問題. 新近出現(xiàn)的攝像機(jī)一維標(biāo)定方法能夠克服標(biāo)定物自身遮擋, 特別適合標(biāo)定多攝像機(jī)系統(tǒng). 然而, 現(xiàn)有的攝像機(jī)一維標(biāo)定研究主要集中在降低一維標(biāo)定物的運(yùn)動約束, 而標(biāo)定精度較低的問題未受到應(yīng)有的關(guān)注. 本文提出一種基于變量含異質(zhì)噪聲 (Heteroscedastic error-in-variables, HEIV)模型的高精度攝像機(jī)一維標(biāo)定方法. 首先, 推導(dǎo)出攝像機(jī)一維標(biāo)定的計(jì)算模型; 其次, 利用該計(jì)算模型詳細(xì)分析了一維標(biāo)定中的噪聲, 得出攝像機(jī)一維標(biāo)定可以視為一個(gè)HEIV問題的結(jié)論; 最后給出了基于HEIV模型的攝像機(jī)一維標(biāo)定算法. 與現(xiàn)有的算法相比, 該方法可以顯著改善一維標(biāo)定的精度, 并且受初始值影響小, 收斂速度快. 實(shí)驗(yàn)結(jié)果驗(yàn)證了該方法的正確性和可行性.
【全文鏈接】: ?attachType=PDF&id=18330
【引用格式】: WANG Liang, DUAN Fu-Qing, LV Ke. Camera Calibration with One-dimensional Objects Based on the Heteroscedastic Error-in-variables Model. Acta Automatica Sinica, 2014, 40(4): 643-652
(王亮, 段福慶, 呂科. 基于HEIV模型的攝像機(jī)一維標(biāo)定. 自動化學(xué)報(bào), 2014, 40(4): 643-652)
========================================================================
【文題】: 一種擴(kuò)展小孔成像模型的魚眼相機(jī)矯正與標(biāo)定方法
【作者】: 涂波, 劉璐, 劉一會, 金野, 湯俊雄
【摘要】: 魚眼相機(jī)由于其超寬的視場范圍(Field of view, FOV)(可以達(dá)到180°以上), 得到越來越廣泛的應(yīng)用. 常規(guī)的基于小孔成像模型的相機(jī)矯正與標(biāo)定算法在超寬視場的魚眼成像系統(tǒng)中已經(jīng)不太適用, 為了兼顧小孔模型的特點(diǎn), 本文提出了一種擴(kuò)展小孔成像模型的魚眼相機(jī)矯正與標(biāo)定方法. 此方法是對小孔成像模型的進(jìn)一步拓展, 不僅具備小孔模型實(shí)現(xiàn)簡單、適合人眼視覺效果以及相機(jī)標(biāo)定方便等優(yōu)點(diǎn), 同時(shí)將小孔成像模型適用的視場范圍擴(kuò)展到超寬視場領(lǐng)域. 其基本思路是: 在利用小孔成像模型對魚眼相機(jī)90°左右視場范圍進(jìn)行矯正與標(biāo)定的基礎(chǔ)上, 使用非等間距的點(diǎn)陣模板, 并結(jié)合直線擬合以及自然鄰點(diǎn)插值算法, 擴(kuò)展小孔模型適用的視場范圍. 本文使用魚眼相機(jī)從不同的角度拍攝多幅模板圖, 完成魚眼相機(jī)的矯正與標(biāo)定. 通過求取的小孔成像模型參數(shù)實(shí)現(xiàn)相機(jī)的標(biāo)定; 對魚眼相機(jī)拍攝的實(shí)際場景圖進(jìn)行畸變矯正測試, 結(jié)果表明此方法能夠很好地矯正魚眼相機(jī)存在的畸變, 得到符合人眼視覺效果的矯正圖; 單幅矯正圖視場范圍達(dá)到130°, 結(jié)合不同角度拍攝的多幅模板圖, 可把矯正的視場范圍擴(kuò)展到180°.
【全文鏈接】: ?attachType=PDF&id=18331
【引用格式】: TU Bo, LIU Lu, LIU Yi-Hui, JIN Ye, TANG Jun-Xiong. A Calibration Method for Fish-eye Cameras Based on Pinhole Model. Acta Automatica Sinica, 2014, 40(4): 653-659
(涂波, 劉璐, 劉一會, 金野, 湯俊雄. 一種擴(kuò)展小孔成像模型的魚眼相機(jī)矯正與標(biāo)定方法. 自動化學(xué)報(bào), 2014, 40(4): 653-659)
========================================================================
【文題】: 基于差異性的分類器集成: 有效性分析及優(yōu)化集成
【作者】: 楊春, 殷緒成, 郝紅衛(wèi), 閆琰, 王志彬
【摘要】: 差異性是分類器集成具有高泛化能力的必要條件. 然而, 目前對差異性度量、有效性及分類器優(yōu)化集成都沒有統(tǒng)一的分析和處理方法. 針對上述問題, 本文一方面從差異性度量方法、差異性度量有效性分析和相應(yīng)的分類器優(yōu)化集成技術(shù)三個(gè)角度, 全面總結(jié)與分析了基于差異性的分類器集成. 同時(shí), 本文還通過向量空間模型形象地論證了差異性度量的有效性. 另一方面, 本文針對多種典型的基于差異性的分類器集成技術(shù)(Bagging, boosting GA-based, quadratic programming (QP)、semi-definite programming (SDP)、regularized selective ensemble (RSE))在UCI數(shù)據(jù)庫和USPS數(shù)據(jù)庫上進(jìn)行了對比實(shí)驗(yàn)與性能分析, 并對如何選擇差異性度量方法和具體的優(yōu)化集成技術(shù)給出了可行性建議.
【全文鏈接】: ?attachType=PDF&id=18332
【引用格式】: YANG Chun, YIN Xu-Cheng, HAO Hong-Wei, YAN Yan, WANG Zhi-Bin. Classifier Ensemble with Diversity: Effectiveness Analysis and Ensemble Optimization. Acta Automatica Sinica, 2014, 40(4): 660-674
(楊春, 殷緒成, 郝紅衛(wèi), 閆琰, 王志彬. 基于差異性的分類器集成: 有效性分析及優(yōu)化集成. 自動化學(xué)報(bào), 2014, 40(4): 660-674)
========================================================================
【文題】: 2DPCA-SIFT: 一種有效的局部特征描述方法
【作者】: 顏雪軍, 趙春霞, 袁夏
【摘要】: PCA-SIFT (Principal component analysis—scale invariant feature transform)方法通過對歸一化梯度向量進(jìn)行PCA降維, 在保留特征不變性的同時(shí), 有效地降低了特征矢量的維數(shù), 從而提高了局部特征的匹配速度. 但PCA-SIFT中對本征向量空間的求解非常耗時(shí), 極大地限制了PCA-SIFT的靈活性與應(yīng)用范圍. 本文提出采用2DPCA對梯度向量塊進(jìn)行降維的特征描述方法. 該方法相比于PCA-SIFT, 可以快速地求解本征空間. 實(shí)驗(yàn)結(jié)果表明: 2DPCA-SIFT在多種圖像變換匹配和圖像檢索實(shí)驗(yàn)中可以實(shí)現(xiàn)與PCA-SIFT相當(dāng)?shù)男阅? 并且從計(jì)算效率上看, 2DPCA-SIFT具有更好的擴(kuò)展性.
【全文鏈接】: ?attachType=PDF&id=18333
【引用格式】: YAN Xue-Jun, ZHAO Chun-Xia, YUAN Xia. 2DPCA-SIFT: An Efficient Local Feature Descriptor. Acta Automatica Sinica, 2014, 40(4): 675-682
(顏雪軍, 趙春霞, 袁夏. 2DPCA-SIFT: 一種有效的局部特征描述方法. 自動化學(xué)報(bào), 2014, 40(4): 675-682)
========================================================================
【文題】: 含局部空間約束的t分布混合模型的點(diǎn)集配準(zhǔn)
【作者】: 周志勇, 李莉華, 鄭健, 蒯多杰, 胡粟, 張濤
【摘要】: 基于高斯混合模型(Gaussian mixture model, GMM)的點(diǎn)集非剛性配準(zhǔn)算法易受重尾點(diǎn)和異常點(diǎn)影響, 提出含局部空間約束的t分布混合模型的點(diǎn)集非剛性配準(zhǔn)算法. 通過期望最大化(Expectation maximization, EM)框架將高斯混合模型推廣為t分布混合模型; 把Dirichlet分布作為浮動點(diǎn)的先驗(yàn)權(quán)重, 并構(gòu)造含局部空間約束性質(zhì)的Dirichlet 分布參數(shù). 使用EM算法獲得配準(zhǔn)參數(shù)的閉合解; 計(jì)算浮動點(diǎn)的自由度, 改變其概率密度分布, 避免異常點(diǎn)水平估計(jì)誤差. 實(shí)驗(yàn)表明, 本文提出的配準(zhǔn)算法具有配準(zhǔn)誤差小、魯棒性好、抗干擾能力強(qiáng)等優(yōu)點(diǎn).
【全文鏈接】: ?attachType=PDF&id=18334
【引用格式】: ZHOU Zhi-Yong, LI Li-Hua, ZHENG Jian, KUAI Duo-Jie, HU Su, ZHANG Tao. Point Sets Non-rigid Registration Using Student’s-t Mixture Model with Spatial Constraints. Acta Automatica Sinica, 2014, 40(4): 683-696
(周志勇, 李莉華, 鄭健, 蒯多杰, 胡粟, 張濤. 含局部空間約束的t分布混合模型的點(diǎn)集配準(zhǔn). 自動化學(xué)報(bào), 2014, 40(4): 683-696)
========================================================================
【文題】: 基于不同色彩空間融合的快速圖像增強(qiáng)算法
【作者】: 肖進(jìn)勝, 單姍姍, 段鵬飛, 涂超平, 易本順
【摘要】: 針對現(xiàn)有Retinex算法中存在的色彩失真、噪聲放大及光暈偽影現(xiàn)象等問題, 本文提出了一種基于Retinex理論的改進(jìn)算法. 該算法首先在HSV空間對亮度分量V通道進(jìn)行增強(qiáng)處理, 同時(shí)在拉伸得到的對數(shù)域反射分量至一定的動態(tài)范圍時(shí)(本文是0~255), 引入增強(qiáng)調(diào)整因子, 調(diào)整不同亮度值的增強(qiáng)程度來避免噪聲放大及色彩失真現(xiàn)象; 然后在RGB空間, 通過分析光暈產(chǎn)生的原因, 提出一種改進(jìn)的高斯濾波器來消除光暈現(xiàn)象, 并在計(jì)算反射分量時(shí), 通過參數(shù)調(diào)整圖像顏色的保真度. 最后, 對上述兩種不同顏色空間的處理結(jié)果進(jìn)行加權(quán)平均作為算法的最終輸出. 實(shí)驗(yàn)結(jié)果表明, 針對不同光照條件下的圖像, 1)該算法可以明顯地改善光暈偽影現(xiàn)象; 2)無色彩失真、噪聲放大等問題; 3)效果和效率優(yōu)于帶色彩恢復(fù)的多尺度Retinex算法(Multi-scale retinex with color restoration, MSRCR)及其他對比算法.
【全文鏈接】: ?attachType=PDF&id=18335
【引用格式】: XIAO Jin-Sheng, SHAN Shan-Shan, DUAN Peng-Fei, TU Chao-Ping, YI Ben-Shun. A Fast Image Enhancement Algorithm Based on Fusion of Different Color Spaces. Acta Automatica Sinica, 2014, 40(4): 697-705
(肖進(jìn)勝, 單姍姍, 段鵬飛, 涂超平, 易本順. 基于不同色彩空間融合的快速圖像增強(qiáng)算法. 自動化學(xué)報(bào), 2014, 40(4): 697-705)
========================================================================
【文題】: 大規(guī)模圖像集中的代表性圖像選取
【作者】: 齊美彬, 朱俊俊, 紀(jì)平, 蔣建國
【摘要】: 針對傳統(tǒng)圖像檢索系統(tǒng)通過關(guān)鍵字搜索圖像時(shí)缺乏語義主題多樣性的問題, 提出了一種基于互近鄰一致性和近鄰傳播的代表性圖像選取算法, 為每個(gè)查詢選取與其相關(guān)的不同語義主題的圖像集合. 該算法利用互近鄰一致性調(diào)整圖像間的相似度, 再進(jìn)行近鄰傳播(AP)聚類將圖像集分為若干簇, 最后通過簇排序選取代表性圖像簇并從中選取中心圖像為代表性圖像. 實(shí)驗(yàn)表明, 本文方法的性能超過基于K-means的方法和基于Greedy K-means的方法, 所選圖像能直觀有效地概括源圖像集的內(nèi)容, 并且在語義上多樣化.
【全文鏈接】: ?attachType=PDF&id=18336
【引用格式】: QI Mei-Bin, ZHU Jun-Jun, JI Ping, JIANG Jian-Guo. Representative Image Selection from Image Dataset. Acta Automatica Sinica, 2014, 40(4): 706-712
(齊美彬, 朱俊俊, 紀(jì)平, 蔣建國. 大規(guī)模圖像集中的代表性圖像選取. 自動化學(xué)報(bào), 2014, 40(4): 706-712)
========================================================================
【文題】: 基于主動輪廓探索的多源色彩遷移
【作者】: 潘杰, 王雪松, 程玉虎
【摘要】: 傳統(tǒng)的多源色彩遷移算法常常利用歐氏色彩距離來分割目標(biāo)圖像, 由于色彩序列的模糊性與不確定性, 使得這種分割極易出現(xiàn)色彩扭曲現(xiàn)象. 針對這個(gè)問題, 提出一種基于主動輪廓探索的多源色彩遷移算法. 首先, 為將目標(biāo)圖像的主體與背景分離開, 利用一種主動進(jìn)化的方法生成虛擬輪廓線, 并采用能量函數(shù)評價(jià)機(jī)制迫使虛擬輪廓線逐漸逼近實(shí)際輪廓線. 其次, 合理利用源圖像與目標(biāo)圖像在RGB、Gray和LMS等不同色彩空間的表示、分割、轉(zhuǎn)換, 實(shí)現(xiàn)其在lαβ空間的多源色彩遷移. 最后, 將在lαβ空間遷移得到的目標(biāo)圖像逆向操作后恢復(fù)為RGB顯示. 單源與多源色彩遷移的對比、灰度化色彩通道的選擇以及各色彩空間不同色彩通道間的干涉性對比等實(shí)驗(yàn)驗(yàn)證了所提算法的合理性與有效性.
【全文鏈接】: ?attachType=PDF&id=18337
【引用格式】: PAN Jie, WANG Xue-Song, CHENG Yu-Hu. Multi-source Color Transfer Based on Active Contours Exploration. Acta Automatica Sinica, 2014, 40(4): 713-720
(潘杰, 王雪松, 程玉虎. 基于主動輪廓探索的多源色彩遷移. 自動化學(xué)報(bào), 2014, 40(4): 713-720)
========================================================================
【文題】: 組合凸線性感知器的極大切割構(gòu)造方法
【作者】: 冷強(qiáng)奎, 李玉鑑
【摘要】: 組合凸線性感知器(Multiconlitron)是用來構(gòu)造分片線性分類器的一個(gè)通用理論框架, 對于凸可分和疊可分情況, 分別使用支持凸線性感知器算法(Support conlitron algorithm, SCA)和支持組合凸線性感知器算法(Support multiconlitron algorithm, SMA)將兩類樣本分開. 本文在此基礎(chǔ)上, 提出了一種基于極大切割(Maximal cutting)的組合凸線性感知器構(gòu)造方法. 該方法由兩階段訓(xùn)練構(gòu)成, 第一階段稱為極大切割過程(Maximal cutting process, MCP), 通過迭代不斷尋求能夠切開最多樣本的線性邊界, 并因此來構(gòu)造盡可能小的決策函數(shù)集, 最大程度減少決策函數(shù)集中線性函數(shù)的數(shù)量, 最終簡化分類模型. 第二階段稱為邊界調(diào)整過程(Boundary adjusting process, BAP), 對MCP得到的初始分類邊界進(jìn)行一個(gè)二次訓(xùn)練, 調(diào)整邊界到適當(dāng)位置, 以提高感知器的泛化能力. 數(shù)值實(shí)驗(yàn)說明, 此方法能夠產(chǎn)生更為合理的分類模型, 提高了感知器的性能. 同其他典型分片線性分類器的性能對比, 也說明了這種方法的有效性和競爭力.
【全文鏈接】: ?attachType=PDF&id=18338
【引用格式】: LENG Qiang-Kui, LI Yu-Jian. Maximal Cutting Construction for Multiconlitron. Acta Automatica Sinica, 2014, 40(4): 721-730
(冷強(qiáng)奎, 李玉鑑. 組合凸線性感知器的極大切割構(gòu)造方法. 自動化學(xué)報(bào), 2014, 40(4): 721-730)
========================================================================
【文題】: 一種分步的融合時(shí)空信息的背景建模
【作者】: 儲珺, 楊樊, 張桂梅, 汪凌峰
【摘要】: 自然場景中的光照突變和樹枝、水面等不規(guī)則運(yùn)動是背景建模的主要困難. 針對該問題, 提出一種分步的融合時(shí)域信息和空域信息的背景建模方法. 在時(shí)域, 采用具有光照不變性的顏色空間表征時(shí)域信息, 并提出對噪聲和光照突變具有較好適應(yīng)性的碼字聚類準(zhǔn)則和自適應(yīng)背景更新策略, 構(gòu)造了對噪聲和光照突變具有較好適應(yīng)性的時(shí)域信息背景模型. 在空域, 通過采樣將測試序列圖像分成兩幅子圖, 而后利用時(shí)域模型檢測其中一幅子圖, 并將檢測結(jié)果作為另一幅子圖的先驗(yàn)信息, 同時(shí)采用馬爾科夫隨機(jī)場(Markov random field, MRF)對其加以約束, 最終檢測其狀態(tài). 在多個(gè)測試視頻序列上的實(shí)驗(yàn)結(jié)果表明, 本文背景模型對于自然場景中的光照突變和不規(guī)則運(yùn)動具有較好的適應(yīng)性.
【全文鏈接】: ?attachType=PDF&id=18339
【引用格式】: CHU Jun, YANG Fan, ZHANG Gui-Mei, WANG Ling-Feng. A Stepwise Background Subtraction by Fusion Spatio-temporal Information. Acta Automatica Sinica, 2014, 40(4): 731-743
(儲珺, 楊樊, 張桂梅, 汪凌峰. 一種分步的融合時(shí)空信息的背景建模. 自動化學(xué)報(bào), 2014, 40(4): 731-743)
========================================================================
【文題】: 霧霾天氣下可見光圖像場景再現(xiàn)
【作者】: 李權(quán)合, 畢篤彥, 許悅雷, 查宇飛
【摘要】: 為了再現(xiàn)霧霾天氣下可見光圖像的清晰場景, 有效抑制霧霾退化造成的對比度、清晰度下降, 提出了單色大氣散射模型新的求解方法. 首先, 將單色大氣散射模型類比Retinex模型, 重新解釋了大氣傳遞圖; 依據(jù)大氣傳遞圖的先驗(yàn)知識和幾點(diǎn)假設(shè), 建立目標(biāo)函數(shù)的變分模型, 將大氣傳遞圖的估計(jì)問題轉(zhuǎn)化為二次規(guī)劃問題. 通過帶約束的歸一化最速下降法獲取最優(yōu)解, 并采用多分辨率技術(shù)加速計(jì)算; 在HSI空間的亮度分量上反解單色大氣散射模型, 得到反射圖像, 并依據(jù)大氣傳遞圖自適應(yīng)校正飽和度分量. 實(shí)驗(yàn)結(jié)果表明, 新算法可有效去除霧霾, 再現(xiàn)真實(shí)場景的對比度和清晰度, 同現(xiàn)有去霧算法相比, 本文算法取得了相似甚至更好的去霧效果.
【全文鏈接】: ?attachType=PDF&id=18340
【引用格式】: LI Quan-He, BI Du-Yan, XU Yue-Lei, ZHA Yu-Fei. Haze Degraded Image Scene Rendition. Acta Automatica Sinica, 2014, 40(4): 744-750
(李權(quán)合, 畢篤彥, 許悅雷, 查宇飛. 霧霾天氣下可見光圖像場景再現(xiàn). 自動化學(xué)報(bào), 2014, 40(4): 744-750)
========================================================================
【文題】: 基于多尺度圖匹配核的場景單字識別方法
【作者】: 史存召, 王春恒, 肖柏華, 張陽, 高嵩
【摘要】: 由于自然場景中的文字具有較大的類內(nèi)間距, 因此識別場景文字具有很大的挑戰(zhàn)性. 本文提出了一種基于多尺度圖匹配核的場景單字識別方法. 為了利用字符特有的結(jié)構(gòu)特征, 將每幅圖像表示為基于不同網(wǎng)格劃分的無向圖, 通過計(jì)算兩個(gè)無向圖之間圖匹配的最優(yōu)能量值來得到兩幅圖像的相似度, 由于圖匹配在計(jì)算每個(gè)節(jié)點(diǎn)的最佳匹配節(jié)點(diǎn)時(shí)也考慮了相鄰節(jié)點(diǎn)之間的空間位置約束, 因此可以應(yīng)對具有一定形變的文字. 通過圖匹配得到的兩幅圖像之間的相似度很適合用來構(gòu)造支持向量機(jī)的核矩陣. 本文將不同尺度網(wǎng)格劃分下得到的核矩陣進(jìn)行多核融合, 使得最終得到的核矩陣更加地魯棒. 在國際公開場景文字識別數(shù)據(jù)集Chars74k和ICDAR03-CH上的實(shí)驗(yàn)結(jié)果表明, 本方法取得了高于國際上已發(fā)表的其他方法的單字識別率.
【全文鏈接】: ?attachType=PDF&id=18341
【引用格式】: SHI Cun-Zhao, WANG Chun-Heng, XIAO Bai-Hua, ZHANG Yang, GAO Song. Multi-scale Graph-matching Based Kernel for Character Recognition from Natural Scenes. Acta Automatica Sinica, 2014, 40(4): 751-756
(史存召, 王春恒, 肖柏華, 張陽, 高嵩. 基于多尺度圖匹配核的場景單字識別方法. 自動化學(xué)報(bào), 2014, 40(4): 751-756)
========================================================================
【文題】: 非下采樣輪廓波變換快速算法
【作者】: 嚴(yán)春滿, 郭寶龍, 易盟
【摘要】: 多尺度幾何分析(MGA)是一種有效的圖像處理方法. 作為MGA的一種離散實(shí)現(xiàn)方法, 非下采樣輪廓波變換(NSCT)被廣泛應(yīng)用于圖像去噪、圖像融合、圖像增強(qiáng)、特征提取等領(lǐng)域. 然而, 由于該變換的高冗余性, 其計(jì)算效率受到一定限制. 因此, 對NSCT快速算法的研究具有現(xiàn)實(shí)意義. 本文采用一種優(yōu)化的方向?yàn)V波器改進(jìn)了原NSCT變換, 以損失部分重建圖像質(zhì)量為代價(jià), 獲得算法處理速度的顯著提高. 實(shí)驗(yàn)結(jié)果可見, 在滿足重建圖像主觀質(zhì)量視覺要求的前提下, 算法速度可比原變換提高若干倍. 圖像去噪實(shí)驗(yàn)進(jìn)一步驗(yàn)證了算法的可靠性及效率.
【全文鏈接】: ?attachType=PDF&id=18342
【引用格式】: YAN Chun-Man, GUO Bao-Long, YI Meng. Fast Algorithm for Nonsubsampled Contourlet Transform. Acta Automatica Sinica, 2014, 40(4): 757-762
(嚴(yán)春滿, 郭寶龍, 易盟. 非下采樣輪廓波變換快速算法. 自動化學(xué)報(bào), 2014, 40(4): 757-762)
========================================================================
【文題】: 數(shù)據(jù)驅(qū)動的層次場景序列識別模型研究
【作者】: 馮文剛
【摘要】: 針對層次場景圖像序列, 本文提出了一種數(shù)據(jù)驅(qū)動的基于快速序列視覺表述任務(wù)(rapid serial visual presentation task, RSVP)的場景識別模型. 首先基于金字塔模型提取三層尺度圖像塊, 然后構(gòu)建包括全局和局部特征的詞匯字典, 接著分別利用生成模型和判決模型訓(xùn)練視覺詞匯, 最后通過神經(jīng)網(wǎng)絡(luò)從圖像塊標(biāo)記中獲得場景類別. 實(shí)驗(yàn)表明算法能夠獲得更為精確的分類結(jié)果.
【全文鏈接】: ?attachType=PDF&id=18343
【引用格式】: FENG Wen-Gang. Data Driven Hierarchical Serial Scene Classification Framework. Acta Automatica Sinica, 2014, 40(4): 763-770
(馮文剛. 數(shù)據(jù)驅(qū)動的層次場景序列識別模型研究. 自動化學(xué)報(bào), 2014, 40(4): 763-770)
========================================================================
【文題】: 基于雙層模型的維吾爾語突發(fā)事件因果關(guān)系抽取
【作者】: 鐘軍, 禹龍, 田生偉, 吐爾根·依布拉音
【摘要】: 針對傳統(tǒng)事件因果關(guān)系識別覆蓋范圍小和人工標(biāo)注代價(jià)高等不足, 提出了一種基于雙層模型的維吾爾語突發(fā)事件因果關(guān)系抽取方法. 該方法采用分治思想, 將因果關(guān)系抽取問題轉(zhuǎn)化為對事件序列的兩次模式識別標(biāo)注. 采用Bootstrapping算法, 在第一次模式識別時(shí), 標(biāo)注因果關(guān)系的語義角色, 并將標(biāo)注的語義角色標(biāo)簽作為新的特征傳遞給第二層模式識別, 用于因果關(guān)系邊界標(biāo)注. 該方法用于維吾爾語突發(fā)事件顯式因果關(guān)系的抽取準(zhǔn)確率為85.39%, 召回率為77.53%, 證明了本文提出的方法在維吾爾語主題突發(fā)事件因果關(guān)系抽取上的有效性和實(shí)用性.
【全文鏈接】: ?attachType=PDF&id=18344
【引用格式】: ZHONG Jun, YU Long, TIAN Sheng-Wei, TurgLm IBRAHIM. Causal Relation Extraction of Uyghur Emergency Events Based on Cascaded Model. Acta Automatica Sinica, 2014, 40(4): 771-779
(鐘軍, 禹龍, 田生偉, 吐爾根·依布拉音. 基于雙層模型的維吾爾語突發(fā)事件因果關(guān)系抽取. 自動化學(xué)報(bào), 2014, 40(4): 771-779)
========================================================================
短文
========================================================================
【文題】: 基于核函數(shù)的IVEC-SVM說話人識別系統(tǒng)研究
【作者】: 栗志意, 張衛(wèi)強(qiáng), 何亮, 劉加
【摘要】: 在說話人識別研究中, 基于身份認(rèn)證向量(Identity vector, IVEC)的說話人建模方法可以有效地提取說話人信息, 是目前處于國際前沿的建模方法.本文對身份認(rèn)證向量后接支持向量機(jī)(Identity vector followed by support vector machine, IVEC-SVM) 的說話人識別系統(tǒng)進(jìn)行了研究, 對比了該系統(tǒng)在十種不同核函數(shù)下的識別性能, 并與文獻(xiàn)中身份認(rèn)證向量后接余弦距離打分(Identity vector followed by cosine distance scoring, IVEC-CDS)系統(tǒng)進(jìn)行了比較. 在美國國家標(biāo)準(zhǔn)技術(shù)局(American National Institute of Standards and Technology, NIST)組織的2010年電話信道——電話信道說話人識別核心評測數(shù)據(jù)庫上的實(shí)驗(yàn)結(jié)果顯示, 基于核函數(shù)的IVEC-SVM系統(tǒng)性能明顯優(yōu)于IVEC-CDS的系統(tǒng)性能.此外, 實(shí)驗(yàn)結(jié)果表明基于Spline核的IVEC-SVM系統(tǒng)可取得最好的識別性能, 與IVEC-CDS系統(tǒng)相比, 其等錯點(diǎn)(Equal error rate, EER)在分?jǐn)?shù)歸一化前后分別降低了10%和3%.
【全文鏈接】: ?attachType=PDF&id=18345
【引用格式】: LI Zhi-Yi, ZHANG Wei-Qiang, HE Liang, LIU Jia. Speaker Recognition with Kernel Based IVEC-SVM. Acta Automatica Sinica, 2014, 40(4): 780-784
(栗志意, 張衛(wèi)強(qiáng), 何亮, 劉加. 基于核函數(shù)的IVEC-SVM說話人識別系統(tǒng)研究. 自動化學(xué)報(bào), 2014, 40(4): 780-784)
========================================================================
上一篇:[轉(zhuǎn)載]按照PPP,中國或成最大經(jīng)濟(jì)體, 人民幣值不再低估?
下一篇:[轉(zhuǎn)載]紐約時(shí)報(bào):普京成功給德國人洗了腦Why Germans Love Russia
本文關(guān)鍵詞:引入視覺注意機(jī)制的目標(biāo)跟蹤方法綜述,,由筆耕文化傳播整理發(fā)布。
本文編號:228684
本文鏈接:http://sikaile.net/wenshubaike/xxkj/228684.html