圖像自動(dòng)標(biāo)注算法研究
本文關(guān)鍵詞:圖像自動(dòng)標(biāo)注算法研究,由筆耕文化傳播整理發(fā)布。
【摘要】:隨著互聯(lián)網(wǎng)(Internet)的快速發(fā)展,圖像的數(shù)量呈幾何級(jí)數(shù)增長(zhǎng),如何從龐大的數(shù)據(jù)庫有效地檢索和管理圖像是現(xiàn)在迫切需要解決的問題。目前,許多Internet公司都開發(fā)了他們自己的圖像搜索引擎,但多數(shù)是采用基于文本的圖像檢索技術(shù),然而其圖像檢索通常是人工進(jìn)行標(biāo)注的方式,既費(fèi)時(shí)又費(fèi)力。目前,基于內(nèi)容的圖像標(biāo)注技術(shù)是利用圖像中顏色、紋理、形狀等底層特征進(jìn)行相似性匹配,國(guó)內(nèi)外也進(jìn)行了大量相關(guān)的研究。但因該技術(shù)存在“語義鴻溝”的問題,制約了其對(duì)圖像進(jìn)行準(zhǔn)確、快速標(biāo)注。本文提出了一種基于聯(lián)合特征選擇的多示例圖像語義自動(dòng)標(biāo)注方法。該方法通過訓(xùn)練圖像的語義標(biāo)簽自動(dòng)標(biāo)注測(cè)試圖像的標(biāo)簽。在此基礎(chǔ)上,又對(duì)圖像標(biāo)注做了擴(kuò)展,提出了基于最大熵模型的圖像標(biāo)簽分布估計(jì)算法,即可以同時(shí)得到測(cè)試圖像的標(biāo)簽及標(biāo)簽所占圖像的比例(標(biāo)簽分布)。那么對(duì)圖像標(biāo)注和標(biāo)簽分布這兩個(gè)方面,本文的研究?jī)?nèi)容包括:1.針對(duì)語義標(biāo)注的不準(zhǔn)確性,本文研究多示例學(xué)習(xí)方法在圖像標(biāo)注方面的應(yīng)用。首先要對(duì)圖像進(jìn)行示例分割,并提取每個(gè)示例的底層特征。然后把這些示例的特征和標(biāo)簽輸入到算法模型中學(xué)習(xí)。多示例學(xué)習(xí)既可以處理單標(biāo)簽也可以解決多標(biāo)簽圖像自動(dòng)標(biāo)注問題。2.針對(duì)圖像標(biāo)簽數(shù)量的有限性,本文研究半監(jiān)督學(xué)習(xí)方法在圖像標(biāo)注方面的應(yīng)用。從數(shù)據(jù)集中選取一部分有標(biāo)簽的樣本,另一部分沒有標(biāo)簽的樣本,把它們一起作為訓(xùn)練樣本進(jìn)行學(xué)習(xí)。采用圖拉普拉斯來解決半監(jiān)督學(xué)習(xí)的問題,首先構(gòu)建加權(quán)圖,然后求得圖拉普拉斯算子,最后代入流行正則化公式對(duì)目標(biāo)函數(shù)進(jìn)行優(yōu)化。3.設(shè)計(jì)了一種基于聯(lián)合特征選擇的多示例多標(biāo)簽(Joint Feature Selection of Multi-instance Multi-lable,JFS-MIML)圖像自動(dòng)標(biāo)注算法。在多示例學(xué)習(xí)的基礎(chǔ)上對(duì)數(shù)據(jù)集進(jìn)行半監(jiān)督的學(xué)習(xí),又利用流形學(xué)習(xí)的方法可以對(duì)特征維數(shù)高的數(shù)據(jù)進(jìn)行降維處理。與此同時(shí),本文又結(jié)合了稀疏表示構(gòu)建了線性回歸模型,最優(yōu)化得到基于特征選擇的多示例多標(biāo)簽圖像自動(dòng)標(biāo)注算法。在訓(xùn)練得到預(yù)測(cè)值后,本文通過采取自適應(yīng)閾值對(duì)預(yù)測(cè)值進(jìn)行判定來得到標(biāo)簽,進(jìn)而可求得圖像標(biāo)注的準(zhǔn)確率。4.本文對(duì)圖像標(biāo)注進(jìn)行了擴(kuò)展,提出一種基于最大熵模型圖像標(biāo)簽分布學(xué)習(xí)的方法。標(biāo)簽分布學(xué)習(xí)即可得到圖像的標(biāo)簽,又可得到每張圖像中標(biāo)簽的分布信息,進(jìn)而知道在每幅圖像中每種標(biāo)簽所占的比例,用戶可優(yōu)先選擇所搜索標(biāo)簽中比例最大的圖像,提高了圖像檢索準(zhǔn)確率和合理性。在標(biāo)簽分布學(xué)習(xí)的啟發(fā)下,本文把基于特征選擇的多示例多標(biāo)簽圖像自動(dòng)標(biāo)注算法應(yīng)用在標(biāo)簽分布學(xué)習(xí)中,也得到了較好的結(jié)果。
【關(guān)鍵詞】:圖像標(biāo)注 特征選擇 多示例學(xué)習(xí) 流形學(xué)習(xí) 稀疏 標(biāo)簽分布
【學(xué)位授予單位】:中國(guó)計(jì)量學(xué)院
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類號(hào)】:TP391.41
【目錄】:
- 致謝5-6
- 摘要6-8
- Abstract8-14
- 1 緒論14-26
- 1.1 課題背景和意義14-16
- 1.2 國(guó)內(nèi)外研究現(xiàn)狀16-24
- 1.2.1 基于概率統(tǒng)計(jì)模型的方法17-19
- 1.2.2 關(guān)聯(lián)文本法19-20
- 1.2.3 分類法20-24
- 1.3 研究?jī)?nèi)容和目標(biāo)24-25
- 1.4 本文組織結(jié)構(gòu)25-26
- 2 研究基礎(chǔ)26-33
- 2.1 引言26
- 2.2 多示例學(xué)習(xí)26-30
- 2.3 示例的分割30-31
- 2.4 特征提取31-32
- 2.5 本章小結(jié)32-33
- 3 基于聯(lián)合特征選擇的多示例圖像語義自動(dòng)標(biāo)注33-49
- 3.1 引言33-34
- 3.2 特征選擇34-35
- 3.3 半監(jiān)督學(xué)習(xí)35-36
- 3.4 基于流形學(xué)習(xí)的特征優(yōu)化36-38
- 3.4.1 主成分分析36-37
- 3.4.2 局部線性嵌入37
- 3.4.3 圖拉普拉斯37-38
- 3.5 稀疏表示38-39
- 3.6 算法優(yōu)化39-42
- 3.7 實(shí)驗(yàn)42-44
- 3.7.1 數(shù)據(jù)集42-43
- 3.7.2 標(biāo)簽準(zhǔn)確率判定43-44
- 3.8 實(shí)驗(yàn)結(jié)果及分析44-47
- 3.9 本章小結(jié)47-49
- 4 基于最大熵模型的標(biāo)簽分布學(xué)習(xí)49-61
- 4.1 引言49-50
- 4.2 標(biāo)簽分布50-51
- 4.3 算法51-55
- 4.4 實(shí)驗(yàn)結(jié)果及分析55-59
- 4.4.1 基于聯(lián)合特征選擇的標(biāo)簽分布學(xué)習(xí)55-57
- 4.4.2 基于最大熵模型的標(biāo)簽分布學(xué)習(xí)57-59
- 4.5 本章小結(jié)59-61
- 5 總結(jié)與展望61-62
- 參考文獻(xiàn)62-66
- 作者簡(jiǎn)歷66
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫 前10條
1 風(fēng)吹雨;編程實(shí)現(xiàn)自動(dòng)標(biāo)注漢語拼音[J];電腦愛好者;2001年19期
2 尹文杰;韓軍偉;郭雷;;圖像與視頻自動(dòng)標(biāo)注最新進(jìn)展[J];計(jì)算機(jī)科學(xué);2011年12期
3 孫茂松,盧紅娜,鄒嘉彥;基于隱Markov模型的漢語詞類自動(dòng)標(biāo)注的實(shí)驗(yàn)研究[J];清華大學(xué)學(xué)報(bào)(自然科學(xué)版);2000年09期
4 錢玉森,陳立平,李戰(zhàn)軍,鐘毅芳,周濟(jì);基于三維配筋的水工結(jié)構(gòu)鋼筋圖自動(dòng)標(biāo)注研究[J];計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào);2001年01期
5 周馳;丘宏揚(yáng);黃珍媛;;利用線性規(guī)劃解決模具零件自動(dòng)標(biāo)注的尺寸重疊問題[J];鍛壓裝備與制造技術(shù);2007年06期
6 姚雙云;胡金柱;舒江波;沈威;;篇章連貫語義關(guān)系的自動(dòng)標(biāo)注方法[J];計(jì)算機(jī)工程;2012年07期
7 鄭澤芝;敖婷;;基于底表的多層掃描術(shù)語自動(dòng)標(biāo)注算法[J];廈門大學(xué)學(xué)報(bào)(自然科學(xué)版);2011年03期
8 黃昆;自動(dòng)生成中線,自動(dòng)標(biāo)注拐點(diǎn)參數(shù)……[J];工程設(shè)計(jì)CAD及自動(dòng)化;1998年03期
9 田楓;沈旭昆;杜睿山;周凱;;基于多特征標(biāo)簽相關(guān)性學(xué)習(xí)的圖像自動(dòng)標(biāo)注[J];系統(tǒng)仿真學(xué)報(bào);2013年02期
10 劉寶芹,施法中,唐衛(wèi)清,黃永紅;一種新的劃分下鋼結(jié)構(gòu)節(jié)點(diǎn)圖自動(dòng)標(biāo)注算法[J];計(jì)算機(jī)工程與應(yīng)用;2002年12期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫 前6條
1 劉開瑛;陳雪艷;李濟(jì)洪;;漢語框架元素自動(dòng)標(biāo)注實(shí)驗(yàn)報(bào)告[A];第四屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集(上)[C];2008年
2 陳戀;周向東;葉劍燁;謝祖銘;張亮;施伯樂;;基于分層圖像文檔模型的圖像語義自動(dòng)標(biāo)注[A];第二十二屆中國(guó)數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2005年
3 吐爾根·依不拉音;阿里甫·庫爾班;阿不都熱依木;;基于詞典的現(xiàn)代維吾爾語詞性自動(dòng)標(biāo)注系統(tǒng)的研究[A];中文信息處理前沿進(jìn)展——中國(guó)中文信息學(xué)會(huì)二十五周年學(xué)術(shù)會(huì)議論文集[C];2006年
4 楊新軍;;基于三維設(shè)計(jì)的鋼筋圖自動(dòng)標(biāo)注研究[A];2004年水工專委會(huì)學(xué)術(shù)交流會(huì)議學(xué)術(shù)論文集[C];2004年
5 王斯日古楞;德·薩日娜;那順烏日?qǐng)D;;現(xiàn)代蒙古語謂語段自動(dòng)標(biāo)注系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[A];民族語言文字信息技術(shù)研究——第十一屆全國(guó)民族語言文字信息學(xué)術(shù)研討會(huì)論文集[C];2007年
6 盧咪咪;謝磊;鄭李磊;楊玉蓮;張艷寧;;基于Alize工具包的廣播音頻播音員自動(dòng)標(biāo)注系統(tǒng)[A];第18屆全國(guó)多媒體學(xué)術(shù)會(huì)議(NCMT2009)、第5屆全國(guó)人機(jī)交互學(xué)術(shù)會(huì)議(CHCI2009)、第5屆全國(guó)普適計(jì)算學(xué)術(shù)會(huì)議(PCC2009)論文集[C];2009年
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫 前1條
1 王斌;圖像檢索中自動(dòng)標(biāo)注與快速相似搜索技術(shù)研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2007年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 何希圣;圖像自動(dòng)標(biāo)注方法研究[D];復(fù)旦大學(xué);2010年
2 李圣楠;基于自動(dòng)標(biāo)注訓(xùn)練集的微博語料情感分類的研究[D];東北師范大學(xué);2013年
3 卓景文;基于主題分析的圖像自動(dòng)標(biāo)注研究[D];安徽大學(xué);2012年
4 張艷青;面向漢語拼音自動(dòng)標(biāo)注的現(xiàn)代漢語多音字詞研究[D];河北大學(xué);2011年
5 黃紫藤;動(dòng)畫角色自動(dòng)標(biāo)注方法研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2010年
6 史玉翡;用于信息抽取的自動(dòng)標(biāo)注技術(shù)研究[D];大連海事大學(xué);2010年
7 陳雪艷;基于條件隨機(jī)場(chǎng)的句法語義自動(dòng)標(biāo)注探索[D];山西大學(xué);2009年
8 王曉明;基于多示例學(xué)習(xí)的跨場(chǎng)景圖像自動(dòng)標(biāo)注研究[D];哈爾濱工業(yè)大學(xué);2013年
9 代麗潔;自然場(chǎng)景圖像的自動(dòng)標(biāo)注方法研究[D];哈爾濱工程大學(xué);2010年
10 曲靜;商品意見屬性自動(dòng)標(biāo)注系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];電子科技大學(xué);2013年
本文關(guān)鍵詞:圖像自動(dòng)標(biāo)注算法研究,由筆耕文化傳播整理發(fā)布。
,本文編號(hào):357025
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/357025.html