天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 搜索引擎論文 >

基于噪音Oracle的模型未知錯誤識別研究

發(fā)布時間:2020-10-20 02:44
   近年來,隨著以深度學習為代表的機器學習技術在學術界和工業(yè)界的不斷發(fā)展與進步,研究人員訓練出來的模型已經能夠在多個領域能夠該領域的專家,如圖像識別、圍棋、語音識別等。但是深度學習這類需要大量高質量有標簽數據支持的技術,往往在一些數據量少或標注成本昂貴的任務上無法取得較好的預期效果,比如醫(yī)療診斷或者小語種機器翻譯任務等。在這些任務中,由于訓練時所收集到的數據和現實環(huán)境數據在分布上存在較大的偏差,導致訓練出來的模型對于一些樣本識別錯誤非常嚴重——識別錯誤的同時給予了這次識別非常高的置信度。這類被嚴重預測錯誤的樣本被稱作為模型的未知錯誤(Unknown Unknowns),這類錯誤對高風險任務(如醫(yī)療診斷)會造成災難性后果。因此,對模型的未知錯誤進行識別和分析是非常必要的。由于未知錯誤是模型無法感知到的一類錯誤,因此現有的識別算法都依賴于第三方人工標注系統Oracle,即利用人工做最后的標注工作。而現有已提出的算法都是假設Oracle返回的標簽是百分之百正確的,這在實際應用中并不現實。尤其是當識別算法基于眾包(Crowdsourcing)等常規(guī)標注系統時,Oracle返回的標注結果往往帶有一定的噪音,即有可能返回錯誤的標注結果。這些錯誤標注會導致識別算法將模型預測正確的樣本認做是未知錯誤,這些偽未知錯誤的存在會對識別算法產生巨大的影響,包括降低最終識別出來的未知錯誤質量以及對識別過程造成誤導。為此,本文將基于噪音Oracle對模型的未知錯誤進行識別和分析,試圖在有限的預算下提高模型未知錯誤的識別率和準確率。歸納而言,本文的貢獻有以下幾點:1)本文指出和分析了傳統識別模型未知錯誤算法在噪音Oracle下的局限性,這些局限性包括:識別出來的未知錯誤質量低以及算法在識別過程中容易受錯誤標注影響。并對已有效用函數進行擴展,提出了一種適用于噪音Oracle下識別未知錯誤的新效用函數。2)本文提出了兩種高效的識別未知錯誤算法,包括基于動態(tài)最近鄰算法和基于標簽傳播算法。實驗驗證了我們提出的兩種算法在識別未知錯誤的有效性和在噪音Oracle下的抗噪性都優(yōu)于已有的算法。此外,本文還設計并實現了一套模型未知錯誤自動化識別系統,能夠在未標注數據中結合研究人員的自我標注快速找到大量有價值數據,方便理解模型的缺陷和后續(xù)模型的改善。
【學位單位】:華東師范大學
【學位級別】:碩士
【學位年份】:2019
【中圖分類】:TP301.6
【部分圖文】:

流程圖,AI技術,流程圖


雖然深度學習在很多任務上能表現出比傳統算法更好的性能,但這類數據驅動技術往往需要大量高質量、有標簽數據才能獲得較好的效果。然而,很多任務的數據采集以及標注難度都很困難,比如圖1-1中所示的醫(yī)療診斷任務。在這些任務中經常會發(fā)生收集到的訓練數據覆蓋不全面的問題,這種問題會導致訓練集和真實部署環(huán)境數據之間存在采樣偏差問題(Sampling Bias Problem),而且這種采樣偏差問題往往很難發(fā)現;谶@些有偏差數據集訓練出來的模型在真實環(huán)境中的預測性能沒有實驗環(huán)境下好。在所有模型預測錯誤的樣本中,一部分會被模型給予較低的置信度,這類樣本被稱作為模型的已知錯誤(Known Unknowns)[2][18],即模型已經知道其預測結果可能是錯誤的樣本。這類模型已知錯誤通常是訓練集里含有但數量不多的樣本[2],在預測階段模型無法肯定其預測結果是一定正確的。在模型預測錯誤的樣本中,還有一小部分是模型給予很高的置信度

流程圖,錯誤識別,流程圖,模型


目的是向訓練集中添加在模型分類邊界處的樣本,使新模型能夠學到更好的分類邊界,減少已知錯誤的數量來提升準確率。另外,在一些高風險任務中,往往會對模型預測置信度不高的樣本進行人工標注以避免重大事故的發(fā)生。比如,視頻網站對用戶上傳的投稿審核流程一般是先模型預測,然后通過設置閾值把一些置信度低的稿件讓審核人員人工檢查一遍,降低這些已知錯誤帶來的風險。雖然模型的未知錯誤數量相對于已知錯誤往往較少,但由于它們不能通過設置置信度閾值的方法篩選出來,因此在這些高風險任務中危害更大。假如在圖1-1的醫(yī)療診斷系統中,當模型對一位潛在患者給出健康診斷同時給予非常高的置信度。這種情況下,由于對診斷模型的信任,醫(yī)生往往不會再讓該患者進行進一步的分析和審查,最終導致災難性的后果。因此,對模型的未知錯誤進行識別和分析是一件非常有價值且迫切的任務。

示意圖,分類模型,示意圖,特征空間


往往都是假設未知錯誤聚集在特征空間上的一些確定區(qū)域[18]。比如,一個貓狗圖片分類模型(圖1-3),由于訓練集里缺少白皮膚狗的圖片,因此模型將很多白皮膚狗圖片識別錯誤,其中一些置信度高的樣本就成為了模型的未知錯誤。這些圖片在一些高階特征空間上具有一定的相似性(比如都具有相似顏色的皮膚)。而如果僅僅是在低階特征空間上,如用原始像素作為特征向量來進行距離計算,那么識別算法很難捕捉到這些高階抽象信息。
【相似文獻】

相關期刊論文 前10條

1 張劍;;ORACLE字符集遷移及亂碼問題的解析[J];赤子(上中旬);2016年22期

2 赫春曉;;一種基于Oracle的街景分布式數據庫實現方法[J];現代測繪;2017年05期

3 宋巖;;基于服務器端的鉆井工程計算的研究與運用——Oracle鉆井數據庫[J];科技創(chuàng)新與應用;2017年26期

4 冼志生;;虛擬技術在Oracle數據庫備份中的應用[J];信息化建設;2015年12期

5 杜戰(zhàn)偉;;探討Oracle數據庫管理之控制文件[J];電子測試;2016年10期

6 白天;楊志和;邱自華;;Oracle數據庫系統及應用課程教學改革探索[J];湖南理工學院學報(自然科學版);2016年03期

7 李璐璐;;Oracle數據庫優(yōu)化方法分析[J];硅谷;2014年24期

8 楊瑩;;基于Oracle數據庫大數據的檢索優(yōu)化分析與設計[J];數碼世界;2017年04期

9 沈一通;;基于oracle日志挖掘的增量同步方案的設計[J];數碼世界;2017年06期

10 楊彥聰;武媛;;Oracle在學生管理系統中的應用[J];信息通信;2014年05期


相關博士學位論文 前1條

1 石躍勇;參數個數發(fā)散下具有oracle性質的SICA懲罰估計[D];武漢大學;2013年


相關碩士學位論文 前10條

1 鄭波;基于噪音Oracle的模型未知錯誤識別研究[D];華東師范大學;2019年

2 孟津平;Oracle數據庫下的系統性能調整與優(yōu)化的研究[D];長春理工大學;2018年

3 秦巖;基于Oracle商務套件的寧夏移動公司ERP系統的應用研究[D];寧夏大學;2014年

4 朱文瑩;基于Oracle三層結構的動車組關鍵配件管理模塊的設計[D];華南理工大學;2013年

5 柯欣;ORACLE中國公司戰(zhàn)略管理探析[D];西南財經大學;2010年

6 陳永亮;Oracle環(huán)境下數據遷移技術研究與實現[D];北方工業(yè)大學;2011年

7 莊海燕;數據庫加密技術及其在Oracle中的應用[D];鄭州大學;2006年

8 張巖;基于Oracle的高速公路收費系統數據庫設計及應用[D];東南大學;2005年

9 韓峰;基于Oracle的電力營銷數據倉庫的設計與實現[D];山東大學;2007年

10 呂洪敏;基于Oracle數據倉庫應用技術的研究與實現[D];武漢科技大學;2007年



本文編號:2848092

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2848092.html


Copyright(c)文論論文網All Rights Reserved | 網站地圖 |

版權申明:資料由用戶938bf***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com
91久久精品在这里色伊人| 麻豆果冻传媒一二三区| 国产精品国产亚洲区久久| 亚洲国产精品肉丝袜久久| 1024你懂的在线视频| 视频一区二区黄色线观看| 亚洲一区二区三区三区| 日本精品理论在线观看| 午夜日韩在线观看视频| 亚洲国产成人一区二区在线观看| 亚洲一区二区三区四区| 亚洲国产丝袜一区二区三区四| 人妻一区二区三区多毛女| 正在播放国产又粗又长| 日本国产欧美精品视频| 国产一区二区三区午夜精品| 精品国产亚洲av成人一区| 国产乱人伦精品一区二区三区四区| 手机在线观看亚洲中文字幕| 色无极东京热男人的天堂| 老司机激情五月天在线不卡| 成人精品一级特黄大片| 91老熟妇嗷嗷叫太91| 国产精品美女午夜视频| 国产成人国产精品国产三级| 久热人妻中文字幕一区二区| 亚洲国产精品一区二区| 亚洲欧美日韩精品永久| 九九热精彩视频在线免费| 久久99亚洲小姐精品综合| 亚洲午夜av久久久精品| 丝袜视频日本成人午夜视频| 日本东京热加勒比一区二区| 精品国产品国语在线不卡| 亚洲精选91福利在线观看 | 大香蕉伊人精品在线观看| 在线懂色一区二区三区精品| 欧美成人一区二区三区在线| 国内午夜精品视频在线观看| 老司机亚洲精品一区二区| 国产成人亚洲精品青草天美 |