眾包質(zhì)量控制算法及評(píng)價(jià)框架研究
本文關(guān)鍵詞:眾包質(zhì)量控制算法及評(píng)價(jià)框架研究
更多相關(guān)文章: 眾包 質(zhì)量控制 期望最大化 工作者過(guò)濾 評(píng)價(jià)框架
【摘要】:眾包技術(shù)通過(guò)招募未知工作者群體,利用群體的智慧來(lái)解決機(jī)器難以解決的問(wèn)題。雖然眾包近年來(lái)已經(jīng)得到了廣泛應(yīng)用,但是眾包解決問(wèn)題時(shí)需要從未知工作者收集答案,使得質(zhì)量控制問(wèn)題成為在線眾包平臺(tái)面臨的最大挑戰(zhàn)。平臺(tái)的工作者們可能缺乏必要的專業(yè)知識(shí)、存在偏見(jiàn)或者被惡意因素所驅(qū)使,因而會(huì)造成低質(zhì)量甚至完全錯(cuò)誤的眾包結(jié)果。為了解決這個(gè)問(wèn)題,本文提出了一種兩階段基于工作者過(guò)濾和期望最大化的質(zhì)量控制算法。在第一階段,算法利用工作者應(yīng)答時(shí)間和答案沖突作為反饋,對(duì)工作者進(jìn)行評(píng)價(jià)并過(guò)濾惡意工作者。在第二階段,算法通過(guò)采樣算法設(shè)定初始值,并通過(guò)期望最大化算法,估計(jì)用戶質(zhì)量和任務(wù)的答案,得到高質(zhì)量的聚合答案。該算法解決了傳統(tǒng)算法中隱式反饋未得到有效利用、惡意工作者影響答案質(zhì)量以及期望最大化算法初始值設(shè)定等問(wèn)題。盡管相關(guān)研究已經(jīng)提出多種質(zhì)量控制算法,但研究中缺乏統(tǒng)一的評(píng)價(jià)標(biāo)準(zhǔn)和評(píng)價(jià)指標(biāo)。本文針對(duì)這個(gè)問(wèn)題,提出了眾包質(zhì)量控制算法的通用評(píng)價(jià)框架,并提出了任務(wù)分配、惡意工作者比例、答案位置分布等多種評(píng)價(jià)因素。該框架分別在線平臺(tái)和模擬平臺(tái)中測(cè)試算法的運(yùn)行效果,并結(jié)合多種評(píng)價(jià)因素和評(píng)價(jià)指標(biāo)測(cè)試算法的有效性和魯棒性。最后,論文在該評(píng)價(jià)框架下實(shí)現(xiàn)了基于工作者過(guò)濾和期望最大化的質(zhì)量控制算法以及幾種現(xiàn)有的對(duì)比算法,并通過(guò)大規(guī)模模擬和在線實(shí)驗(yàn),驗(yàn)證了本文提出的算法的有效性和魯棒性,同時(shí)還通過(guò)對(duì)比實(shí)驗(yàn)指出了其他算法存在的問(wèn)題。
【關(guān)鍵詞】:眾包 質(zhì)量控制 期望最大化 工作者過(guò)濾 評(píng)價(jià)框架
【學(xué)位授予單位】:浙江大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類號(hào)】:TP301.6;TB114.2
【目錄】:
- 摘要4-5
- Abstract5-10
- 第1章 緒論10-19
- 1.1 研究背景10-13
- 1.1.1 眾包模式10-11
- 1.1.2 眾包平臺(tái)以及質(zhì)量控制問(wèn)題11-13
- 1.2 相關(guān)方向研究現(xiàn)狀13-15
- 1.3 研究?jī)?nèi)容及主要貢獻(xiàn)15-17
- 1.4 研究意義17
- 1.5 本章小結(jié)17-19
- 第2章 相關(guān)工作19-28
- 2.1 眾包平臺(tái)研究19-21
- 2.2 眾包質(zhì)量控制研究21-25
- 2.2.1 眾包平臺(tái)的用戶研究21-22
- 2.2.2 黃金數(shù)據(jù)注入算法22-24
- 2.2.3 迭代算法24-25
- 2.3 應(yīng)答時(shí)間與準(zhǔn)確率關(guān)系研究25-27
- 2.4 本章小結(jié)27-28
- 第3章 基于工作者過(guò)濾和期望最大化的質(zhì)量控制算法28-43
- 3.1 問(wèn)題描述28-30
- 3.1.1 本文符號(hào)28
- 3.1.2 問(wèn)題定義28-30
- 3.2 基于采樣的預(yù)測(cè)算法30-33
- 3.3 基于反饋的工作者過(guò)濾算法33-37
- 3.3.1 隱式反饋35-36
- 3.3.2 顯式反饋36-37
- 3.4 期望最大化算法37-42
- 3.4.1 理論基礎(chǔ)38-39
- 3.4.2 算法流程39-40
- 3.4.3 改進(jìn)與優(yōu)化40-42
- 3.5 本章小結(jié)42-43
- 第4章 算法評(píng)價(jià)框架43-51
- 4.1 基本架構(gòu)43-44
- 4.2 模擬實(shí)驗(yàn)?zāi)K44-47
- 4.2.1 任務(wù)模塊44
- 4.2.2 工作者模塊44-45
- 4.2.3 任務(wù)分配模塊45-47
- 4.3 在線實(shí)驗(yàn)?zāi)K47
- 4.4 對(duì)比算法47-49
- 4.5 結(jié)果評(píng)價(jià)模塊49-50
- 4.6 本章小結(jié)50-51
- 第5章 實(shí)驗(yàn)結(jié)果分析51-62
- 5.1 實(shí)驗(yàn)配置51-53
- 5.1.1 運(yùn)行環(huán)境51
- 5.1.2 系統(tǒng)配置及數(shù)據(jù)集描述51-53
- 5.2 實(shí)驗(yàn)結(jié)果與分析53-61
- 5.2.1 應(yīng)答時(shí)間的影響53-54
- 5.2.2 任務(wù)分配的影響54-57
- 5.2.3 對(duì)于惡意用戶的魯棒性57-59
- 5.2.4 答案位置分布的影響59-61
- 5.3 本章小結(jié)61-62
- 第6章 總結(jié)與展望62-64
- 6.1 研究工作總結(jié)62
- 6.2 未來(lái)展望62-64
- 參考文獻(xiàn)64-68
- 攻讀碩士學(xué)位期間主要的研究成果68-69
- 致謝69
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前1條
1 C.M.STRACKE;;測(cè)量學(xué)習(xí)、教育和培訓(xùn)效應(yīng)的EFI評(píng)價(jià)框架(英文)[J];華東師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2014年02期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前1條
1 張亞連;;構(gòu)建企業(yè)綜合業(yè)績(jī)?cè)u(píng)價(jià)框架:基于生態(tài)經(jīng)濟(jì)視閾的分析[A];第三屆(2008)中國(guó)管理學(xué)年會(huì)——組織與戰(zhàn)略分會(huì)場(chǎng)論文集[C];2008年
中國(guó)重要報(bào)紙全文數(shù)據(jù)庫(kù) 前1條
1 本報(bào)記者 高鶴;國(guó)際評(píng)價(jià)框架與中國(guó)特色相結(jié)合[N];中國(guó)會(huì)計(jì)報(bào);2013年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前1條
1 唐思;眾包質(zhì)量控制算法及評(píng)價(jià)框架研究[D];浙江大學(xué);2015年
,本文編號(hào):857835
本文鏈接:http://sikaile.net/kejilunwen/yysx/857835.html