眾包系統(tǒng)中標(biāo)注質(zhì)量控制問題研究
發(fā)布時間:2023-12-10 17:50
隨著互聯(lián)網(wǎng)技術(shù)的快速發(fā)展,很多機器智能難以完成的任務(wù),例如情感分析﹑圖像標(biāo)注和蛋白質(zhì)結(jié)構(gòu)預(yù)測等,可以通過眾包的方式由諸多在線工人完成。大量的標(biāo)注任務(wù)由傳統(tǒng)耗時耗費的專家標(biāo)注方式轉(zhuǎn)變?yōu)橄鄬?jīng)濟高效的互聯(lián)網(wǎng)工人標(biāo)注,加快了數(shù)據(jù)標(biāo)注效率,推動了機器學(xué)習(xí)和數(shù)據(jù)挖掘領(lǐng)域的發(fā)展。然而,由于在線工人的標(biāo)注質(zhì)量不確定性,眾包標(biāo)注數(shù)據(jù)普遍存在噪聲,甚至不正確。因此,如何控制眾包標(biāo)注質(zhì)量具有重要研究價值和廣泛應(yīng)用空間。本文圍繞眾包標(biāo)注質(zhì)量控制問題,從多標(biāo)記眾包答案聚合、任務(wù)分配策略及結(jié)合主動學(xué)習(xí)的眾包標(biāo)注這三個角度展開研究,在此基礎(chǔ)上開創(chuàng)性探索工人注意力影響的眾包標(biāo)注及質(zhì)量控制問題,本文的主要工作如下:1、多標(biāo)記眾包答案聚合研究:當(dāng)從眾包平臺獲取標(biāo)簽時,一個任務(wù)可能關(guān)聯(lián)多個標(biāo)簽,即所謂的多標(biāo)記眾包任務(wù)。而現(xiàn)有的大多數(shù)眾包答案聚合方法一般只關(guān)注單標(biāo)記(二分類和多分類)場景,當(dāng)應(yīng)用到多標(biāo)記場景時,由于忽略了標(biāo)記之間的關(guān)聯(lián)性,因而可能會影響其聚合質(zhì)量。針對這一問題,本文提出了一種基于聯(lián)合矩陣分解的多標(biāo)記答案聚合方法(ML-JMF)。首先,該方法聯(lián)合不同工人的樣本-標(biāo)記關(guān)聯(lián)矩陣分解為代表不同工人的個體矩陣和一個共...
【文章頁數(shù)】:114 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
1 緒論
1.1 研究背景和意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 眾包答案聚合
1.2.2 眾包任務(wù)分配
1.2.3 主動眾包標(biāo)注
1.3 本文研究目標(biāo)、主要內(nèi)容及創(chuàng)新點
1.4 本文組織結(jié)構(gòu)
2 相關(guān)研究概念
2.1 屬性定義
2.1.1 工人屬性
2.1.2 任務(wù)屬性
2.2 優(yōu)化算法
2.2.1 期望最大化
2.2.2 期望傳播算法
2.2.3 交替方向乘子法
2.3 評價指標(biāo)
2.4 本章小結(jié)
3 多標(biāo)記眾包答案聚合研究
3.1 問題定義
3.2 ML-JMF算法
3.3 算法優(yōu)化
3.4 實驗及結(jié)果分析
3.4.1 數(shù)據(jù)集及實驗設(shè)置
3.4.2 多標(biāo)記答案聚合
3.4.3 參數(shù)μ成分分析
3.4.4 欺詐者的魯棒性分析
3.4.5 參數(shù)敏感性分析
3.4.6 復(fù)雜度分析
3.5 本章小結(jié)
4 眾包任務(wù)分配策略研究
4.1 問題定義
4.2 Crowd WT算法
4.2.1 工人偏好策略
4.2.2 任務(wù)困難度預(yù)測
4.2.3 聯(lián)合任務(wù)分配模型
4.3 實驗及結(jié)果分析
4.3.1 實驗設(shè)置
4.3.2 任務(wù)分配結(jié)果及分析
4.3.3 聚合標(biāo)注結(jié)果及分析
4.3.4 稀疏標(biāo)注魯棒性分析
4.3.5 參數(shù)敏感性分析
4.3.6 運行時間分析
4.4 本章小結(jié)
5 結(jié)合主動學(xué)習(xí)的眾包標(biāo)注研究
5.1 問題定義
5.2 AMCC算法
5.2.1 多標(biāo)記答案聚合
5.2.2 代價敏感的主動眾包學(xué)習(xí)
5.2.3 算法優(yōu)化
5.2.4 凹凸性分析
5.2.5 時間復(fù)雜度分析
5.3 實驗及結(jié)果分析
5.3.1 實驗設(shè)置
5.3.2 聚合標(biāo)注結(jié)果
5.3.3 主動眾包學(xué)習(xí)結(jié)果分析
5.3.4 參數(shù)敏感性分析
5.3.5 魯棒性分析
5.3.6 運行時間
5.3.7 收斂性分析
5.4 本章小結(jié)
6 基于注意力的眾包標(biāo)注過程研究
6.1 問題定義
6.2 A3C算法
6.3 算法推理及優(yōu)化
6.4 實驗及結(jié)果分析
6.4.1 數(shù)據(jù)集及實驗設(shè)置
6.4.2 答案聚合比較
6.4.3 A3C在不同注意力分布下的結(jié)果
6.4.4 任務(wù)估計數(shù)分析
6.4.5 噪聲魯棒性分析
6.5 本章小結(jié)
7 總結(jié)與展望
7.1 論文總結(jié)
7.2 論文展望
參考文獻
致謝
發(fā)表論文及參與課題一覽
本文編號:3872848
【文章頁數(shù)】:114 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
1 緒論
1.1 研究背景和意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 眾包答案聚合
1.2.2 眾包任務(wù)分配
1.2.3 主動眾包標(biāo)注
1.3 本文研究目標(biāo)、主要內(nèi)容及創(chuàng)新點
1.4 本文組織結(jié)構(gòu)
2 相關(guān)研究概念
2.1 屬性定義
2.1.1 工人屬性
2.1.2 任務(wù)屬性
2.2 優(yōu)化算法
2.2.1 期望最大化
2.2.2 期望傳播算法
2.2.3 交替方向乘子法
2.3 評價指標(biāo)
2.4 本章小結(jié)
3 多標(biāo)記眾包答案聚合研究
3.1 問題定義
3.2 ML-JMF算法
3.3 算法優(yōu)化
3.4 實驗及結(jié)果分析
3.4.1 數(shù)據(jù)集及實驗設(shè)置
3.4.2 多標(biāo)記答案聚合
3.4.3 參數(shù)μ成分分析
3.4.4 欺詐者的魯棒性分析
3.4.5 參數(shù)敏感性分析
3.4.6 復(fù)雜度分析
3.5 本章小結(jié)
4 眾包任務(wù)分配策略研究
4.1 問題定義
4.2 Crowd WT算法
4.2.1 工人偏好策略
4.2.2 任務(wù)困難度預(yù)測
4.2.3 聯(lián)合任務(wù)分配模型
4.3 實驗及結(jié)果分析
4.3.1 實驗設(shè)置
4.3.2 任務(wù)分配結(jié)果及分析
4.3.3 聚合標(biāo)注結(jié)果及分析
4.3.4 稀疏標(biāo)注魯棒性分析
4.3.5 參數(shù)敏感性分析
4.3.6 運行時間分析
4.4 本章小結(jié)
5 結(jié)合主動學(xué)習(xí)的眾包標(biāo)注研究
5.1 問題定義
5.2 AMCC算法
5.2.1 多標(biāo)記答案聚合
5.2.2 代價敏感的主動眾包學(xué)習(xí)
5.2.3 算法優(yōu)化
5.2.4 凹凸性分析
5.2.5 時間復(fù)雜度分析
5.3 實驗及結(jié)果分析
5.3.1 實驗設(shè)置
5.3.2 聚合標(biāo)注結(jié)果
5.3.3 主動眾包學(xué)習(xí)結(jié)果分析
5.3.4 參數(shù)敏感性分析
5.3.5 魯棒性分析
5.3.6 運行時間
5.3.7 收斂性分析
5.4 本章小結(jié)
6 基于注意力的眾包標(biāo)注過程研究
6.1 問題定義
6.2 A3C算法
6.3 算法推理及優(yōu)化
6.4 實驗及結(jié)果分析
6.4.1 數(shù)據(jù)集及實驗設(shè)置
6.4.2 答案聚合比較
6.4.3 A3C在不同注意力分布下的結(jié)果
6.4.4 任務(wù)估計數(shù)分析
6.4.5 噪聲魯棒性分析
6.5 本章小結(jié)
7 總結(jié)與展望
7.1 論文總結(jié)
7.2 論文展望
參考文獻
致謝
發(fā)表論文及參與課題一覽
本文編號:3872848
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3872848.html
最近更新
教材專著