面向專業(yè)屬性標注的眾包平臺研發(fā)及應用
本文關鍵詞:面向專業(yè)屬性標注的眾包平臺研發(fā)及應用,由筆耕文化傳播整理發(fā)布。
【摘要】:隨著大數據時代的來臨,人工智能和機器學習飛速發(fā)展,對于數據集的需求也越來越迫切,需要對海量數據進行快速的標注。研究者從傳統的專家標注和計算機標注中,提出了折中的眾包標注方法。眾包是把原先由專家完成的任務,外包給大眾來完成,具有低成本、高效率、高質量的特點,在最近幾年中得到了廣泛的應用。隨著眾包的發(fā)展,眾包平臺開始出現并飛速發(fā)展。在過去幾年中,國外出現了各式各樣的眾包平臺來完成各種任務,而在國內,眾包平臺更關注軟件眾包,而缺乏面向專業(yè)屬性標注的眾包平臺。本文研發(fā)了面向專業(yè)視覺屬性的眾包標注平臺“人從眾”。需求者在提供圖片和屬性之后,眾包平臺會自動生成任務并發(fā)布任務給工作者進行標注。平臺為三種屬性任務都設計了相應的功能。標注完成之后,平臺以自動或半自動的方式整合最終的眾包標注結果。與中國美術學院合作,以人從眾為基礎,眾包標注得到美學屬性數據集。在經過三個月的標注之后,獲得了標注結果。本文提出了面向標簽不平衡性的半監(jiān)督眾包學習算法。針對標簽種類之間的不平衡性,引入了加權參數。通過少部分正確標簽,訓練得到適應該任務標簽類別的加權參數,在原有的期望最大化算法的基礎上,加入了權重,提高了最終整合標簽的準確率。
【關鍵詞】:專業(yè)屬性眾包標注平臺 研發(fā) 美學屬性數據集 標簽不平衡性
【學位授予單位】:浙江大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:TP311.52
【目錄】:
- 摘要5-6
- Abstract6-13
- 第1章 緒論13-17
- 1.1 課題背景13-14
- 1.2 本文主要研究內容14-15
- 1.3 本文組織結構15-16
- 1.4 本章小結16-17
- 第2章 相關研究與技術綜述17-32
- 2.1 眾包17-25
- 2.1.1 眾包的模型17-18
- 2.1.2 眾包平臺18-20
- 2.1.3 眾包任務類型及設計20-25
- 2.2 眾包算法25-27
- 2.2.1 現有算法26-27
- 2.3 視覺屬性27-31
- 2.3.1 普通屬性數據集28-29
- 2.3.2 相對屬性數據集29-30
- 2.3.3 位置屬性數據集30-31
- 2.4 本章小結31-32
- 第3章 眾包屬性標注平臺研發(fā)32-45
- 3.1 簡介32
- 3.2 系統需求分析32-34
- 3.2.1 輸入輸出說明32
- 3.2.2 現有方法對比32-34
- 3.2.3 專家調研34
- 3.2.4 系統可擴展性34
- 3.3 眾包平臺架構34-36
- 3.3.1 開發(fā)環(huán)境和工具35-36
- 3.4 功能模塊設計與實現36-44
- 3.4.1 任務發(fā)布功能模塊36-40
- 3.4.2 平臺管理功能模塊40-42
- 3.4.3 結果整合功能模塊42
- 3.4.4 任務完成功能模塊42-44
- 3.5 本章小結44-45
- 第4章 應用人從眾構建美學屬性數據集45-53
- 4.1 簡介45
- 4.2 美學屬性研究和任務設計45-49
- 4.2.1 現有美學屬性及數據集45-48
- 4.2.2 數據集圖片和屬性介紹48-49
- 4.2.3 美學屬性任務設計49
- 4.3 眾包任務界面實例49-51
- 4.4 眾包結果統計51-52
- 4.5 本章小結52-53
- 第5章 面向標簽不平衡性的半監(jiān)督眾包學習算法53-67
- 5.1 簡介53
- 5.2 算法概述53-57
- 5.2.1 形式化說明53-54
- 5.2.2 少數服從多數算法54-55
- 5.2.3 期望最大化算法55-56
- 5.2.4 算法結構56-57
- 5.3 加權參數評估算法57-59
- 5.4 基于加權參數的工作者能力評估和最終結果整合59-60
- 5.5 基于層次化眾包結果的眾包學習算法的求解過程60-61
- 5.6 實驗61-63
- 5.6.1 數據集61
- 5.6.2 加權參數的訓練結果61-63
- 5.6.3 最終結果的準確率63
- 5.7 眾包整合結果分析63-66
- 5.8 本章小結66-67
- 第6章 總結與展望67-69
- 6.1 總結67
- 6.2 展望67-69
- 參考文獻69-72
- 攻讀碩士學位期間主要的研究成果72-73
- 致謝73
【相似文獻】
中國期刊全文數據庫 前10條
1 王晨郁;;一次“眾包”新聞實踐帶來的思考[J];中國記者;2012年07期
2 東方;;眾包在國外圖書館中的應用及有益啟示[J];新世紀圖書館;2012年12期
3 鄧珊妮;陶景霞;;眾包在國外圖書館中的應用及啟示[J];湖南社會科學;2013年01期
4 吳金紅;陳強;張玉峰;;基于眾包的企業(yè)競爭情報工作模式創(chuàng)新研究[J];情報理論與實踐;2014年01期
5 陸丹;;互聯網時代下眾包風險的識別與規(guī)避[J];物流工程與管理;2013年04期
6 宋愛嫻;;互聯網電子商務眾包模式在政府中的創(chuàng)新應用研究[J];電腦知識與技術;2013年05期
7 吳yP昕;王子謹;;基于眾包的移動互聯信息傳播設計研究[J];現代傳播(中國傳媒大學學報);2013年10期
8 范麗娟;;眾包對圖書館的影響及其運用[J];圖書館建設;2011年01期
9 張志強;逄居升;謝曉芹;周永;;眾包質量控制策略及評估算法研究[J];計算機學報;2013年08期
10 談偉;;國外“檔案眾包”實踐及引發(fā)的思考[J];四川檔案;2014年02期
中國重要會議論文全文數據庫 前2條
1 鐘耕深;朱雅杰;;基于眾包的商業(yè)模式優(yōu)化[A];第五屆(2010)中國管理學年會——組織與戰(zhàn)略分會場論文集[C];2010年
2 任延靜;林麗慧;;眾包平臺創(chuàng)新競賽中加價延期機制采納決策的研究[A];第八屆(2013)中國管理學年會——信息管理分會場論文集[C];2013年
中國重要報紙全文數據庫 前10條
1 (美)杰夫·豪《連線》雜志著名資深編輯;眾包——化整為零的革命[N];中國聯合商報;2009年
2 君尚;中介和渠道全面讓位眾包服務平臺[N];科技日報;2014年
3 凌曼文;眾包:人人都來賣點子[N];中國計算機報;2006年
4 夏劍;眾包革命:群眾創(chuàng)新[N];中國企業(yè)報;2008年
5 本報記者 肖志飛;“眾包”的魅力[N];醫(yī)藥經濟報;2010年
6 張涵;建立有層級架構的“眾包”模式[N];人民日報;2012年
7 羽哲;“春晚”可以嘗試“眾包”[N];科技日報;2013年
8 本報記者 王繼征;眾包模式能給纖維品牌帶來什么?[N];中國紡織報;2014年
9 張鳳岐;眾包的價值[N];電腦商報;2009年
10 本報記者 張潔云;“眾包”,多元化的解困路徑?[N];醫(yī)藥經濟報;2010年
中國博士學位論文全文數據庫 前5條
1 林素芬;基于眾包參與者網絡的眾包績效提升研究[D];華僑大學;2015年
2 鄒凌飛;眾包社區(qū)成員創(chuàng)造力績效影響因素分析及其應用研究[D];華中科技大學;2015年
3 彭玲;眾包平臺用戶接受與知識轉移研究[D];華中科技大學;2012年
4 馮小亮;基于雙邊市場的眾包模式研究[D];武漢大學;2012年
5 胡昭陽;眾包科學:網絡傳播語境下的公眾參與創(chuàng)新[D];中國科學技術大學;2015年
中國碩士學位論文全文數據庫 前10條
1 郭小強;基于迭代策略的眾包質量研究[D];鄭州大學;2015年
2 肖江輝;基于可信度的眾包協同測試及其算法實現[D];大連海事大學;2015年
3 仝子飛;通用眾包標注系統的設計與實現[D];浙江大學;2015年
4 張亭亭;基于成對關聯屬性空間的眾包任務優(yōu)化配置及其關鍵屬性選擇[D];江蘇科技大學;2015年
5 陳昊;基于眾包的維、哈、柯語輿情標注語料庫構建研究[D];新疆大學;2015年
6 路凱;Kaggle眾包平臺的隸屬網絡模型構建與特征分析[D];大連理工大學;2015年
7 陳強;大數據環(huán)境下企業(yè)競爭情報的眾包模式研究[D];武漢紡織大學;2015年
8 馬雪梅;暢銷小說的眾包翻譯研究[D];陜西師范大學;2015年
9 孫歡;眾包標注的學習算法研究[D];浙江大學;2015年
10 王希;參與式感知系統中基于任務眾包的群組構造方法研究[D];東北大學;2013年
本文關鍵詞:面向專業(yè)屬性標注的眾包平臺研發(fā)及應用,,由筆耕文化傳播整理發(fā)布。
本文編號:347100
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/347100.html