商家標(biāo)簽管理系統(tǒng)的設(shè)計與實現(xiàn)
本文關(guān)鍵詞:商家標(biāo)簽管理系統(tǒng)的設(shè)計與實現(xiàn)
更多相關(guān)文章: Spring MVC Hive 機器學(xué)習(xí) 智能分類
【摘要】:隨著餓了么外賣市場規(guī)模的飛速發(fā)展和業(yè)務(wù)需求的快速變化,餓了么平臺入駐商家的數(shù)量不斷增加,商家的標(biāo)簽類別也在不斷增加,商家標(biāo)簽規(guī)范也需要不斷適應(yīng)市場和業(yè)務(wù)的變化。為了提高商家標(biāo)簽分類的效率和準(zhǔn)確性,減少人工標(biāo)注商家標(biāo)簽類別的工作量,降低人工分類的主觀性和出錯誤差,基于大數(shù)據(jù)和機器學(xué)習(xí)技術(shù),開發(fā)出餓了么商家標(biāo)簽管理平臺。通過餓了么商家標(biāo)簽管理平臺,可以常態(tài)化地對餓了么平臺新入駐的商家進行自動的標(biāo)簽分類,并能適應(yīng)商家菜品的變化,不斷更新每個商家的品類標(biāo)簽。餓了么平臺按統(tǒng)一規(guī)范對所有商家進行標(biāo)簽分類,更能體現(xiàn)對所有商家的公平性,避免商家自行標(biāo)注品類標(biāo)簽可能的作弊行為。商家標(biāo)簽分類數(shù)據(jù)是商家的基礎(chǔ)數(shù)據(jù),是搜索、推薦等其他產(chǎn)品不可缺少的維度,對大數(shù)據(jù)統(tǒng)計和分析具有重要價值和意義。本系統(tǒng)后臺使用Spring MVC框架進行開發(fā),前端使用Bootstrap和jQuery等技術(shù),數(shù)據(jù)庫則使用MySQL和Hive,其中Hive用來存儲離線數(shù)據(jù),以進行數(shù)據(jù)處理和分析。標(biāo)簽智能分類模塊作為本系統(tǒng)的核心,使用Python實現(xiàn),并且采用LSI和隨機森林等機器學(xué)習(xí)算法對商家進行智能的分類。目前該系統(tǒng)已經(jīng)上線運營,每日都會從線上數(shù)據(jù)庫拉取數(shù)據(jù)到Hive,進行離線計算分類,對所有的商家進行智能分類,分類過審后再推送到線上庫更新數(shù)據(jù),據(jù)統(tǒng)計,準(zhǔn)確率已達90%以上,后續(xù)還會通過優(yōu)化算法,繼續(xù)提升準(zhǔn)確率,目標(biāo)達到95%。
【關(guān)鍵詞】:Spring MVC Hive 機器學(xué)習(xí) 智能分類
【學(xué)位授予單位】:南京大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:TP311.52
【目錄】:
- 摘要5-6
- Abstract6-11
- 第一章 引言11-15
- 1.1 項目背景11
- 1.2 文本自動分類研究11-13
- 1.3 本文主要工作13-14
- 1.4 論文組織結(jié)構(gòu)14-15
- 第二章 技術(shù)綜述15-22
- 2.1 Spring MVC15-16
- 2.2 Python16-17
- 2.3 Maven17-18
- 2.4 Hive18-19
- 2.5 LSI19-20
- 2.6 隨機森林20-21
- 2.7 本章小結(jié)21-22
- 第三章 商家標(biāo)簽管理系統(tǒng)的分析與設(shè)計22-41
- 3.1 項目總體規(guī)劃22
- 3.2 用戶類型22-23
- 3.3 系統(tǒng)需求分析23-30
- 3.3.1 標(biāo)簽查詢功能需求24-26
- 3.3.2 任務(wù)分配功能需求26-27
- 3.3.3 標(biāo)簽分類功能需求27
- 3.3.4 標(biāo)簽審核功能需求27-28
- 3.3.5 結(jié)果推送功能需求28-29
- 3.3.6 非功能性需求29-30
- 3.4 系統(tǒng)總體設(shè)計30-32
- 3.4.1 系統(tǒng)總體結(jié)構(gòu)30-31
- 3.4.2 系統(tǒng)架構(gòu)設(shè)計31-32
- 3.5 系統(tǒng)核心模塊設(shè)計32-39
- 3.5.1 標(biāo)簽智能分類模塊32-38
- 3.5.2 標(biāo)簽審核模塊38-39
- 3.6 數(shù)據(jù)庫設(shè)計39-40
- 3.7 本章小結(jié)40-41
- 第四章 商家標(biāo)簽管理系統(tǒng)的實現(xiàn)41-57
- 4.1 標(biāo)簽智能分類模塊的實現(xiàn)41-51
- 4.1.1 Hive數(shù)據(jù)同步的實現(xiàn)41-42
- 4.1.2 文本分詞的實現(xiàn)42-44
- 4.1.3 文本特征抽取的實現(xiàn)44-46
- 4.1.4 標(biāo)簽分類器的實現(xiàn)46-51
- 4.2 標(biāo)簽審核模塊的實現(xiàn)51-53
- 4.2.1 標(biāo)簽審核的前端實現(xiàn)51-52
- 4.2.2 標(biāo)簽審核的后端實現(xiàn)52-53
- 4.3 分類結(jié)果評估53-56
- 4.4 本章小結(jié)56-57
- 第五章 總結(jié)與展望57-59
- 5.1 總結(jié)57
- 5.2 進一步工作展望57-59
- 參考文獻59-61
- 致謝61-63
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 ;洛電投運機組運行優(yōu)化管理系統(tǒng)[J];華中電力;2003年04期
2 楊英;顯示管理系統(tǒng)[J];管理科學(xué)文摘;1994年02期
3 歲豐;自動資源計劃和管理系統(tǒng)[J];管理科學(xué)文摘;1994年02期
4 楊英;文件周轉(zhuǎn)管理系統(tǒng)[J];管理科學(xué)文摘;1997年02期
5 ;江西省舉辦《微機網(wǎng)絡(luò)臺站管理系統(tǒng)》培訓(xùn)班[J];中國無線電管理;1997年02期
6 朱士宇;醫(yī)院計算機文書管理系統(tǒng)的開發(fā)與應(yīng)用[J];中華醫(yī)學(xué)信息導(dǎo)報;1999年17期
7 汪佳梅;張淑梅;;工姿管理系統(tǒng)的設(shè)計與實現(xiàn)[J];佳木斯教育學(xué)院學(xué)報;2000年01期
8 李椺;松下產(chǎn)業(yè)開發(fā)出出入核電站區(qū)域的管理系統(tǒng)[J];國外核新聞;2000年01期
9 羅偉華,曾明如;校園收費一卡通管理系統(tǒng)簡介[J];江西電力;2000年03期
10 王成鋼,王曉東;開放式試題生成管理系統(tǒng)的設(shè)計與開發(fā)[J];濰坊教育學(xué)院學(xué)報;2000年02期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 劉東;張志雄;唐力;尚建忠;;淺談如何進行流程管理系統(tǒng)的開發(fā)[A];先進制造技術(shù)論壇暨第二屆制造業(yè)自動化與信息化技術(shù)交流會論文集[C];2003年
2 袁程;;科技項目申報及管理系統(tǒng)的開發(fā)[A];全國第十五屆計算機科學(xué)與技術(shù)應(yīng)用學(xué)術(shù)會議論文集[C];2003年
3 林寶會;王紅穎;高新亮;鄧朕紀(jì);;承鋼采購價格管理系統(tǒng)的設(shè)計與實現(xiàn)[A];中國計量協(xié)會冶金分會2009年年會論文集[C];2009年
4 劉曉敏;蔡燕窩;郭群輝;林耀輝;趙洪勤;;電臺導(dǎo)播管理系統(tǒng)[A];2005年廣播電視技術(shù)論文匯編[C];2005年
5 邱東;高國麗;李征燕;張立秋;;鋼鐵企業(yè)能源計量與管理系統(tǒng)的實現(xiàn)[A];第十七屆全國測控計量儀器儀表學(xué)術(shù)年會(MCMI'2007)論文集(下冊)[C];2007年
6 楊志軍;田琳;苗加慶;;獨立學(xué)院學(xué)生就業(yè)管理系統(tǒng)的構(gòu)建[A];2012管理創(chuàng)新、智能科技與經(jīng)濟發(fā)展研討會論文集[C];2012年
7 吳元健;;門診電子醫(yī)囑和樣本管理系統(tǒng)的開發(fā)與應(yīng)用[A];中華醫(yī)學(xué)會第九次全國檢驗醫(yī)學(xué)學(xué)術(shù)會議暨中國醫(yī)院協(xié)會臨床檢驗管理專業(yè)委員會第六屆全國臨床檢驗實驗室管理學(xué)術(shù)會議論文匯編[C];2011年
8 田巨龍;王作卿;詹超云;鄭錦鋒;胡敏;;醫(yī)院數(shù)字化膳食管理系統(tǒng)的開發(fā)研制[A];中國生物醫(yī)學(xué)工程學(xué)會第六次會員代表大會暨學(xué)術(shù)會議論文摘要匯編[C];2004年
9 韓新超;;保險公司電子影像管理系統(tǒng)的設(shè)計[A];計算機技術(shù)與應(yīng)用進展——全國第17屆計算機科學(xué)與技術(shù)應(yīng)用(CACIS)學(xué)術(shù)會議論文集(上冊)[C];2006年
10 王茂貴;黃郁明;張明;;燃煤機組運行優(yōu)化管理系統(tǒng)的開發(fā)及應(yīng)用[A];2008中國可持續(xù)發(fā)展論壇論文集(3)[C];2008年
中國重要報紙全文數(shù)據(jù)庫 前10條
1 少雄 藍芳 欽賢;上杭推行網(wǎng)絡(luò)督查管理系統(tǒng)[N];閩西日報;2009年
2 國家衛(wèi)生計生委衛(wèi)生發(fā)展研究中心 傅鴻鵬;客觀看待世衛(wèi)管理系統(tǒng)改革[N];醫(yī)藥經(jīng)濟報;2014年
3 申文;ERP管理系統(tǒng)在報業(yè)印刷中初見成效[N];中國包裝報;2004年
4 馮松海邋記者 張欣耘;南京移動投訴管理系統(tǒng)提高美譽度[N];人民郵電;2007年
5 記者 張旗邋通訊員 王新房;二炮新型數(shù)字化管理系統(tǒng)通過鑒定[N];解放軍報;2008年
6 本報記者 施斌 通訊員 陳萍 徐昆英;辦稅服務(wù)質(zhì)效管理系統(tǒng)在寧波啟用[N];中國稅務(wù)報;2014年
7 記者 解希民;四平實現(xiàn)財政管理系統(tǒng)全部國產(chǎn)化[N];中國財經(jīng)報;2014年
8 王峻;高科技就是生產(chǎn)力[N];市場報;2000年
9 記者 劉洋 通訊員 胡琴 林春輝;湖州升級駕培計時管理系統(tǒng)[N];中國交通報;2007年
10 通訊員 曹金龍 李燕;滄州煉油廠ERP管理系統(tǒng)成功上線運行[N];現(xiàn)代物流報;2006年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前3條
1 徐春婕;鐵路大型客運站管理系統(tǒng)及關(guān)鍵技術(shù)研究[D];中國鐵道科學(xué)研究院;2014年
2 鐘宙;情景管理系統(tǒng)中基于概念格的檢索和存儲技術(shù)研究[D];華東師范大學(xué);2015年
3 羅奇;大學(xué)生體質(zhì)健康管理的研究與應(yīng)用[D];華中師范大學(xué);2011年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 陳嵐;基于iOS的個人便簽管理系統(tǒng)的設(shè)計與實現(xiàn)[D];華南理工大學(xué);2015年
2 溫國文;基于ERP的紙機產(chǎn)線建設(shè)管理系統(tǒng)的研究與實現(xiàn)[D];華南理工大學(xué);2015年
3 鐘艷;支持離線應(yīng)用的掘進機售后服務(wù)管理系統(tǒng)的研究與設(shè)計[D];西南交通大學(xué);2015年
4 李優(yōu);熱軋廠板坯庫管理系統(tǒng)研究與開發(fā)[D];冶金自動化研究設(shè)計院;2015年
5 李璞;老年人居家養(yǎng)老管理系統(tǒng)的研究及實現(xiàn)[D];蘭州大學(xué);2015年
6 劉帥;基于關(guān)聯(lián)規(guī)則的某高校獎助學(xué)金管理系統(tǒng)的設(shè)計與實現(xiàn)[D];蘇州大學(xué);2015年
7 寧林;曲靖畜牧養(yǎng)殖基地畜牧放養(yǎng)管理系統(tǒng)的設(shè)計與實現(xiàn)[D];山東大學(xué);2015年
8 董效武;菏澤一中學(xué)生綜合素質(zhì)評價管理系統(tǒng)的設(shè)計與實現(xiàn)[D];山東大學(xué);2015年
9 秦鈺;RFID技術(shù)在物流倉儲管理系統(tǒng)中的研究及應(yīng)用[D];山西農(nóng)業(yè)大學(xué);2015年
10 張磊;流行病學(xué)調(diào)查和管理系統(tǒng)的設(shè)計與實現(xiàn)[D];上海交通大學(xué);2015年
,本文編號:671831
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/671831.html