基于熱點標簽學(xué)的可視化時尚商品搜索引擎設(shè)計與實現(xiàn)
[Abstract]:This dissertation is one of the sub-topics of "Application Research of Large Data Based on Cloud Computing" of Guangzhou Telecommunication Research Institute. It mainly studies the application of Big Data technology such as distributed storage and distributed computing in the field of data processing on clothing channel. Shopping has penetrated into people's daily life. At present, the mainstream shopping platforms mainly provide users with text retrieval mode, but because of the complex appearance of some goods and the inaccuracy of text description, the search results are often unsatisfactory, such as clothing with complex appearance. Despite a small number of platforms attempting to provide commodities that rely on image retrieval, but seriously disturbed by the background of the image, the same can not achieve better retrieval results.
Aiming at these problems, this paper proposes a retrieval model based on hot tag automatic learning for fashion channel, which belongs to the category of "search by graph". This model is based on the fact that fashion products on the Internet can get relatively satisfactory search results with only a few hot text tags. Specifically, it is By identifying the hotspot tags of fashion elements contained in the pictures submitted by users, the image set with the same hotspot tags is retrieved, and a retrieval process is completed from the graph to the hotspot tag, and then from the hotspot tag to the graph, including the training stage and the search stage. Pictures form a training set, extract the fashion element features of images, and generate a hot label classifier with SVM. In the search phase, hot labels are extracted from the submitted images, and then hot labels are used to search the merchandise stores and return the results.
The advantages of this model include two main points: first, compared with the existing visual search engine, this method is not easily disturbed by background pictures, more targeted to fashion products; second, it has a certain semantic search effect. The main contributions of this paper are as follows: Firstly, we provide a semi-annotated image database which can be used for further study, including three collar styles and three texture styles; secondly, we complete the general purpose with Nutch open source project. The third is to collect an image data set which can be used in the research of image retrieval technology with the help of Hadoop distributed technology. The fourth is to implement a prototype system which supports the method of this paper according to the requirement of software engineering.
【學(xué)位授予單位】:中山大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2012
【分類號】:TP391.41
【相似文獻】
相關(guān)期刊論文 前10條
1 丁婉瑩;賀芳;馮利飛;潘嬋;;標簽與關(guān)鍵詞相似度對比分析[J];情報理論與實踐;2009年10期
2 陳有新;META標簽的妙用[J];中國會計電算化;2001年08期
3 陳冰;;餓狼一樣的網(wǎng)站提交工具——“提交餓狼”[J];科學(xué)之友;2000年07期
4 林海波;賴雯;;如何利用Web2.0技術(shù)改善用戶體驗[J];圖書館學(xué)研究;2008年12期
5 楊軍;;網(wǎng)上“灰色信息”的收集、開發(fā)和利用[J];青海社會科學(xué);2006年02期
6 Hmily;IE外的新生代 4款新版瀏覽器熱力試用[J];電腦與電信;2005年06期
7 李欣;;新一代圖書館目錄系統(tǒng):探索與發(fā)現(xiàn)/創(chuàng)新平臺——從理論走向?qū)嵺`[J];圖書館雜志;2009年11期
8 倪麗萍,張維勇,金麒;XML搜索引擎技術(shù)的實現(xiàn)與探討[J];合肥工業(yè)大學(xué)學(xué)報(自然科學(xué)版);2004年07期
9 梁桂英;李記旭;;Folksonomy初探[J];圖書館雜志;2006年04期
10 林芳;孟連生;;大眾標注網(wǎng)站服務(wù)功能與運營模式分析[J];圖書情報工作;2008年01期
相關(guān)會議論文 前10條
1 羅暉;;基于RFID的物業(yè)管理系統(tǒng)設(shè)計[A];第六屆全國信息獲取與處理學(xué)術(shù)會議論文集(3)[C];2008年
2 楊月欣;;食品營養(yǎng)標簽的作用和意義[A];營養(yǎng)與保健食品研究及科學(xué)進展學(xué)術(shù)資料匯編[C];2002年
3 李東;顧鵬;羅yN;汪錦邦;;食品的營養(yǎng)標簽[A];未來五十年北京農(nóng)業(yè)與食品業(yè)的發(fā)展研討會論文集[C];2000年
4 楊曉強;;500例外埠食品標簽項目的調(diào)查報告[A];首屆全國衛(wèi)生法規(guī)、標準效益評價技術(shù)研討會暨講習(xí)班論文匯編[C];2000年
5 池剛毅;;RFID業(yè)務(wù)在移動網(wǎng)絡(luò)中的實現(xiàn)[A];2007年中國通信學(xué)會“移動增值業(yè)務(wù)與應(yīng)用”學(xué)術(shù)年會論文集[C];2007年
6 龍飛;;面向RFID標簽芯片的天線設(shè)計[A];2008年中國西部青年通信學(xué)術(shù)會議論文集[C];2008年
7 晉松;林鴻飛;蘇綏;;基于標簽共現(xiàn)的查詢擴展研究[A];中國計算機語言學(xué)研究前沿進展(2007-2009)[C];2009年
8 陳華媛;王淑艷;吳仁彪;;基于幀時隙ALOHA算法的標簽估算數(shù)據(jù)分析[A];第十四屆全國信號處理學(xué)術(shù)年會(CCSP-2009)論文集[C];2009年
9 張陸;佐斌;;IAT在測量刻板印象中的屬性類別標簽效應(yīng)[A];“改革開放與心理學(xué)”學(xué)術(shù)研討會——湖北省暨武漢心理學(xué)會2008年學(xué)術(shù)年會論文集[C];2008年
10 李欣;林代茂;;一種基于標簽排序的Swf文件版權(quán)保護方法[A];第八屆全國信息隱藏與多媒體安全學(xué)術(shù)大會湖南省計算機學(xué)會第十一屆學(xué)術(shù)年會論文集[C];2009年
相關(guān)重要報紙文章 前10條
1 張珂;歐米特將創(chuàng)新技術(shù)帶到芝加哥國際標簽展[N];中國包裝報;2008年
2 本報記者 劉力源;看色別標簽 知老人忌口[N];文匯報;2010年
3 本報記者 成靜;“信任標簽”讓不良網(wǎng)商無處藏身[N];中國經(jīng)濟導(dǎo)報;2007年
4 本報記者 王巍;深圳標簽護航協(xié)議供貨[N];政府采購信息報;2008年
5 鐘品;貼了新標簽就可網(wǎng)開一面?[N];中國改革報;2009年
6 李松;賀歲熱:貼個標簽就能熱賣?[N];新華每日電訊;2004年
7 本報記者 付麗麗 實習(xí)記者 吳瓊;自然標簽揪住了問題食品的“尾巴”[N];大眾科技報;2009年
8 張珂;防偽小標簽 做出大生意[N];農(nóng)民日報;2008年
9 本報記者 李麗鈞;“高端”身份僅靠一紙標簽明示[N];河北經(jīng)濟日報;2010年
10 譚俊嶠;標簽市場機會不少[N];中國包裝報;2008年
相關(guān)博士學(xué)位論文 前10條
1 岑榮偉;基于用戶行為分析的搜索引擎評價研究[D];清華大學(xué);2010年
2 李群;主題搜索引擎聚類算法的研究[D];北京林業(yè)大學(xué);2011年
3 蘇君華;面向搜索引擎的技術(shù)接受模型研究[D];南京大學(xué);2011年
4 劉佐達;分布協(xié)作式搜索引擎模型及算法研究[D];清華大學(xué);2011年
5 陳旭毅;基于索引云的企業(yè)搜索引擎實現(xiàn)研究[D];武漢大學(xué);2011年
6 郭眈;中文互聯(lián)網(wǎng)視頻搜索引擎系統(tǒng)策略研究[D];北京交通大學(xué);2012年
7 王昤璞;基于用戶體驗的互聯(lián)網(wǎng)搜索引擎醫(yī)學(xué)信息檢索可用性評估研究[D];吉林大學(xué);2010年
8 李莎莎;面向搜索引擎的自然語言處理關(guān)鍵技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2011年
9 白玉琪;空間信息搜索引擎研究[D];中國科學(xué)院研究生院(遙感應(yīng)用研究所);2003年
10 周
本文編號:2225934
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2225934.html