基于熱點(diǎn)標(biāo)簽學(xué)的可視化時(shí)尚商品搜索引擎設(shè)計(jì)與實(shí)現(xiàn)
[Abstract]:This dissertation is one of the sub-topics of "Application Research of Large Data Based on Cloud Computing" of Guangzhou Telecommunication Research Institute. It mainly studies the application of Big Data technology such as distributed storage and distributed computing in the field of data processing on clothing channel. Shopping has penetrated into people's daily life. At present, the mainstream shopping platforms mainly provide users with text retrieval mode, but because of the complex appearance of some goods and the inaccuracy of text description, the search results are often unsatisfactory, such as clothing with complex appearance. Despite a small number of platforms attempting to provide commodities that rely on image retrieval, but seriously disturbed by the background of the image, the same can not achieve better retrieval results.
Aiming at these problems, this paper proposes a retrieval model based on hot tag automatic learning for fashion channel, which belongs to the category of "search by graph". This model is based on the fact that fashion products on the Internet can get relatively satisfactory search results with only a few hot text tags. Specifically, it is By identifying the hotspot tags of fashion elements contained in the pictures submitted by users, the image set with the same hotspot tags is retrieved, and a retrieval process is completed from the graph to the hotspot tag, and then from the hotspot tag to the graph, including the training stage and the search stage. Pictures form a training set, extract the fashion element features of images, and generate a hot label classifier with SVM. In the search phase, hot labels are extracted from the submitted images, and then hot labels are used to search the merchandise stores and return the results.
The advantages of this model include two main points: first, compared with the existing visual search engine, this method is not easily disturbed by background pictures, more targeted to fashion products; second, it has a certain semantic search effect. The main contributions of this paper are as follows: Firstly, we provide a semi-annotated image database which can be used for further study, including three collar styles and three texture styles; secondly, we complete the general purpose with Nutch open source project. The third is to collect an image data set which can be used in the research of image retrieval technology with the help of Hadoop distributed technology. The fourth is to implement a prototype system which supports the method of this paper according to the requirement of software engineering.
【學(xué)位授予單位】:中山大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2012
【分類號(hào)】:TP391.41
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 丁婉瑩;賀芳;馮利飛;潘嬋;;標(biāo)簽與關(guān)鍵詞相似度對(duì)比分析[J];情報(bào)理論與實(shí)踐;2009年10期
2 陳有新;META標(biāo)簽的妙用[J];中國(guó)會(huì)計(jì)電算化;2001年08期
3 陳冰;;餓狼一樣的網(wǎng)站提交工具——“提交餓狼”[J];科學(xué)之友;2000年07期
4 林海波;賴雯;;如何利用Web2.0技術(shù)改善用戶體驗(yàn)[J];圖書(shū)館學(xué)研究;2008年12期
5 楊軍;;網(wǎng)上“灰色信息”的收集、開(kāi)發(fā)和利用[J];青海社會(huì)科學(xué);2006年02期
6 Hmily;IE外的新生代 4款新版瀏覽器熱力試用[J];電腦與電信;2005年06期
7 李欣;;新一代圖書(shū)館目錄系統(tǒng):探索與發(fā)現(xiàn)/創(chuàng)新平臺(tái)——從理論走向?qū)嵺`[J];圖書(shū)館雜志;2009年11期
8 倪麗萍,張維勇,金麒;XML搜索引擎技術(shù)的實(shí)現(xiàn)與探討[J];合肥工業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版);2004年07期
9 梁桂英;李記旭;;Folksonomy初探[J];圖書(shū)館雜志;2006年04期
10 林芳;孟連生;;大眾標(biāo)注網(wǎng)站服務(wù)功能與運(yùn)營(yíng)模式分析[J];圖書(shū)情報(bào)工作;2008年01期
相關(guān)會(huì)議論文 前10條
1 羅暉;;基于RFID的物業(yè)管理系統(tǒng)設(shè)計(jì)[A];第六屆全國(guó)信息獲取與處理學(xué)術(shù)會(huì)議論文集(3)[C];2008年
2 楊月欣;;食品營(yíng)養(yǎng)標(biāo)簽的作用和意義[A];營(yíng)養(yǎng)與保健食品研究及科學(xué)進(jìn)展學(xué)術(shù)資料匯編[C];2002年
3 李東;顧鵬;羅yN;汪錦邦;;食品的營(yíng)養(yǎng)標(biāo)簽[A];未來(lái)五十年北京農(nóng)業(yè)與食品業(yè)的發(fā)展研討會(huì)論文集[C];2000年
4 楊曉強(qiáng);;500例外埠食品標(biāo)簽項(xiàng)目的調(diào)查報(bào)告[A];首屆全國(guó)衛(wèi)生法規(guī)、標(biāo)準(zhǔn)效益評(píng)價(jià)技術(shù)研討會(huì)暨講習(xí)班論文匯編[C];2000年
5 池剛毅;;RFID業(yè)務(wù)在移動(dòng)網(wǎng)絡(luò)中的實(shí)現(xiàn)[A];2007年中國(guó)通信學(xué)會(huì)“移動(dòng)增值業(yè)務(wù)與應(yīng)用”學(xué)術(shù)年會(huì)論文集[C];2007年
6 龍飛;;面向RFID標(biāo)簽芯片的天線設(shè)計(jì)[A];2008年中國(guó)西部青年通信學(xué)術(shù)會(huì)議論文集[C];2008年
7 晉松;林鴻飛;蘇綏;;基于標(biāo)簽共現(xiàn)的查詢擴(kuò)展研究[A];中國(guó)計(jì)算機(jī)語(yǔ)言學(xué)研究前沿進(jìn)展(2007-2009)[C];2009年
8 陳華媛;王淑艷;吳仁彪;;基于幀時(shí)隙ALOHA算法的標(biāo)簽估算數(shù)據(jù)分析[A];第十四屆全國(guó)信號(hào)處理學(xué)術(shù)年會(huì)(CCSP-2009)論文集[C];2009年
9 張陸;佐斌;;IAT在測(cè)量刻板印象中的屬性類別標(biāo)簽效應(yīng)[A];“改革開(kāi)放與心理學(xué)”學(xué)術(shù)研討會(huì)——湖北省暨武漢心理學(xué)會(huì)2008年學(xué)術(shù)年會(huì)論文集[C];2008年
10 李欣;林代茂;;一種基于標(biāo)簽排序的Swf文件版權(quán)保護(hù)方法[A];第八屆全國(guó)信息隱藏與多媒體安全學(xué)術(shù)大會(huì)湖南省計(jì)算機(jī)學(xué)會(huì)第十一屆學(xué)術(shù)年會(huì)論文集[C];2009年
相關(guān)重要報(bào)紙文章 前10條
1 張珂;歐米特將創(chuàng)新技術(shù)帶到芝加哥國(guó)際標(biāo)簽展[N];中國(guó)包裝報(bào);2008年
2 本報(bào)記者 劉力源;看色別標(biāo)簽 知老人忌口[N];文匯報(bào);2010年
3 本報(bào)記者 成靜;“信任標(biāo)簽”讓不良網(wǎng)商無(wú)處藏身[N];中國(guó)經(jīng)濟(jì)導(dǎo)報(bào);2007年
4 本報(bào)記者 王巍;深圳標(biāo)簽護(hù)航協(xié)議供貨[N];政府采購(gòu)信息報(bào);2008年
5 鐘品;貼了新標(biāo)簽就可網(wǎng)開(kāi)一面?[N];中國(guó)改革報(bào);2009年
6 李松;賀歲熱:貼個(gè)標(biāo)簽就能熱賣?[N];新華每日電訊;2004年
7 本報(bào)記者 付麗麗 實(shí)習(xí)記者 吳瓊;自然標(biāo)簽揪住了問(wèn)題食品的“尾巴”[N];大眾科技報(bào);2009年
8 張珂;防偽小標(biāo)簽 做出大生意[N];農(nóng)民日?qǐng)?bào);2008年
9 本報(bào)記者 李麗鈞;“高端”身份僅靠一紙標(biāo)簽明示[N];河北經(jīng)濟(jì)日?qǐng)?bào);2010年
10 譚俊嶠;標(biāo)簽市場(chǎng)機(jī)會(huì)不少[N];中國(guó)包裝報(bào);2008年
相關(guān)博士學(xué)位論文 前10條
1 岑榮偉;基于用戶行為分析的搜索引擎評(píng)價(jià)研究[D];清華大學(xué);2010年
2 李群;主題搜索引擎聚類算法的研究[D];北京林業(yè)大學(xué);2011年
3 蘇君華;面向搜索引擎的技術(shù)接受模型研究[D];南京大學(xué);2011年
4 劉佐達(dá);分布協(xié)作式搜索引擎模型及算法研究[D];清華大學(xué);2011年
5 陳旭毅;基于索引云的企業(yè)搜索引擎實(shí)現(xiàn)研究[D];武漢大學(xué);2011年
6 郭眈;中文互聯(lián)網(wǎng)視頻搜索引擎系統(tǒng)策略研究[D];北京交通大學(xué);2012年
7 王昤璞;基于用戶體驗(yàn)的互聯(lián)網(wǎng)搜索引擎醫(yī)學(xué)信息檢索可用性評(píng)估研究[D];吉林大學(xué);2010年
8 李莎莎;面向搜索引擎的自然語(yǔ)言處理關(guān)鍵技術(shù)研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2011年
9 白玉琪;空間信息搜索引擎研究[D];中國(guó)科學(xué)院研究生院(遙感應(yīng)用研究所);2003年
10 周
本文編號(hào):2225934
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2225934.html