天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 搜索引擎論文 >

基于熱點標簽學(xué)的可視化時尚商品搜索引擎設(shè)計與實現(xiàn)

發(fā)布時間:2018-09-06 09:35
【摘要】:本論文研究課題來源于廣州電信研究院“基于云計算的大數(shù)據(jù)應(yīng)用研究”子課題之一,主要研究大數(shù)據(jù)處理(Big Data)技術(shù)如分布式存儲、分布式計算在服裝頻道上針對數(shù)據(jù)處理領(lǐng)域的應(yīng)用。隨著互聯(lián)網(wǎng)日益普及、電子商務(wù)的發(fā)展,在線購物已滲透到人們的日常生活。目前主流購物平臺主要向用戶提供文本檢索模式,但由于某些商品復(fù)雜的外觀以及文字描述的不確切性,導(dǎo)致搜索結(jié)果往往不令人滿意,如外觀復(fù)雜的服飾。由此可見,“以圖搜圖”已成為一項迫切的檢索模式。盡管也有少量平臺嘗試提供依靠圖片檢索商品,但是受圖片背景干擾嚴重,同樣不能達到較好的檢索效果。 針對上述問題,本論文針對服裝頻道提出了一種基于熱點標簽自動學(xué)習(xí)的檢索模型,屬于“以圖搜圖”范疇。該模型基于互聯(lián)網(wǎng)時尚商品僅需少量熱點文本標簽即可得到相對令人滿意的搜索結(jié)果這樣一個事實設(shè)計并實現(xiàn),具體而言,即通過識別用戶提交圖片中包含的時尚元素熱點標簽,檢索出具有相同熱點標簽的圖像集,完成一個從圖到熱點標簽,再從熱點標簽到圖的檢索過程。包括訓(xùn)練階段和搜索階段。在訓(xùn)練階段,從互聯(lián)網(wǎng)收集一定量半標注的包含熱點標簽的圖片形成訓(xùn)練集,提取圖像的時尚元素特征,結(jié)合SVM生成熱點標簽分類器;在搜索階段,對提交查詢的圖片進行熱點標簽提取,然后利用熱點標簽從商品庫中搜索并返回結(jié)果。 本論文提出模型的優(yōu)點主要包括兩點:一是相比現(xiàn)有可視化搜索引擎,該方法具有不易受背景圖片干擾,對時尚商品針對性更強;二是具有一定的語義搜索效果。本論文的主要創(chuàng)新點在于:提出了一種從圖像到熱點標簽再到圖像的搜索模型,發(fā)揮熱點標簽學(xué)習(xí)相對容易并且具有很強表達能力的優(yōu)勢。本論文主要貢獻有四點:一是提供了可用于進一步學(xué)習(xí)研究的半標注圖像數(shù)據(jù)庫,,包括三種領(lǐng)子樣式和三種紋理樣式。二是結(jié)合Nutch開源項目,完成了具有通用性的網(wǎng)絡(luò)數(shù)據(jù)抓取模塊。三是結(jié)合Hadoop分布式技術(shù),收集了一個可用于圖像檢索技術(shù)研究的圖像數(shù)據(jù)集。四是按照軟件工程的要求實現(xiàn)了支持本論文方法的原型系統(tǒng),用戶僅需提交一張圖片即可搜索到感興趣的結(jié)果。
[Abstract]:This dissertation is one of the sub-topics of "Application Research of Large Data Based on Cloud Computing" of Guangzhou Telecommunication Research Institute. It mainly studies the application of Big Data technology such as distributed storage and distributed computing in the field of data processing on clothing channel. Shopping has penetrated into people's daily life. At present, the mainstream shopping platforms mainly provide users with text retrieval mode, but because of the complex appearance of some goods and the inaccuracy of text description, the search results are often unsatisfactory, such as clothing with complex appearance. Despite a small number of platforms attempting to provide commodities that rely on image retrieval, but seriously disturbed by the background of the image, the same can not achieve better retrieval results.
Aiming at these problems, this paper proposes a retrieval model based on hot tag automatic learning for fashion channel, which belongs to the category of "search by graph". This model is based on the fact that fashion products on the Internet can get relatively satisfactory search results with only a few hot text tags. Specifically, it is By identifying the hotspot tags of fashion elements contained in the pictures submitted by users, the image set with the same hotspot tags is retrieved, and a retrieval process is completed from the graph to the hotspot tag, and then from the hotspot tag to the graph, including the training stage and the search stage. Pictures form a training set, extract the fashion element features of images, and generate a hot label classifier with SVM. In the search phase, hot labels are extracted from the submitted images, and then hot labels are used to search the merchandise stores and return the results.
The advantages of this model include two main points: first, compared with the existing visual search engine, this method is not easily disturbed by background pictures, more targeted to fashion products; second, it has a certain semantic search effect. The main contributions of this paper are as follows: Firstly, we provide a semi-annotated image database which can be used for further study, including three collar styles and three texture styles; secondly, we complete the general purpose with Nutch open source project. The third is to collect an image data set which can be used in the research of image retrieval technology with the help of Hadoop distributed technology. The fourth is to implement a prototype system which supports the method of this paper according to the requirement of software engineering.
【學(xué)位授予單位】:中山大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2012
【分類號】:TP391.41

【相似文獻】

相關(guān)期刊論文 前10條

1 丁婉瑩;賀芳;馮利飛;潘嬋;;標簽與關(guān)鍵詞相似度對比分析[J];情報理論與實踐;2009年10期

2 陳有新;META標簽的妙用[J];中國會計電算化;2001年08期

3 陳冰;;餓狼一樣的網(wǎng)站提交工具——“提交餓狼”[J];科學(xué)之友;2000年07期

4 林海波;賴雯;;如何利用Web2.0技術(shù)改善用戶體驗[J];圖書館學(xué)研究;2008年12期

5 楊軍;;網(wǎng)上“灰色信息”的收集、開發(fā)和利用[J];青海社會科學(xué);2006年02期

6 Hmily;IE外的新生代 4款新版瀏覽器熱力試用[J];電腦與電信;2005年06期

7 李欣;;新一代圖書館目錄系統(tǒng):探索與發(fā)現(xiàn)/創(chuàng)新平臺——從理論走向?qū)嵺`[J];圖書館雜志;2009年11期

8 倪麗萍,張維勇,金麒;XML搜索引擎技術(shù)的實現(xiàn)與探討[J];合肥工業(yè)大學(xué)學(xué)報(自然科學(xué)版);2004年07期

9 梁桂英;李記旭;;Folksonomy初探[J];圖書館雜志;2006年04期

10 林芳;孟連生;;大眾標注網(wǎng)站服務(wù)功能與運營模式分析[J];圖書情報工作;2008年01期

相關(guān)會議論文 前10條

1 羅暉;;基于RFID的物業(yè)管理系統(tǒng)設(shè)計[A];第六屆全國信息獲取與處理學(xué)術(shù)會議論文集(3)[C];2008年

2 楊月欣;;食品營養(yǎng)標簽的作用和意義[A];營養(yǎng)與保健食品研究及科學(xué)進展學(xué)術(shù)資料匯編[C];2002年

3 李東;顧鵬;羅yN;汪錦邦;;食品的營養(yǎng)標簽[A];未來五十年北京農(nóng)業(yè)與食品業(yè)的發(fā)展研討會論文集[C];2000年

4 楊曉強;;500例外埠食品標簽項目的調(diào)查報告[A];首屆全國衛(wèi)生法規(guī)、標準效益評價技術(shù)研討會暨講習(xí)班論文匯編[C];2000年

5 池剛毅;;RFID業(yè)務(wù)在移動網(wǎng)絡(luò)中的實現(xiàn)[A];2007年中國通信學(xué)會“移動增值業(yè)務(wù)與應(yīng)用”學(xué)術(shù)年會論文集[C];2007年

6 龍飛;;面向RFID標簽芯片的天線設(shè)計[A];2008年中國西部青年通信學(xué)術(shù)會議論文集[C];2008年

7 晉松;林鴻飛;蘇綏;;基于標簽共現(xiàn)的查詢擴展研究[A];中國計算機語言學(xué)研究前沿進展(2007-2009)[C];2009年

8 陳華媛;王淑艷;吳仁彪;;基于幀時隙ALOHA算法的標簽估算數(shù)據(jù)分析[A];第十四屆全國信號處理學(xué)術(shù)年會(CCSP-2009)論文集[C];2009年

9 張陸;佐斌;;IAT在測量刻板印象中的屬性類別標簽效應(yīng)[A];“改革開放與心理學(xué)”學(xué)術(shù)研討會——湖北省暨武漢心理學(xué)會2008年學(xué)術(shù)年會論文集[C];2008年

10 李欣;林代茂;;一種基于標簽排序的Swf文件版權(quán)保護方法[A];第八屆全國信息隱藏與多媒體安全學(xué)術(shù)大會湖南省計算機學(xué)會第十一屆學(xué)術(shù)年會論文集[C];2009年

相關(guān)重要報紙文章 前10條

1 張珂;歐米特將創(chuàng)新技術(shù)帶到芝加哥國際標簽展[N];中國包裝報;2008年

2 本報記者 劉力源;看色別標簽 知老人忌口[N];文匯報;2010年

3 本報記者 成靜;“信任標簽”讓不良網(wǎng)商無處藏身[N];中國經(jīng)濟導(dǎo)報;2007年

4 本報記者 王巍;深圳標簽護航協(xié)議供貨[N];政府采購信息報;2008年

5 鐘品;貼了新標簽就可網(wǎng)開一面?[N];中國改革報;2009年

6 李松;賀歲熱:貼個標簽就能熱賣?[N];新華每日電訊;2004年

7 本報記者 付麗麗 實習(xí)記者 吳瓊;自然標簽揪住了問題食品的“尾巴”[N];大眾科技報;2009年

8 張珂;防偽小標簽 做出大生意[N];農(nóng)民日報;2008年

9 本報記者 李麗鈞;“高端”身份僅靠一紙標簽明示[N];河北經(jīng)濟日報;2010年

10 譚俊嶠;標簽市場機會不少[N];中國包裝報;2008年

相關(guān)博士學(xué)位論文 前10條

1 岑榮偉;基于用戶行為分析的搜索引擎評價研究[D];清華大學(xué);2010年

2 李群;主題搜索引擎聚類算法的研究[D];北京林業(yè)大學(xué);2011年

3 蘇君華;面向搜索引擎的技術(shù)接受模型研究[D];南京大學(xué);2011年

4 劉佐達;分布協(xié)作式搜索引擎模型及算法研究[D];清華大學(xué);2011年

5 陳旭毅;基于索引云的企業(yè)搜索引擎實現(xiàn)研究[D];武漢大學(xué);2011年

6 郭眈;中文互聯(lián)網(wǎng)視頻搜索引擎系統(tǒng)策略研究[D];北京交通大學(xué);2012年

7 王昤璞;基于用戶體驗的互聯(lián)網(wǎng)搜索引擎醫(yī)學(xué)信息檢索可用性評估研究[D];吉林大學(xué);2010年

8 李莎莎;面向搜索引擎的自然語言處理關(guān)鍵技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2011年

9 白玉琪;空間信息搜索引擎研究[D];中國科學(xué)院研究生院(遙感應(yīng)用研究所);2003年

10 周

本文編號:2225934


資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2225934.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶e4b95***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com