天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 搜索引擎論文 >

基于熱點(diǎn)標(biāo)簽學(xué)的可視化時(shí)尚商品搜索引擎設(shè)計(jì)與實(shí)現(xiàn)

發(fā)布時(shí)間:2018-09-06 09:35
【摘要】:本論文研究課題來(lái)源于廣州電信研究院“基于云計(jì)算的大數(shù)據(jù)應(yīng)用研究”子課題之一,主要研究大數(shù)據(jù)處理(Big Data)技術(shù)如分布式存儲(chǔ)、分布式計(jì)算在服裝頻道上針對(duì)數(shù)據(jù)處理領(lǐng)域的應(yīng)用。隨著互聯(lián)網(wǎng)日益普及、電子商務(wù)的發(fā)展,在線購(gòu)物已滲透到人們的日常生活。目前主流購(gòu)物平臺(tái)主要向用戶提供文本檢索模式,但由于某些商品復(fù)雜的外觀以及文字描述的不確切性,導(dǎo)致搜索結(jié)果往往不令人滿意,如外觀復(fù)雜的服飾。由此可見(jiàn),“以圖搜圖”已成為一項(xiàng)迫切的檢索模式。盡管也有少量平臺(tái)嘗試提供依靠圖片檢索商品,但是受圖片背景干擾嚴(yán)重,同樣不能達(dá)到較好的檢索效果。 針對(duì)上述問(wèn)題,本論文針對(duì)服裝頻道提出了一種基于熱點(diǎn)標(biāo)簽自動(dòng)學(xué)習(xí)的檢索模型,屬于“以圖搜圖”范疇。該模型基于互聯(lián)網(wǎng)時(shí)尚商品僅需少量熱點(diǎn)文本標(biāo)簽即可得到相對(duì)令人滿意的搜索結(jié)果這樣一個(gè)事實(shí)設(shè)計(jì)并實(shí)現(xiàn),具體而言,即通過(guò)識(shí)別用戶提交圖片中包含的時(shí)尚元素?zé)狳c(diǎn)標(biāo)簽,檢索出具有相同熱點(diǎn)標(biāo)簽的圖像集,完成一個(gè)從圖到熱點(diǎn)標(biāo)簽,再?gòu)臒狳c(diǎn)標(biāo)簽到圖的檢索過(guò)程。包括訓(xùn)練階段和搜索階段。在訓(xùn)練階段,從互聯(lián)網(wǎng)收集一定量半標(biāo)注的包含熱點(diǎn)標(biāo)簽的圖片形成訓(xùn)練集,提取圖像的時(shí)尚元素特征,結(jié)合SVM生成熱點(diǎn)標(biāo)簽分類器;在搜索階段,對(duì)提交查詢的圖片進(jìn)行熱點(diǎn)標(biāo)簽提取,然后利用熱點(diǎn)標(biāo)簽從商品庫(kù)中搜索并返回結(jié)果。 本論文提出模型的優(yōu)點(diǎn)主要包括兩點(diǎn):一是相比現(xiàn)有可視化搜索引擎,該方法具有不易受背景圖片干擾,對(duì)時(shí)尚商品針對(duì)性更強(qiáng);二是具有一定的語(yǔ)義搜索效果。本論文的主要?jiǎng)?chuàng)新點(diǎn)在于:提出了一種從圖像到熱點(diǎn)標(biāo)簽再到圖像的搜索模型,發(fā)揮熱點(diǎn)標(biāo)簽學(xué)習(xí)相對(duì)容易并且具有很強(qiáng)表達(dá)能力的優(yōu)勢(shì)。本論文主要貢獻(xiàn)有四點(diǎn):一是提供了可用于進(jìn)一步學(xué)習(xí)研究的半標(biāo)注圖像數(shù)據(jù)庫(kù),,包括三種領(lǐng)子樣式和三種紋理樣式。二是結(jié)合Nutch開(kāi)源項(xiàng)目,完成了具有通用性的網(wǎng)絡(luò)數(shù)據(jù)抓取模塊。三是結(jié)合Hadoop分布式技術(shù),收集了一個(gè)可用于圖像檢索技術(shù)研究的圖像數(shù)據(jù)集。四是按照軟件工程的要求實(shí)現(xiàn)了支持本論文方法的原型系統(tǒng),用戶僅需提交一張圖片即可搜索到感興趣的結(jié)果。
[Abstract]:This dissertation is one of the sub-topics of "Application Research of Large Data Based on Cloud Computing" of Guangzhou Telecommunication Research Institute. It mainly studies the application of Big Data technology such as distributed storage and distributed computing in the field of data processing on clothing channel. Shopping has penetrated into people's daily life. At present, the mainstream shopping platforms mainly provide users with text retrieval mode, but because of the complex appearance of some goods and the inaccuracy of text description, the search results are often unsatisfactory, such as clothing with complex appearance. Despite a small number of platforms attempting to provide commodities that rely on image retrieval, but seriously disturbed by the background of the image, the same can not achieve better retrieval results.
Aiming at these problems, this paper proposes a retrieval model based on hot tag automatic learning for fashion channel, which belongs to the category of "search by graph". This model is based on the fact that fashion products on the Internet can get relatively satisfactory search results with only a few hot text tags. Specifically, it is By identifying the hotspot tags of fashion elements contained in the pictures submitted by users, the image set with the same hotspot tags is retrieved, and a retrieval process is completed from the graph to the hotspot tag, and then from the hotspot tag to the graph, including the training stage and the search stage. Pictures form a training set, extract the fashion element features of images, and generate a hot label classifier with SVM. In the search phase, hot labels are extracted from the submitted images, and then hot labels are used to search the merchandise stores and return the results.
The advantages of this model include two main points: first, compared with the existing visual search engine, this method is not easily disturbed by background pictures, more targeted to fashion products; second, it has a certain semantic search effect. The main contributions of this paper are as follows: Firstly, we provide a semi-annotated image database which can be used for further study, including three collar styles and three texture styles; secondly, we complete the general purpose with Nutch open source project. The third is to collect an image data set which can be used in the research of image retrieval technology with the help of Hadoop distributed technology. The fourth is to implement a prototype system which supports the method of this paper according to the requirement of software engineering.
【學(xué)位授予單位】:中山大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2012
【分類號(hào)】:TP391.41

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 丁婉瑩;賀芳;馮利飛;潘嬋;;標(biāo)簽與關(guān)鍵詞相似度對(duì)比分析[J];情報(bào)理論與實(shí)踐;2009年10期

2 陳有新;META標(biāo)簽的妙用[J];中國(guó)會(huì)計(jì)電算化;2001年08期

3 陳冰;;餓狼一樣的網(wǎng)站提交工具——“提交餓狼”[J];科學(xué)之友;2000年07期

4 林海波;賴雯;;如何利用Web2.0技術(shù)改善用戶體驗(yàn)[J];圖書(shū)館學(xué)研究;2008年12期

5 楊軍;;網(wǎng)上“灰色信息”的收集、開(kāi)發(fā)和利用[J];青海社會(huì)科學(xué);2006年02期

6 Hmily;IE外的新生代 4款新版瀏覽器熱力試用[J];電腦與電信;2005年06期

7 李欣;;新一代圖書(shū)館目錄系統(tǒng):探索與發(fā)現(xiàn)/創(chuàng)新平臺(tái)——從理論走向?qū)嵺`[J];圖書(shū)館雜志;2009年11期

8 倪麗萍,張維勇,金麒;XML搜索引擎技術(shù)的實(shí)現(xiàn)與探討[J];合肥工業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版);2004年07期

9 梁桂英;李記旭;;Folksonomy初探[J];圖書(shū)館雜志;2006年04期

10 林芳;孟連生;;大眾標(biāo)注網(wǎng)站服務(wù)功能與運(yùn)營(yíng)模式分析[J];圖書(shū)情報(bào)工作;2008年01期

相關(guān)會(huì)議論文 前10條

1 羅暉;;基于RFID的物業(yè)管理系統(tǒng)設(shè)計(jì)[A];第六屆全國(guó)信息獲取與處理學(xué)術(shù)會(huì)議論文集(3)[C];2008年

2 楊月欣;;食品營(yíng)養(yǎng)標(biāo)簽的作用和意義[A];營(yíng)養(yǎng)與保健食品研究及科學(xué)進(jìn)展學(xué)術(shù)資料匯編[C];2002年

3 李東;顧鵬;羅yN;汪錦邦;;食品的營(yíng)養(yǎng)標(biāo)簽[A];未來(lái)五十年北京農(nóng)業(yè)與食品業(yè)的發(fā)展研討會(huì)論文集[C];2000年

4 楊曉強(qiáng);;500例外埠食品標(biāo)簽項(xiàng)目的調(diào)查報(bào)告[A];首屆全國(guó)衛(wèi)生法規(guī)、標(biāo)準(zhǔn)效益評(píng)價(jià)技術(shù)研討會(huì)暨講習(xí)班論文匯編[C];2000年

5 池剛毅;;RFID業(yè)務(wù)在移動(dòng)網(wǎng)絡(luò)中的實(shí)現(xiàn)[A];2007年中國(guó)通信學(xué)會(huì)“移動(dòng)增值業(yè)務(wù)與應(yīng)用”學(xué)術(shù)年會(huì)論文集[C];2007年

6 龍飛;;面向RFID標(biāo)簽芯片的天線設(shè)計(jì)[A];2008年中國(guó)西部青年通信學(xué)術(shù)會(huì)議論文集[C];2008年

7 晉松;林鴻飛;蘇綏;;基于標(biāo)簽共現(xiàn)的查詢擴(kuò)展研究[A];中國(guó)計(jì)算機(jī)語(yǔ)言學(xué)研究前沿進(jìn)展(2007-2009)[C];2009年

8 陳華媛;王淑艷;吳仁彪;;基于幀時(shí)隙ALOHA算法的標(biāo)簽估算數(shù)據(jù)分析[A];第十四屆全國(guó)信號(hào)處理學(xué)術(shù)年會(huì)(CCSP-2009)論文集[C];2009年

9 張陸;佐斌;;IAT在測(cè)量刻板印象中的屬性類別標(biāo)簽效應(yīng)[A];“改革開(kāi)放與心理學(xué)”學(xué)術(shù)研討會(huì)——湖北省暨武漢心理學(xué)會(huì)2008年學(xué)術(shù)年會(huì)論文集[C];2008年

10 李欣;林代茂;;一種基于標(biāo)簽排序的Swf文件版權(quán)保護(hù)方法[A];第八屆全國(guó)信息隱藏與多媒體安全學(xué)術(shù)大會(huì)湖南省計(jì)算機(jī)學(xué)會(huì)第十一屆學(xué)術(shù)年會(huì)論文集[C];2009年

相關(guān)重要報(bào)紙文章 前10條

1 張珂;歐米特將創(chuàng)新技術(shù)帶到芝加哥國(guó)際標(biāo)簽展[N];中國(guó)包裝報(bào);2008年

2 本報(bào)記者 劉力源;看色別標(biāo)簽 知老人忌口[N];文匯報(bào);2010年

3 本報(bào)記者 成靜;“信任標(biāo)簽”讓不良網(wǎng)商無(wú)處藏身[N];中國(guó)經(jīng)濟(jì)導(dǎo)報(bào);2007年

4 本報(bào)記者 王巍;深圳標(biāo)簽護(hù)航協(xié)議供貨[N];政府采購(gòu)信息報(bào);2008年

5 鐘品;貼了新標(biāo)簽就可網(wǎng)開(kāi)一面?[N];中國(guó)改革報(bào);2009年

6 李松;賀歲熱:貼個(gè)標(biāo)簽就能熱賣?[N];新華每日電訊;2004年

7 本報(bào)記者 付麗麗 實(shí)習(xí)記者 吳瓊;自然標(biāo)簽揪住了問(wèn)題食品的“尾巴”[N];大眾科技報(bào);2009年

8 張珂;防偽小標(biāo)簽 做出大生意[N];農(nóng)民日?qǐng)?bào);2008年

9 本報(bào)記者 李麗鈞;“高端”身份僅靠一紙標(biāo)簽明示[N];河北經(jīng)濟(jì)日?qǐng)?bào);2010年

10 譚俊嶠;標(biāo)簽市場(chǎng)機(jī)會(huì)不少[N];中國(guó)包裝報(bào);2008年

相關(guān)博士學(xué)位論文 前10條

1 岑榮偉;基于用戶行為分析的搜索引擎評(píng)價(jià)研究[D];清華大學(xué);2010年

2 李群;主題搜索引擎聚類算法的研究[D];北京林業(yè)大學(xué);2011年

3 蘇君華;面向搜索引擎的技術(shù)接受模型研究[D];南京大學(xué);2011年

4 劉佐達(dá);分布協(xié)作式搜索引擎模型及算法研究[D];清華大學(xué);2011年

5 陳旭毅;基于索引云的企業(yè)搜索引擎實(shí)現(xiàn)研究[D];武漢大學(xué);2011年

6 郭眈;中文互聯(lián)網(wǎng)視頻搜索引擎系統(tǒng)策略研究[D];北京交通大學(xué);2012年

7 王昤璞;基于用戶體驗(yàn)的互聯(lián)網(wǎng)搜索引擎醫(yī)學(xué)信息檢索可用性評(píng)估研究[D];吉林大學(xué);2010年

8 李莎莎;面向搜索引擎的自然語(yǔ)言處理關(guān)鍵技術(shù)研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2011年

9 白玉琪;空間信息搜索引擎研究[D];中國(guó)科學(xué)院研究生院(遙感應(yīng)用研究所);2003年

10 周

本文編號(hào):2225934


資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2225934.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶e4b95***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com