天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 搜索引擎論文 >

搜索引擎中關(guān)鍵詞分類方法評(píng)估及推薦應(yīng)用

發(fā)布時(shí)間:2016-11-24 20:48

  本文關(guān)鍵詞:搜索引擎中關(guān)鍵詞分類方法評(píng)估及推薦應(yīng)用,由筆耕文化傳播整理發(fā)布。


《華南理工大學(xué)》 2015年

搜索引擎中關(guān)鍵詞分類方法評(píng)估及推薦應(yīng)用

鐘文波  

【摘要】:隨著互聯(lián)網(wǎng)的迅猛發(fā)展和廣泛應(yīng)用,互聯(lián)網(wǎng)用戶在其中發(fā)揮著越來(lái)越重要的作用,以用戶為中心的信息生產(chǎn)模式造成了互聯(lián)網(wǎng)信息的爆炸式增長(zhǎng),人們正面臨越來(lái)越嚴(yán)重的“信息過(guò)載”問(wèn)題。通過(guò)搜索引擎技術(shù),人們可以快速的獲取自己所需要的信息。讓搜索引擎能夠更好的理解人們的搜索需求,也成為搜索引擎需要深入研究的課題之一。本文針對(duì)中文搜索引擎中關(guān)鍵詞文本的分類方法做了較為深入的研究,討論了文本分類問(wèn)題,探討文本分類領(lǐng)域的已有成果。同時(shí)列舉了關(guān)鍵詞文本分類所需要用到的關(guān)鍵技術(shù),包括中文文檔分詞,文本特征提取及表示以及文本分類方法。在論文開(kāi)始部分討論關(guān)鍵詞文本的特征,與長(zhǎng)文本相比較,關(guān)鍵詞短文本有其鮮明的特征,現(xiàn)有的短文本包括網(wǎng)絡(luò)論壇、微博、評(píng)論、搜索詞等。本文主要研究中文搜索引擎中用戶搜索關(guān)鍵詞的分類問(wèn)題,對(duì)比分析Racchio算法、K-近鄰算法、線性SVM算法在中文關(guān)鍵詞分類中的效果。論文在特征提取中采用多種特征組合的方法解決關(guān)鍵詞文本特征稀疏的問(wèn)題,使得分類的準(zhǔn)確率得到了大幅的提升;同時(shí)采用基于信息熵的加權(quán)熵值計(jì)算方式更準(zhǔn)確的表示特征所包含的信息,在一定程度上能夠提高分類準(zhǔn)確率。伴隨著數(shù)據(jù)量的爆發(fā)式的增長(zhǎng),單臺(tái)服務(wù)器的計(jì)算能力已經(jīng)無(wú)法滿足處理海量文本數(shù)據(jù)的要求。由此本文提出使用機(jī)器學(xué)習(xí)技術(shù)和分布式處理技術(shù)Hadoop相結(jié)合的策略解決海量關(guān)鍵詞的分類問(wèn)題。同時(shí)結(jié)合廣告主購(gòu)買(mǎi)關(guān)鍵詞的記錄,采用基于內(nèi)容的推薦方法將中文搜索關(guān)鍵詞的分類模型用于解決行業(yè)關(guān)鍵詞的冷啟動(dòng)問(wèn)題,設(shè)計(jì)實(shí)現(xiàn)搜索關(guān)鍵詞到廣告買(mǎi)主的個(gè)性化推薦模型,通過(guò)模型實(shí)現(xiàn)了新的搜索關(guān)鍵詞到廣告買(mǎi)主的精準(zhǔn)推薦。通過(guò)對(duì)搜索關(guān)鍵詞進(jìn)行精準(zhǔn)分類和標(biāo)注,能夠?qū)崿F(xiàn)廣告的精準(zhǔn)投放,改進(jìn)搜索結(jié)果,提高用戶搜索體驗(yàn)滿意度。

【關(guān)鍵詞】:
【學(xué)位授予單位】:華南理工大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類號(hào)】:TP391.1
【目錄】:

下載全文 更多同類文獻(xiàn)

CAJ全文下載

(如何獲取全文? 歡迎:購(gòu)買(mǎi)知網(wǎng)充值卡、在線充值、在線咨詢)

CAJViewer閱讀器支持CAJ、PDF文件格式


【共引文獻(xiàn)】

中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條

1 崔蔚;周力;吳凱峰;陳建;王志強(qiáng);肖政;裴旭斌;;基于Hadoop平臺(tái)的并行線損分析系統(tǒng)研究與實(shí)現(xiàn)[J];電力信息與通信技術(shù);2014年02期

2 曲廣龍;楊洪耕;張逸;;采用Map-Reduce模型的海量電能質(zhì)量數(shù)據(jù)交換格式文件快速解析方案[J];電網(wǎng)技術(shù);2014年06期

3 呂家琦;;基于mapreduce框架下CNM算法的并行性研究[J];電子技術(shù)與軟件工程;2014年12期

4 孟祥萍;周來(lái);;基于hadoop云平臺(tái)的智能電網(wǎng)HDFS資源存儲(chǔ)技術(shù)研究[J];電測(cè)與儀表;2014年19期

5 徐俊;湯庸;趙云龍;;冠字號(hào)云存儲(chǔ)管理系統(tǒng)設(shè)計(jì)[J];電子設(shè)計(jì)工程;2014年19期

6 陳晨;張東;;基于實(shí)時(shí)負(fù)載的HDFS負(fù)載均衡改進(jìn)與實(shí)現(xiàn)[J];計(jì)算機(jī)安全;2014年12期

7 欒開(kāi)寧;鄭海雁;丁陳;李昆明;;用于電力大數(shù)據(jù)快速組合查詢的動(dòng)態(tài)索引技術(shù)[J];電氣技術(shù);2015年01期

8 胡健;袁軍;王遠(yuǎn);;面向電網(wǎng)大數(shù)據(jù)的分布式實(shí)時(shí)數(shù)據(jù)庫(kù)管理系統(tǒng)[J];電力信息與通信技術(shù);2015年02期

9 張紅;王曉明;曹潔;朱昶勝;;基于大數(shù)據(jù)的智能交通體系架構(gòu)[J];蘭州理工大學(xué)學(xué)報(bào);2015年02期

10 孟祥萍;周來(lái);王暉;紀(jì)秀;;基于hadoop云平臺(tái)的智能電網(wǎng)MapReduce數(shù)據(jù)計(jì)算技術(shù)研究[J];電測(cè)與儀表;2015年10期

中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前2條

1 白永超;付偉;辛陽(yáng);;基于Hadoop和Nutch的分布式搜索引擎研究與仿真[A];第十九屆全國(guó)青年通信學(xué)術(shù)年會(huì)論文集[C];2014年

2 鄒暾;侯杰華;;煙草商業(yè)系統(tǒng)大數(shù)據(jù)處理架構(gòu)研究[A];中國(guó)煙草2013年學(xué)術(shù)年會(huì)論文集[C];2013年

中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條

1 林雪;面向電信行業(yè)的數(shù)據(jù)分析平臺(tái)的方案設(shè)計(jì)與實(shí)施[D];北京郵電大學(xué);2012年

2 周夢(mèng)雪;云計(jì)算環(huán)境下的多數(shù)據(jù)集連接優(yōu)化[D];鄭州大學(xué);2013年

3 趙成兵;基于云計(jì)算的高鐵振動(dòng)數(shù)據(jù)預(yù)處理與特征提取研究[D];西南交通大學(xué);2013年

4 郭鳳羽;云環(huán)境下對(duì)資源聚類的工作流任務(wù)安全調(diào)度研究[D];新疆大學(xué);2014年

5 張翔;Hadoop平臺(tái)上煤礦企業(yè)儲(chǔ)備定額算法并行化研究與應(yīng)用[D];內(nèi)蒙古科技大學(xué);2014年

6 劉豹;一種分布式ETL系統(tǒng)的設(shè)計(jì)與研究[D];北京郵電大學(xué);2014年

7 高東海;基于Hadoop的離線視頻數(shù)據(jù)處理技術(shù)研究與應(yīng)用[D];北京郵電大學(xué);2014年

8 王珺;移動(dòng)云存儲(chǔ)安全保護(hù)方案的研究與實(shí)現(xiàn)[D];北京郵電大學(xué);2014年

9 李銀周;移動(dòng)互聯(lián)網(wǎng)中手機(jī)終端與流量特征分析[D];北京郵電大學(xué);2014年

10 費(fèi)珊珊;基于云計(jì)算Hadoop平臺(tái)的數(shù)據(jù)挖掘研究[D];北京郵電大學(xué);2014年

【相似文獻(xiàn)】

中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條

1 李盛瑜;何文;;一種對(duì)聊天文本進(jìn)行特征選取的方法研究[J];計(jì)算機(jī)科學(xué);2007年05期

2 蔣志方;祝翠玲;吳強(qiáng);;一個(gè)對(duì)不帶類別標(biāo)記文本進(jìn)行分類的方法[J];計(jì)算機(jī)工程;2007年12期

3 趙鋼;;從復(fù)雜文本中導(dǎo)入數(shù)據(jù)的方法[J];中國(guó)審計(jì);2007年18期

4 易樹(shù)鴻;張為群;;一種基于粗集的文本數(shù)據(jù)特征信息的挖掘方法[J];計(jì)算機(jī)科學(xué);2002年08期

5 李建中,楊艷,張艷秋;并行文本管理原型系統(tǒng)PDoc的功能與總體框架[J];哈爾濱工業(yè)大學(xué)學(xué)報(bào);2004年09期

6 覃曉;元昌安;彭昱忠;丁超;;基于基因表達(dá)式編程的Web文本分類研究[J];網(wǎng)絡(luò)安全技術(shù)與應(yīng)用;2009年03期

7 諶志群;;文本趨勢(shì)挖掘綜述[J];情報(bào)科學(xué);2010年02期

8 王亞民;劉洋;;含附件文本的分類算法研究[J];情報(bào)雜志;2012年08期

9 江偉;潘昊;;基于優(yōu)化的多核學(xué)習(xí)方法的Web文本分類的研究[J];計(jì)算機(jī)技術(shù)與發(fā)展;2013年10期

10 陳福海;C++中用>>和<<重載實(shí)現(xiàn)文本文件的方便存取[J];現(xiàn)代計(jì)算機(jī);1997年05期

中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前10條

1 許君;王朝坤;劉立超;王建民;劉璋;;云環(huán)境中的近似復(fù)制文本檢測(cè)[A];第29屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(B輯)(NDBC2012)[C];2012年

2 易天元;葉春生;;工業(yè)鍋爐圖紙輸入的文本數(shù)據(jù)處理[A];1997中國(guó)控制與決策學(xué)術(shù)年會(huì)論文集[C];1997年

3 胡蓉;唐常杰;陳敏敏;欒江;;關(guān)聯(lián)規(guī)則制導(dǎo)的遺傳算法在文本分類中的應(yīng)用[A];第十九屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2002年

4 李文波;孫樂(lè);黃瑞紅;馮元勇;張大鯤;;基于Labeled-LDA模型的文本分類新算法[A];第三屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2007年

5 黃云平;孫樂(lè);李文波;;基于上下文圖模型文本表示的文本分類研究[A];第四屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集(上)[C];2008年

6 蔣勇;陳曉靜;;一種多方向手寫(xiě)文本行提取方法[A];第二十七屆中國(guó)控制會(huì)議論文集[C];2008年

7 李瑞;王朝坤;鄭偉;王建民;王偉平;;基于MapReduce框架的近似復(fù)制文本檢測(cè)[A];NDBC2010第27屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(B輯)[C];2010年

8 胡俊;黃厚寬;;一種基于SVM的可視化文本分類的方法[A];第二十一屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2004年

9 勞錦明;韋崗;;文本壓縮技術(shù)研究的新進(jìn)展[A];開(kāi)創(chuàng)新世紀(jì)的通信技術(shù)——第七屆全國(guó)青年通信學(xué)術(shù)會(huì)議論文集[C];2001年

10 江荻;;藏語(yǔ)文本信息處理的歷程與進(jìn)展[A];中文信息處理前沿進(jìn)展——中國(guó)中文信息學(xué)會(huì)二十五周年學(xué)術(shù)會(huì)議論文集[C];2006年

中國(guó)重要報(bào)紙全文數(shù)據(jù)庫(kù) 前1條

1 戴洪玲;[N];中國(guó)電腦教育報(bào);2004年

中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條

1 宋歌;基于聚類森林的文本流分類方法研究[D];哈爾濱工業(yè)大學(xué);2014年

2 胡明涵;面向領(lǐng)域的文本分類與挖掘關(guān)鍵技術(shù)研究[D];東北大學(xué) ;2009年

3 孫曉華;基于聚類的文本機(jī)會(huì)發(fā)現(xiàn)關(guān)鍵問(wèn)題研究[D];哈爾濱工程大學(xué);2010年

4 尚文倩;文本分類及其相關(guān)技術(shù)研究[D];北京交通大學(xué);2007年

5 霍躍紅;典籍英譯譯者文體分析與文本的譯者識(shí)別[D];大連理工大學(xué);2010年

6 熊云波;文本信息處理的若干關(guān)鍵技術(shù)研究[D];復(fù)旦大學(xué);2006年

7 李自強(qiáng);大規(guī)模文本分類的若干問(wèn)題研究[D];電子科技大學(xué);2013年

8 楊震;文本分類和聚類中若干問(wèn)題的研究[D];北京郵電大學(xué);2007年

9 章舜仲;文本分類中詞共現(xiàn)關(guān)系的研究及其應(yīng)用[D];南京理工大學(xué);2010年

10 張友華;面向智能服務(wù)的Web內(nèi)容計(jì)算研究與應(yīng)用[D];中國(guó)科學(xué)技術(shù)大學(xué);2006年

中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條

1 王軼霞;基于半監(jiān)督遞歸自編碼的情感分類研究[D];內(nèi)蒙古大學(xué);2015年

2 金傳鑫;氣象文本分類特征選擇方法及其在MapReduce上的實(shí)現(xiàn)[D];南京信息工程大學(xué);2015年

3 李少卿;不良文本及其變體信息的檢測(cè)過(guò)濾技術(shù)研究[D];復(fù)旦大學(xué);2014年

4 董秦濤;基于文本的個(gè)人情感狀態(tài)分析研究[D];蘭州大學(xué);2015年

5 鐘文波;搜索引擎中關(guān)鍵詞分類方法評(píng)估及推薦應(yīng)用[D];華南理工大學(xué);2015年

6 黃晨;基于新詞識(shí)別和時(shí)間跨度的微博熱點(diǎn)研究[D];上海交通大學(xué);2015年

7 陳紅陽(yáng);中文微博話題發(fā)現(xiàn)技術(shù)研究[D];重慶理工大學(xué);2015年

8 王珺瑤;面向微博文本的分類技術(shù)應(yīng)用研究[D];廣西大學(xué);2015年

9 王永曦;矩陣填充應(yīng)用于文本分類的一些探索[D];清華大學(xué);2012年

10 馬桂香;評(píng)論文本的多方面觀點(diǎn)挖掘研究[D];北京交通大學(xué);2013年


  本文關(guān)鍵詞:搜索引擎中關(guān)鍵詞分類方法評(píng)估及推薦應(yīng)用,,由筆耕文化傳播整理發(fā)布。



本文編號(hào):191365

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/191365.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶9151f***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com
久久中文字幕中文字幕中文| 欧美人与动牲交a精品| 亚洲一区二区久久观看| 亚洲欧美日韩国产综合在线| 人妻巨大乳一二三区麻豆| 国产成人精品在线一区二区三区 | 亚洲综合激情另类专区老铁性| 日本深夜福利在线播放| 国产伦精品一一区二区三区高清版 | 午夜精品久久久99热连载| 国产午夜精品在线免费看| 99精品国产一区二区青青 | 亚洲一区二区精品久久av| 国产又粗又猛又大爽又黄同志| 成人精品网一区二区三区| 欧美日韩精品人妻二区三区| 中文字幕一区二区久久综合| 成人日韩在线播放视频| 最新午夜福利视频偷拍| 又黄又硬又爽又色的视频| 日本免费熟女一区二区三区| 好吊一区二区三区在线看| 91超频在线视频中文字幕| 国产精品免费不卡视频| 深夜福利欲求不满的人妻| 欧美尤物在线视频91| 人妻内射精品一区二区| 中文字幕五月婷婷免费| 福利一区二区视频在线| 欧美黑人暴力猛交精品| 欧美日韩精品一区免费 | 日韩欧美好看的剧情片免费| 亚洲一区二区精品免费| 欧美日韩国产欧美日韩| 久久99国产精品果冻传媒| 亚洲中文字幕有码在线观看| 国产精品久久精品毛片| 黄色三级日本在线观看| 日韩av生活片一区二区三区| 国产精品一级香蕉一区| 麻豆一区二区三区在线免费|