天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 搜索引擎論文 >

云環(huán)境下基于個(gè)性化模型的探索式搜索技術(shù)研究與實(shí)現(xiàn)

發(fā)布時(shí)間:2019-01-01 11:21
【摘要】:隨著信息產(chǎn)業(yè)特別是互聯(lián)網(wǎng)、移動(dòng)互聯(lián)網(wǎng)產(chǎn)業(yè)的快速發(fā)展,網(wǎng)絡(luò)上的信息量呈現(xiàn)幾何級(jí)的增長(zhǎng),信息匱乏的年代已經(jīng)遠(yuǎn)去。從某種程度上說(shuō),人們所需要的任何相關(guān)信息都可以從互聯(lián)網(wǎng)上搜索得到。但面對(duì)如此浩如煙海且雜亂的信息資源,尤其是應(yīng)用最為廣泛的文本資源,人們迫切需要一種有效的方式從紛繁復(fù)雜的海量信息中搜索、選擇感興趣的信息和知識(shí)。那么如何支持用戶、特別是移動(dòng)用戶有效地搜索、甄別并快速的定位自己感興趣的內(nèi)容;如何使用戶獲取信息的過(guò)程呈現(xiàn)出個(gè)性化的趨勢(shì),讓用戶參與其中,并盡量減少無(wú)關(guān)信息的煩擾,提高用戶的體驗(yàn)水平;依然是一個(gè)特別需要但仍然沒(méi)有解決好的問(wèn)題。 本文在對(duì)傳統(tǒng)搜索引擎技術(shù)研究的基礎(chǔ)上,針對(duì)用戶獲取信息的個(gè)性化程度不夠、信息獲取過(guò)程中用戶(特別是移動(dòng)用戶)體驗(yàn)不夠好等問(wèn)題。在云環(huán)境下,研究海量信息的分類、聚類與相似語(yǔ)義鏈網(wǎng)絡(luò)的生成技術(shù);研究元搜索技術(shù)、個(gè)性化用戶建模技術(shù)、支持可視化的探索式搜索技術(shù);結(jié)合當(dāng)前移動(dòng)平臺(tái)普遍使用的觸屏作為用戶與系統(tǒng)交互的界面。實(shí)現(xiàn)了一個(gè)基于用戶個(gè)體化特征的、支持用戶參與的新型的可視化探索式搜索原型及其示范應(yīng)用系統(tǒng)。具體的說(shuō),本文的研究?jī)?nèi)容主要包括如下幾個(gè)方面: (1)系統(tǒng)剖析現(xiàn)有各種搜索引擎的優(yōu)缺點(diǎn)。開(kāi)發(fā)并實(shí)現(xiàn)一個(gè)元搜索引擎,實(shí)時(shí)整合通用搜索引擎(如谷歌、百度等)、新浪微博和騰訊微博開(kāi)發(fā)接口,與基于開(kāi)源爬蟲(chóng)軟件WebCrawler、Solr等為基礎(chǔ)開(kāi)發(fā)的搜索引擎一起實(shí)現(xiàn)對(duì)信息的抓取。 (2)研究正文抽取、網(wǎng)頁(yè)去重、中文切詞等技術(shù)與方法,確認(rèn)文本主題信息;利用改進(jìn)K-means算法計(jì)算文本間的相似性,,對(duì)所獲取的信息進(jìn)行分類和聚類,根據(jù)相似度計(jì)算生成相似語(yǔ)義鏈網(wǎng)絡(luò)。通過(guò)語(yǔ)義上的去粗取精,把相似的信息源聚集起來(lái),減少信息的規(guī)模,構(gòu)建更加簡(jiǎn)練可靠的相似語(yǔ)義鏈網(wǎng)絡(luò)。為個(gè)性化的探索搜索打下基礎(chǔ)。 (3)針對(duì)現(xiàn)有搜索技術(shù)在滿足用戶(特別是移動(dòng)用戶)個(gè)性化要求上的不足,在生成的相似語(yǔ)義鏈網(wǎng)絡(luò)的基礎(chǔ)上,進(jìn)一步提出并設(shè)計(jì)基于個(gè)性化的用戶模型及算法;谠撃P蛯(duì)生成的相似語(yǔ)義鏈網(wǎng)絡(luò)進(jìn)行進(jìn)一步的分割和定位,將搜索的結(jié)果與用戶的個(gè)性化信息結(jié)合起來(lái),以滿足用戶個(gè)性化搜索的需要。 (4)基于搜索信息的分類與聚類、相似語(yǔ)義鏈網(wǎng)絡(luò)、個(gè)性化用戶建模技術(shù);跟蹤和記憶用戶在搜索過(guò)程中的參與與互動(dòng)過(guò)程,強(qiáng)調(diào)搜索過(guò)程中的人機(jī)交互性;研究并提出了一種新的RF(相關(guān)反饋)機(jī)制,實(shí)現(xiàn)支持探索與發(fā)現(xiàn)相結(jié)合的探索式搜索技術(shù)及其原型系統(tǒng)。 (5)基于Hadoop和HBase搭建一個(gè)云平臺(tái),通過(guò)分布式文件系統(tǒng)支持海量信息的存儲(chǔ),基于Map/Reduce實(shí)現(xiàn)相關(guān)算法的并行。在該平臺(tái)之上實(shí)現(xiàn)基于個(gè)性化模型的探索式搜索系統(tǒng)原型。接著在該原型系統(tǒng)之上,開(kāi)發(fā)“輿情分析系統(tǒng)”和應(yīng)用于Android手機(jī)端的“智慧商圈”系統(tǒng)示范用例,完整展示本研究的相關(guān)技術(shù)與實(shí)現(xiàn)途徑的可行性、有效性,以及良好用戶體驗(yàn)特性。
[Abstract]:......
【學(xué)位授予單位】:上海交通大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2013
【分類號(hào)】:TP391.3

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 劉俊熙;搜索引擎關(guān)鍵技術(shù)在檢索層面上的分析理解[J];圖書(shū)館學(xué)刊;2005年05期

2 劉俊熙;;搜索引擎對(duì)局域網(wǎng)的搜索(“侵入”)及防范策略[J];現(xiàn)代情報(bào);2007年07期

3 ;對(duì)未來(lái)Google搜索技術(shù)的深度分析[J];中國(guó)傳媒科技;2010年07期

4 ;捍衛(wèi)商用搜索市場(chǎng) Autonomy以“智”取勝[J];計(jì)算機(jī)與網(wǎng)絡(luò);2006年06期

5 盛嘉;;找到你的臉——智能圖片搜索技術(shù)[J];互聯(lián)網(wǎng)天地;2009年02期

6 張丘;;移動(dòng)搜索技術(shù)及需求探詢[J];互聯(lián)網(wǎng)天地;2007年02期

7 馮磊;;相信群眾[J];信息方略;2008年Z1期

8 李子臣;;搜索技術(shù)的現(xiàn)狀及發(fā)展前景[J];情報(bào)科學(xué);2006年03期

9 劉俊熙;龍怡;;站內(nèi)搜索是下一個(gè)網(wǎng)絡(luò)信息資源檢索的最佳點(diǎn)——網(wǎng)絡(luò)、行業(yè)和站內(nèi)搜索的技術(shù)分析[J];現(xiàn)代情報(bào);2008年04期

10 李子臣;;搜索技術(shù)的現(xiàn)狀及發(fā)展前景[J];情報(bào)科學(xué);2007年07期

相關(guān)會(huì)議論文 前10條

1 葉偉芳;;基于P2P的搜索技術(shù)和方法研究[A];第二屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議(NCIRCS-2005)論文集[C];2005年

2 王知津;韓正彪;周鵬;;網(wǎng)絡(luò)信息移動(dòng)搜索的結(jié)構(gòu)框架與技術(shù)機(jī)理探討[A];2010年中國(guó)索引學(xué)會(huì)年會(huì)暨學(xué)術(shù)研討會(huì)論文集[C];2010年

3 陳杰;;應(yīng)用智能搜索 實(shí)現(xiàn)數(shù)據(jù)挖掘[A];中國(guó)新聞技術(shù)工作者聯(lián)合會(huì)五屆一次理事會(huì)暨學(xué)術(shù)年會(huì)論文集(上篇)[C];2009年

4 陳援非;何哲;朱珍民;;基于普適計(jì)算的個(gè)性化搜索技術(shù)[A];第二屆和諧人機(jī)環(huán)境聯(lián)合學(xué)術(shù)會(huì)議(HHME2006)——第2屆中國(guó)普適計(jì)算學(xué)術(shù)會(huì)議(PCC'06)論文集[C];2006年

5 蘇亮;孫斌;;一種基于Lucene的Hash改進(jìn)中文分詞算法的實(shí)現(xiàn)[A];2007通信理論與技術(shù)新發(fā)展——第十二屆全國(guó)青年通信學(xué)術(shù)會(huì)議論文集(上冊(cè))[C];2007年

6 楊萌;李春麗;朱明;;網(wǎng)絡(luò)搜索技術(shù)下的編輯工作[A];學(xué)報(bào)編輯論叢(第十一集)[C];2003年

7 褚蓓蓓;劉丹;;垂直搜索引擎:搜索引擎發(fā)展方向[A];2007年河北省電子學(xué)會(huì)、河北省計(jì)算機(jī)學(xué)會(huì)、河北省自動(dòng)化學(xué)會(huì)、河北省人工智能學(xué)會(huì)、河北省計(jì)算機(jī)輔助設(shè)計(jì)研究會(huì)、河北省軟件行業(yè)協(xié)會(huì)聯(lián)合學(xué)術(shù)年會(huì)論文集[C];2007年

8 唐鐘;;一種高效網(wǎng)格搜索引擎技術(shù)的研究及應(yīng)用[A];科技、工程與經(jīng)濟(jì)社會(huì)協(xié)調(diào)發(fā)展——中國(guó)科協(xié)第五屆青年學(xué)術(shù)年會(huì)論文集[C];2004年

9 魏美勇;張國(guó)良;;視頻共享服務(wù)應(yīng)用技術(shù)研究[A];信息時(shí)代——科技情報(bào)研究學(xué)術(shù)論文集(第三輯)[C];2008年

10 彭軻;廖聞劍;;淺析搜索引擎[A];中國(guó)通信學(xué)會(huì)第五屆學(xué)術(shù)年會(huì)論文集[C];2008年

相關(guān)重要報(bào)紙文章 前10條

1 本報(bào)記者 陳昌成;陳沛:未來(lái)的搜索會(huì)更加精確[N];中國(guó)企業(yè)報(bào);2010年

2 諶力;第三代搜索,Google的心病[N];網(wǎng)絡(luò)世界;2006年

3 ;搜索引擎服務(wù)的新商機(jī)[N];21世紀(jì)經(jīng)濟(jì)報(bào)道;2006年

4 本報(bào)記者 賈晶晶;谷歌為何屢屢“聚黃”?[N];中國(guó)企業(yè)報(bào);2009年

5 穆榮平;第三代搜索引擎石破天驚[N];中國(guó)質(zhì)量報(bào);2006年

6 阿清;手機(jī)搜索市場(chǎng)暗潮涌動(dòng)[N];中國(guó)證券報(bào);2006年

7 朱杰;聚焦呼叫搜索[N];中國(guó)計(jì)算機(jī)報(bào);2007年

8 周婷;酷訊網(wǎng)與priceline合作[N];中國(guó)證券報(bào);2008年

9 ;企業(yè)級(jí)搜索會(huì)竄出第二個(gè)Google嗎?[N];中國(guó)計(jì)算機(jī)報(bào);2006年

10 冰梅;隱形搜索引擎“詞虎”誕生[N];計(jì)算機(jī)世界;2005年

相關(guān)博士學(xué)位論文 前10條

1 曹歡歡;基于大規(guī)模搜索日志挖掘的上下文感知搜索研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2009年

2 王斌;面向關(guān)系數(shù)據(jù)庫(kù)的關(guān)鍵字近似搜索技術(shù)研究[D];東北大學(xué);2008年

3 岑榮偉;基于用戶行為分析的搜索引擎評(píng)價(jià)研究[D];清華大學(xué);2010年

4 李群;主題搜索引擎聚類算法的研究[D];北京林業(yè)大學(xué);2011年

5 蘇君華;面向搜索引擎的技術(shù)接受模型研究[D];南京大學(xué);2011年

6 劉佐達(dá);分布協(xié)作式搜索引擎模型及算法研究[D];清華大學(xué);2011年

7 陳旭毅;基于索引云的企業(yè)搜索引擎實(shí)現(xiàn)研究[D];武漢大學(xué);2011年

8 郭眈;中文互聯(lián)網(wǎng)視頻搜索引擎系統(tǒng)策略研究[D];北京交通大學(xué);2012年

9 文坤梅;基于本體知識(shí)庫(kù)推理的語(yǔ)義搜索研究[D];華中科技大學(xué);2007年

10 王一川;基于內(nèi)容的海量文本探索式查詢導(dǎo)引中若干關(guān)鍵技術(shù)的研究[D];北京郵電大學(xué);2011年

相關(guān)碩士學(xué)位論文 前10條

1 唐繼禹;云環(huán)境下基于個(gè)性化模型的探索式搜索技術(shù)研究與實(shí)現(xiàn)[D];上海交通大學(xué);2013年

2 譚磊;一種個(gè)性化移動(dòng)搜索技術(shù)的研究[D];湖南大學(xué);2010年

3 宋超臣;基于推薦網(wǎng)絡(luò)的服務(wù)搜索技術(shù)研究[D];哈爾濱工程大學(xué);2010年

4 王新鵬;認(rèn)知模型的研究和應(yīng)用[D];蘭州理工大學(xué);2007年

5 孫明星;Sphinx站內(nèi)搜索技術(shù)在論壇產(chǎn)品中的應(yīng)用研究[D];復(fù)旦大學(xué);2012年

6 丁士敏;基于Ajax/Lucene的站內(nèi)搜索技術(shù)研究與實(shí)現(xiàn)[D];西安電子科技大學(xué);2008年

7 王凡毓;搜索2.0理論及其應(yīng)用研究[D];武漢理工大學(xué);2008年

8 劉玉燕;遠(yuǎn)程教育資源智能檢索系統(tǒng)的研究與設(shè)計(jì)[D];東北師范大學(xué);2004年

9 閆兵;國(guó)內(nèi)搜索引擎盈利模式研究[D];華東師范大學(xué);2007年

10 白瑾;基于群體特性的搜索方法研究[D];武漢理工大學(xué);2011年



本文編號(hào):2397485

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2397485.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶2d153***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com