移動應用智能搜索算法研究與應用
本文關(guān)鍵詞:移動應用智能搜索算法研究與應用,由筆耕文化傳播整理發(fā)布。
【摘要】:隨著移動互聯(lián)網(wǎng)高速發(fā)展和移動智能設備的迅速普及,特別是“NET+”概念提出之后,移動應用成爆炸式的增長,移動應用已經(jīng)成為人們網(wǎng)上購物、日常出行必不可少的工具。在上千萬級的移動應用當中,如何快速找到滿足自己需求的移動應用成為互聯(lián)網(wǎng)廠商和學術(shù)界急需研究的熱點難題。移動應用搜索引擎作為幫助用戶在大量移動應用中獲取滿足自身需要的應用的有效工具,其研究、開發(fā)及推廣應用很有必要。與傳統(tǒng)文本搜索使用PageRank、TF-IDF算法相比,移動應用搜索有具有短文本、強語義、長尾搜索的特點,因此,傳統(tǒng)的PageRank、TF-IDF算法在移動應用搜索中并不能得出較好的搜索效果;诖,本文提出面向移動應用的智能搜索算法。該算法主要由應用語義評分模塊、協(xié)同評分模塊和混合得分模塊三部分組成。在應用語義評分模塊,結(jié)合DBSCAN算法、貝葉斯算法和相似度算法,對移動應用的屬性進行學習,得出前綴匹配、后綴匹配、包含匹配、優(yōu)質(zhì)前綴、優(yōu)質(zhì)后綴、相似度評分等規(guī)則,使得搜索詞與移動應用在語義上的匹配更加精確,解決了移動移動搜索“短文本”和“強語義”問題。在協(xié)同評分模塊,結(jié)合特定移動應用的下載量、星級評價指標得出一個協(xié)同分數(shù),該分數(shù)代表所有用戶對該應用的評價,滿足移動應用搜索“長尾搜索”的特點。在混合得分模塊,綜合考慮應用語義評分和協(xié)同評分,通過函數(shù)計算得到該移動應用的最終得分,避免了應用語義評分或協(xié)同評分單個得分過高導致總得分過高的情況。實驗結(jié)果表明:本文提出的移動應用智能搜索算法能夠精確的搜索出用戶的想要的應用,在準確率、召回率、F-Measure指標上均對TF-IDF算法有著明顯的優(yōu)勢。并且通過搜索舉例,在以百度手機助手的搜索結(jié)果為標準搜索結(jié)果的條件下,本文提出的移動應用智能搜索算法與商業(yè)移動應用搜索引擎相比也具有優(yōu)秀的表現(xiàn)。最后,在移動應用智能搜索算法基礎上,本論文開發(fā)了一個基于Lucene的移動應用搜索引擎。通過給出的移動應用搜索引擎的架構(gòu)圖和主要代碼,證明了本文提出的移動應用智能搜索算法的可行性。
【關(guān)鍵詞】:移動應用 智能搜索 應用語義評分 DBSCAN
【學位授予單位】:廣東工業(yè)大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:TP391.3
【目錄】:
- 摘要4-5
- Abstract5-15
- 第一章 緒論15-23
- 1.1 研究背景與意義15-18
- 1.1.1 研究背景15-17
- 1.1.2 研究意義17-18
- 1.2 研究現(xiàn)狀與面臨的問題18-20
- 1.2.1 研究現(xiàn)狀18-19
- 1.2.2 面臨的問題19-20
- 1.3 研究內(nèi)容及主要工作20-21
- 1.4 論文結(jié)構(gòu)安排21-22
- 1.5 本章小結(jié)22-23
- 第二章 相關(guān)概念23-35
- 2.1 搜索引擎23-25
- 2.1.1 搜索引擎發(fā)展歷史23-24
- 2.1.2 搜索引擎分類24-25
- 2.2 分詞技術(shù)25-26
- 2.2.1 分詞技術(shù)介紹25-26
- 2.2.2 分詞技術(shù)總結(jié)26
- 2.3 搜索算法26-29
- 2.3.1 搜索算法介紹26-28
- 2.3.2 搜索算法總結(jié)28-29
- 2.4 相似度算法29-30
- 2.4.1 相似度算法介紹29-30
- 2.4.2 相似度算法總結(jié)30
- 2.5 聚類算法30-33
- 2.5.1 聚類算法概述30-32
- 2.5.2 DBSCAN算法32-33
- 2.6 貝葉斯分類算法33
- 2.7 本章小結(jié)33-35
- 第三章 搜索引擎概述35-41
- 3.1 搜索引擎系統(tǒng)結(jié)構(gòu)35
- 3.2 索引構(gòu)造過程35-36
- 3.3 搜索過程36-37
- 3.4 搜索引擎組件37-39
- 3.4.1 索引庫37
- 3.4.2 分詞器37-38
- 3.4.3 搜索器38
- 3.4.4 評分器38-39
- 3.5 Lucene39-40
- 3.5.1 Lucene概述39
- 3.5.2 Lucene優(yōu)點39-40
- 3.6 本章小結(jié)40-41
- 第四章 移動應用智能搜索算法41-53
- 4.1 移動應用智能搜索算法概述41-43
- 4.2 應用語義評分模塊43-50
- 4.2.1 已有語義評分算法存在的問題43
- 4.2.2 應用語義評分模塊算法相關(guān)定義43-44
- 4.2.3 應用語義匹配評分算法44-47
- 4.2.4 應用語義匹配算法、優(yōu)質(zhì)前綴、優(yōu)質(zhì)后綴算法舉例47-49
- 4.2.5 應用語義相似度評分算法49-50
- 4.2.6 應用語義評分算法公式50
- 4.3 應用協(xié)同評分模塊50-51
- 4.3.1 概述50
- 4.3.2 應用協(xié)同評分模塊算法50-51
- 4.4 混合得分模塊51
- 4.5 移動應用智能搜索算法特點51-52
- 4.6 本章小結(jié)52-53
- 第五章 試驗驗證和結(jié)果分析53-63
- 5.1 實驗環(huán)境53
- 5.2 實驗數(shù)據(jù)53-54
- 5.3 實驗評價指標54
- 5.4 實驗數(shù)據(jù)準備54-55
- 5.5 搜索實驗55-61
- 5.5.1 搜索結(jié)果舉例55-59
- 5.5.2 實驗結(jié)果59-61
- 5.5.3 實驗分析61
- 5.6 本章小結(jié)61-63
- 第六章 移動應用智能搜索算法應用63-71
- 6.1 系統(tǒng)架構(gòu)63-64
- 6.2 搜索引擎實現(xiàn)64-69
- 6.2.1 集成Lucene64
- 6.2.2 創(chuàng)建搜索服務64-65
- 6.2.3 集成IK分詞器65
- 6.2.4 集成移動應用智能搜索算法65-69
- 6.3 搜索結(jié)果示例69-70
- 6.4 本章小結(jié)70-71
- 總結(jié)與展望71-72
- 參考文獻72-76
- 攻讀碩士學位期間發(fā)表的學術(shù)論文76-78
- 致謝78
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 阿難;;從移動應用著手——億美軟通拓寬軟件產(chǎn)業(yè)發(fā)展領域[J];每周電腦報;2005年33期
2 ;設計移動應用需關(guān)注六問題[J];每周電腦報;2006年32期
3 寧靜;;3G催熱,,企業(yè)移動應用迎來新一輪爆發(fā)[J];辦公自動化;2008年21期
4 ;移動應用設計中應避免的10種錯誤[J];計算機與網(wǎng)絡;2012年09期
5 ;CommunicAsia2013和EnterpriseIT2013集中在蓬勃發(fā)展的移動應用趨勢[J];電信工程技術(shù)與標準化;2013年05期
6 ;典型應用——移動應用未來發(fā)展的指向標[J];互聯(lián)網(wǎng)周刊;2013年21期
7 靳友民;;電信移動應用與企業(yè)應用結(jié)合的問題探析[J];現(xiàn)代企業(yè)教育;2013年24期
8 張言;;企業(yè)移動應用市場漸入佳境[J];通信世界;2006年13期
9 仝培杰;;移動應用,創(chuàng)新收入來源[J];中國計算機用戶;2006年20期
10 志杰;;注重移動應用的安全性[J];數(shù)碼世界;2008年03期
中國重要會議論文全文數(shù)據(jù)庫 前9條
1 吳希選;張成軍;;移動應用市場發(fā)展狀況分析[A];2012全國無線及移動通信學術(shù)大會論文集(下)[C];2012年
2 劉寧星;;關(guān)于博物館開發(fā)少兒移動應用的調(diào)研和思考[A];融合·創(chuàng)新·發(fā)展——數(shù)字博物館推動文化強國建設——2013年北京數(shù)字博物館研討會論文集[C];2013年
3 李昆侖;;利用智能管道技術(shù)構(gòu)建全新移動應用超市平臺[A];2013年中國通信學會信息通信網(wǎng)絡技術(shù)委員會年會論文集[C];2013年
4 范春曉;鄒俊偉;馬飛飛;張曉瑩;;一個移動應用綜合發(fā)布平臺的研究與設計[A];2004年全國通信軟件學術(shù)會議論文集[C];2004年
5 符冰;白雪松;金耀輝;;新一代校園移動應用模式的探索與實踐[A];中國高等教育學會教育信息化分會第十二次學術(shù)年會論文集[C];2014年
6 康潔;瞿弋微;;移動應用分析平臺上基于Ajax實現(xiàn)客戶端應用數(shù)據(jù)采集[A];中國新聞技術(shù)工作者聯(lián)合會第六次會員代表大會、2014年學術(shù)年會暨第七屆《王選新聞科學技術(shù)獎》和優(yōu)秀論文頒獎大會論文集(一等獎)[C];2014年
7 唐思誠;張云麟;劉捷;;CDMA移動應用部分(MAP)測試技術(shù)的實現(xiàn)[A];’2004計算機應用技術(shù)交流會議論文集[C];2004年
8 羅桂湘;;基于文本分析探討提升氣象微博影響力的技巧[A];創(chuàng)新驅(qū)動發(fā)展 提高氣象災害防御能力——S3第三屆氣象服務發(fā)展論壇——公眾、專業(yè)氣象預報服務技術(shù)與應用[C];2013年
9 蔣晶晶;葉劍;朱珍民;劉韓;;面向移動應用的分布式P2P情境數(shù)據(jù)檢索平臺的研究[A];第七屆和諧人機環(huán)境聯(lián)合學術(shù)會議(HHME2011)論文集【poster】[C];2011年
中國重要報紙全文數(shù)據(jù)庫 前10條
1 本報記者 邱燕娜;企業(yè)移動應用:四大問題背后的大市場[N];中國計算機報;2012年
2 本報記者 郭濤;移動應用和系統(tǒng)整合 魚與熊掌可兼得[N];中國計算機報;2013年
3 北京商報記者 張緒旺;移動應用傍上微信求用戶[N];北京商報;2013年
4 ;安宏睿業(yè):移動應用助力安全生產(chǎn)監(jiān)管[N];中國計算機報;2013年
5 本報記者 郭濤;企業(yè)移動應用設計直觀化、簡單化[N];中國計算機報;2013年
6 本報記者 王娟;企業(yè)級移動應用艱難起步[N];中國計算機報;2013年
7 本報記者 沈竹士;移動應用領域?qū)@苿賉N];文匯報;2013年
8 本報記者 焦麗莎;下一戰(zhàn),企業(yè)移動應用[N];中國經(jīng)濟時報;2014年
9 本報記者 郭濤;移動應用改變傳統(tǒng)溝通方式[N];中國計算機報;2014年
10 本報記者 鄭苒;移動應用:把藝術(shù)裝進口袋[N];中國文化報;2014年
中國博士學位論文全文數(shù)據(jù)庫 前3條
1 陳建民;面向移動應用安全評估的多屬性專家決策模型及應用研究[D];北京工業(yè)大學;2014年
2 夏曉;移動應用推薦—從算法到服務若干關(guān)鍵技術(shù)研究[D];國防科學技術(shù)大學;2013年
3 張耀文;基于雙邊市場理論的移動應用商店盈利模式研究[D];北京郵電大學;2013年
中國碩士學位論文全文數(shù)據(jù)庫 前10條
1 王建;移動應用平臺侵權(quán)責任中“通知刪除”規(guī)則的適用[D];華南理工大學;2015年
2 史卓生;基于UAP Mobile的故障記錄移動應用設計與實現(xiàn)[D];內(nèi)蒙古大學;2015年
3 袁霞;移動應用商店用戶下載行為研究[D];西南交通大學;2015年
4 李佩君;移動應用進入高職英語詞匯輔助教學的研究[D];閩南師范大學;2015年
5 崔華俊;面向移動應用的HTTP內(nèi)容緩存技術(shù)研究與實現(xiàn)[D];南京師范大學;2015年
6 孫婉穎;基于家長層面的兒童教育類移動應用質(zhì)量評價指標研究[D];上海交通大學;2015年
7 郝力濱;移動應用的交互動效研究[D];浙江大學;2015年
8 馬健;中國電信移動應用市場系統(tǒng)的設計和實現(xiàn)[D];大連理工大學;2015年
9 趙才隆;Y公司移動應用開發(fā)項目管理案例研究[D];大連理工大學;2015年
10 李秀江;基于用戶執(zhí)行蹤跡重放的移動應用測試方法[D];南京大學;2015年
本文關(guān)鍵詞:移動應用智能搜索算法研究與應用,由筆耕文化傳播整理發(fā)布。
本文編號:291992
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/291992.html