APP標(biāo)簽挖掘及應(yīng)用系統(tǒng)的設(shè)計與實現(xiàn)
本文選題:標(biāo)簽挖掘 + 垂直搜索; 參考:《哈爾濱工業(yè)大學(xué)》2013年碩士論文
【摘要】:隨著智能手機(jī)的廣泛流行,移動互聯(lián)網(wǎng)正不斷改變著人們的生活方式,將用戶從PC端帶到了移動端,這一切都是因為手機(jī)應(yīng)用程序(Application)的豐富,使移動終端基本上具有電腦的所有功能,并且使用更加便捷;但是隨著App數(shù)量的不斷增長,用戶對App的檢索需求也不斷加大,傳統(tǒng)的搜索引擎很難準(zhǔn)確的返回用戶所需要的信息,,浪費了大量時間。 本文的主要研究內(nèi)容是通過文本挖掘的方法從網(wǎng)頁信息與查詢?nèi)罩緝煞矫娅@取App的概念體系、屬性及語義三種不同的標(biāo)簽,并最終通過這些標(biāo)簽構(gòu)建一個面向App領(lǐng)域的垂直搜索應(yīng)用,進(jìn)行App查詢和推薦服務(wù)。 App的概念體系標(biāo)簽挖掘是通過獲取App網(wǎng)站導(dǎo)航欄信息的方式實現(xiàn)的,通過對導(dǎo)航欄的解析可以獲得App的分類信息,之后通過本文提出的一種基于余弦相似度和同義詞擴(kuò)展的分類體系融合策略將所有分類信息進(jìn)行合并,使得每一個App都有自己的分類體系;對于屬性標(biāo)簽,是將抓取到的App簡介信息作為文本,通過關(guān)鍵詞抽取技術(shù)獲得而成的;語義標(biāo)簽的獲取則是通過查詢?nèi)罩緦崿F(xiàn)的,使用查詢?nèi)罩局械腝uery、Titile、Url和點擊行為等信息,通過本文提出的一系列規(guī)則和過濾策略使得查詢Query和App一一對應(yīng)起來,再通過分詞、詞法分析、句法分析等手段對Query進(jìn)行處理,獲取其語義標(biāo)簽。以上標(biāo)簽挖掘方法不需要人工參與,節(jié)省了大量資源開銷。 整個應(yīng)用系統(tǒng)采用Django框架進(jìn)行搭建,并通過Lucene全文搜索工具包對標(biāo)簽數(shù)據(jù)構(gòu)建索引,實現(xiàn)了具有語義分析功能的檢索系統(tǒng)。經(jīng)過功能測試,滿足人們對App領(lǐng)域檢索的需求。
[Abstract]:With the popularity of smartphones, the mobile Internet is changing the way people live, bringing users from the PC to the mobile, all because of the abundance of mobile applications. The mobile terminal has almost all the functions of the computer, and it is more convenient to use. But with the increasing number of App, the search demand for App is also increasing. Traditional search engines are difficult to accurately return the information users need, wasting a lot of time. The main research content of this paper is to obtain three different tags of App from two aspects: Web page information and query log through text mining. Finally, a vertical search application oriented to the App domain is constructed through these tags, and the App query and recommendation services are carried out. The concept system tag mining of App is realized by obtaining the information of the navigation bar of the App website. The classification information of App can be obtained by analyzing the navigation bar, and then the classification information is merged by a classification system fusion strategy based on cosine similarity and synonym extension proposed in this paper. So that each App has its own classification system; for attribute tags, the captured App information is taken as text, obtained by keyword extraction technology; semantic tags are obtained through query logs. Using query Titileurl and click-behavior information in query log, query and App are matched one by a series of rules and filtering strategies proposed in this paper, and then query is processed by participle, lexical analysis, syntactic analysis and so on. Gets its semantic tag. The above label mining method does not need human participation, saving a lot of resources. The whole application system is constructed with Django framework, and the label data is indexed by Lucene Full-text search Toolkit. The retrieval system with semantic analysis function is realized. Through the function test, satisfy the people to the App domain retrieval demand.
【學(xué)位授予單位】:哈爾濱工業(yè)大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2013
【分類號】:TP391.1
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 ;第七屆典型應(yīng)用系統(tǒng)及優(yōu)秀軟件銅牌證書(部分)[J];辦公自動化;2007年24期
2 ;第七屆典型應(yīng)用系統(tǒng)及優(yōu)秀軟件銅牌證書(部分)[J];辦公自動化;2008年01期
3 姜明媚;;完美搜索[J];互聯(lián)網(wǎng)周刊;2007年05期
4 周作濤;;垂直搜索在電子商務(wù)中的應(yīng)用分析[J];陜西理工學(xué)院學(xué)報(自然科學(xué)版);2008年03期
5 趙宏中;李亞;;垂直搜索引擎應(yīng)用研究[J];現(xiàn)代商貿(mào)工業(yè);2010年04期
6 尹建芬;;Sony顯示應(yīng)用系統(tǒng)拉開巡展[J];電子測試;2000年08期
7 莓荔;;OA’2001典型應(yīng)用系統(tǒng)頒證暨2002年新春聯(lián)誼會在京舉行[J];辦公自動化;2002年01期
8 鄭力明;易平;;基于HTMLParser信息提取的網(wǎng)絡(luò)爬蟲設(shè)計[J];微計算機(jī)信息;2009年15期
9 秦茜;;期待搜狗抹平新賬舊債馬云張朝陽合謀垂直搜索[J];IT時代周刊;2010年17期
10 劉金亮;蘇琳;石云;;基于Nutch的垂直搜索技術(shù)研究[J];電腦知識與技術(shù);2011年24期
相關(guān)會議論文 前10條
1 彭煊;;中國科協(xié)應(yīng)用系統(tǒng)整合的研究與設(shè)計[A];第十一屆中國科協(xié)年會第33分會場新媒體與科技傳播研討會論文集[C];2009年
2 高霞;;集輸總廠管線數(shù)據(jù)的采集、存儲與應(yīng)用[A];中國石油石化數(shù)字管道信息化建設(shè)論壇暨燃?xì)夤芫W(wǎng)安全、經(jīng)濟(jì)、運(yùn)營技術(shù)交流研討會論文集[C];2009年
3 彭煊;;中國科協(xié)應(yīng)用系統(tǒng)整合的研究與設(shè)計[A];自主創(chuàng)新與持續(xù)增長第十一屆中國科協(xié)年會論文集(4)[C];2009年
4 李千目;戚ng;孫向軍;劉鳳玉;;一種分布式Web應(yīng)用系統(tǒng)研究與設(shè)計[A];第二十屆全國數(shù)據(jù)庫學(xué)術(shù)會議論文集(技術(shù)報告篇)[C];2003年
5 陳麗文;廖苑晴;;國小4~6年級防災(zāi)評量之研究[A];全國教育與心理統(tǒng)計與測量學(xué)術(shù)年會暨第八屆海峽兩岸心理與教育測驗學(xué)術(shù)研討會論文摘要集[C];2008年
6 段義農(nóng);馬濟(jì)宏;胡新平;李榮;;《醫(yī)學(xué)寄生蟲學(xué)考試應(yīng)用系統(tǒng)》簡介[A];中國動物學(xué)會第八次全國寄生蟲學(xué)學(xué)術(shù)討論會論文摘要匯編[C];2001年
7 林郁;劉雄輝;;重點煙草企業(yè)的應(yīng)用系統(tǒng)集成(EAI)的解決方案[A];中國煙草行業(yè)信息化研討會論文集[C];2004年
8 趙韻華;;上海公路網(wǎng)交通調(diào)查數(shù)據(jù)處理及分析應(yīng)用系統(tǒng)淺析[A];中國公路學(xué)會2005年學(xué)術(shù)年會論文集(上)[C];2005年
9 李永堅;;主動窗體(ActiveForm)技術(shù)在Intranet中的應(yīng)用[A];廣西電機(jī)工程學(xué)會第七屆青年學(xué)術(shù)交流會論文集[C];2002年
10 韓健;廖之平;羅超;;傳統(tǒng)測繪單位發(fā)展GIS應(yīng)用軟件服務(wù)探討[A];中國測繪學(xué)會九屆四次理事會暨2008年學(xué)術(shù)年會論文集[C];2008年
相關(guān)重要報紙文章 前10條
1 薛娟;垂直搜索盯緊風(fēng)投的口袋?[N];中國經(jīng)濟(jì)時報;2006年
2 李永勝;垂直搜索:Google們漏掉的空檔?[N];中國計算機(jī)報;2006年
3 ;移動垂直搜索開拓中國搜索新天地[N];人民郵電;2006年
4 沉風(fēng);垂直搜索:互聯(lián)網(wǎng)服務(wù)生活新方向[N];人民郵電;2007年
5 姜蓉;垂直搜索是搜索市場的新“錢景”[N];中國經(jīng)營報;2005年
6 蘇娟;中移動即將上線無線音樂垂直搜索業(yè)務(wù)[N];中國計算機(jī)報;2008年
7 建平;專業(yè)垂直搜索升溫[N];計算機(jī)世界;2005年
8 魏蓓;中文商業(yè)搜索引擎提供垂直搜索服務(wù)[N];市場報;2006年
9 本報記者 廖慶升;在線旅游市場格局生變 垂直搜索降低出游成本[N];通信信息報;2010年
10 任一鳴;垂直搜索:抓住細(xì)分需求[N];計算機(jī)世界;2007年
相關(guān)博士學(xué)位論文 前10條
1 管虎;普適環(huán)境下輕量級垂直搜索中數(shù)據(jù)挖掘理論研究[D];上海交通大學(xué);2013年
2 盛柏楊;APP的異常剪切導(dǎo)致神經(jīng)損傷的機(jī)理研究[D];清華大學(xué);2009年
3 薛衛(wèi)國;電針對APP轉(zhuǎn)基因鼠腦Aβ水平及腦微血管病變影響的研究[D];北京中醫(yī)藥大學(xué);2010年
4 危立飛;丁內(nèi)酯衍生物3BDO通過降低腦內(nèi)Aβ含量改善了APP/PS1雙轉(zhuǎn)基因模型小鼠的認(rèn)知障礙[D];山東大學(xué);2012年
5 林楠;雷公藤氯內(nèi)酯醇(T_4)通過改善突觸可塑性和APP代謝減輕SAMP8小鼠認(rèn)知功能損害[D];福建醫(yī)科大學(xué);2012年
6 張忠;益智湯對APP695轉(zhuǎn)基因小鼠的治療作用及其機(jī)理研究[D];北京中醫(yī)藥大學(xué);2010年
7 張永進(jìn);面向防汛抗旱指揮系統(tǒng)的應(yīng)用集成中間件平臺研究[D];西北大學(xué);2007年
8 王萍;血管內(nèi)皮生長因子改善APP轉(zhuǎn)基因小鼠認(rèn)知功能的作用及機(jī)制研究[D];山東大學(xué);2011年
9 張雪英;基于粗糙集理論的文本自動分類研究[D];南京理工大學(xué);2005年
10 張華;胰島素樣生長因子-1對PC12細(xì)胞APP代謝和BACE-1表達(dá)的影響及其機(jī)制的研究[D];重慶醫(yī)科大學(xué);2011年
相關(guān)碩士學(xué)位論文 前10條
1 馮驍騁;APP標(biāo)簽挖掘及應(yīng)用系統(tǒng)的設(shè)計與實現(xiàn)[D];哈爾濱工業(yè)大學(xué);2013年
2 錢守義;校園網(wǎng)絡(luò)教學(xué)應(yīng)用系統(tǒng)的設(shè)計與實現(xiàn)[D];電子科技大學(xué);2010年
3 李海鵬;應(yīng)用系統(tǒng)的形式化描述研究與實現(xiàn)[D];電子科技大學(xué);2011年
4 王X昊;遼寧省電子地圖應(yīng)用系統(tǒng)的設(shè)計與實現(xiàn)[D];大連理工大學(xué);2012年
5 龔曉瑞;通用證券應(yīng)用系統(tǒng)的設(shè)計與實現(xiàn)[D];北京郵電大學(xué);2010年
6 陳耿;基于UML的應(yīng)用系統(tǒng)建模研究[D];武漢大學(xué);2004年
7 原曉敏;環(huán)境應(yīng)用系統(tǒng)業(yè)務(wù)運(yùn)行管理分系統(tǒng)的設(shè)計與實現(xiàn)[D];北京交通大學(xué);2012年
8 曹靜;耳鳴治療儀應(yīng)用系統(tǒng)的研究與實現(xiàn)[D];西安科技大學(xué);2010年
9 韓雪嬌;英語試題關(guān)鍵詞抽取算法研究[D];北方工業(yè)大學(xué);2013年
10 廖斌;分布式應(yīng)用系統(tǒng)的研究與開發(fā)[D];武漢理工大學(xué);2003年
本文編號:2013074
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2013074.html