基于位置的移動(dòng)web搜索方法研究
本文選題:移動(dòng)搜索 + 位置 ; 參考:《華中科技大學(xué)》2012年碩士論文
【摘要】:隨著移動(dòng)設(shè)備的普及和無(wú)線網(wǎng)絡(luò)的演化,移動(dòng)搜索逐漸擴(kuò)大其在搜索市場(chǎng)的份額,也成為搜索研究的一個(gè)重要領(lǐng)域。當(dāng)前的移動(dòng)用戶終端搜索應(yīng)用或照搬web搜索引擎算法,,或僅僅對(duì)位置的進(jìn)行簡(jiǎn)單計(jì)算與排序,其結(jié)果排序并不能準(zhǔn)確地反映用戶與目標(biāo)之間的實(shí)際到達(dá)距離,用戶不能快捷的訪問(wèn)與自己距離較近的目標(biāo),從而降低用戶搜索體驗(yàn)。 本文研究的基于位置的移動(dòng)web搜索方法,就是為了細(xì)化搜索,將位置的概念引入到移動(dòng)搜索中來(lái)。對(duì)于移動(dòng)web搜索方法中位置信息的使用和處理,主要有如何獲取位置信息以及如何使用位置信息兩方面。本文即是從這兩方面出發(fā),首先使用CRF(條件隨機(jī)場(chǎng))方法提取頁(yè)面內(nèi)容中的地名詞匯,使用中文地名命名規(guī)則來(lái)去除地名歧義,使用決策樹(shù)算法來(lái)排除地名干擾,以此確定頁(yè)面內(nèi)容描述的位置信息;然后使用一種結(jié)合頁(yè)面重要度和頁(yè)面位置信息的綜合評(píng)分機(jī)制來(lái)對(duì)常規(guī)web搜索引擎的初步檢索結(jié)果進(jìn)行基于位置的重排序,使排序結(jié)果的前N項(xiàng)具有更高的相關(guān)程度,從而提高用戶搜索體驗(yàn)。 本文還為兩方面的研究分別設(shè)計(jì)了實(shí)驗(yàn)來(lái)比較本方法的性能。實(shí)驗(yàn)結(jié)果表明,結(jié)合CRF、命名規(guī)則和決策樹(shù)的頁(yè)面內(nèi)容位置抽取方法平均性能較好,結(jié)合重要度和位置信息的綜合評(píng)分機(jī)制在精確率上的性能較好。
[Abstract]:With the popularity of mobile devices and the evolution of wireless networks, mobile search has gradually expanded its share in the search market, and has become an important area of search research.The current mobile user terminal search application or copy of web search engine algorithm, or simply calculate and sort the location, the result sort can not accurately reflect the actual arrival distance between the user and the target.Users can not quickly access their own close to the target, thus reducing the user search experience.The mobile web search method based on location, which is studied in this paper, is to refine the search and introduce the concept of location into mobile search.For the use and processing of location information in mobile web search methods, there are two aspects: how to obtain location information and how to use location information.From these two aspects, this paper first uses the CRF (conditional random field) method to extract the toponymic vocabulary from the page content, uses the Chinese toponymic naming rules to remove the geographical names ambiguity, and uses the decision tree algorithm to eliminate the geographical names interference.Then, a comprehensive scoring mechanism combining page importance and page location information is used to reorder the initial retrieval results of conventional web search engine based on location.The first N items of sorting results have higher correlation degree, thus improving the user search experience.Experiments are also designed to compare the performance of this method.The experimental results show that the average performance of the page content location extraction method based on CRF, naming rules and decision tree is better, and the comprehensive scoring mechanism combined with importance and location information has better performance on accuracy rate.
【學(xué)位授予單位】:華中科技大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2012
【分類號(hào)】:TN929.5
【參考文獻(xiàn)】
相關(guān)期刊論文 前4條
1 李宇寧;忻展紅;;移動(dòng)搜索業(yè)務(wù)發(fā)展方向分析[J];信息通信;2008年01期
2 陳明;孫麗麗;;基于WAP的移動(dòng)搜索模型[J];計(jì)算機(jī)工程;2008年03期
3 李信利 ,馬軍 ,呂月娥 ,張德偉;基于文本分類的網(wǎng)頁(yè)排序算法[J];微計(jì)算機(jī)信息;2005年23期
4 左遠(yuǎn)清,周洞汝,王波;自然語(yǔ)言處理在搜索引擎信息檢索中的應(yīng)用[J];現(xiàn)代計(jì)算機(jī)(專業(yè)版);2002年07期
相關(guān)博士學(xué)位論文 前1條
1 杜萍;基于本體的中國(guó)行政區(qū)劃地名識(shí)別與抽取研究[D];蘭州大學(xué);2011年
相關(guān)碩士學(xué)位論文 前6條
1 廖文平;基于CRF的中文地名識(shí)別研究[D];大連理工大學(xué);2010年
2 孫會(huì)嶺;移動(dòng)環(huán)境中基于聚類的個(gè)性化推薦算法研究[D];燕山大學(xué);2011年
3 牟曉霞;我國(guó)移動(dòng)搜索業(yè)務(wù)發(fā)展研究[D];北京郵電大學(xué);2007年
4 楊慧鋒;中國(guó)移動(dòng)搜索概況研究[D];北京郵電大學(xué);2008年
5 史海峰;基于CRF的中文命名實(shí)體識(shí)別研究[D];蘇州大學(xué);2010年
6 孫珊珊;基于網(wǎng)頁(yè)聚類的搜索引擎結(jié)果排序[D];中國(guó)石油大學(xué);2010年
本文編號(hào):1770635
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1770635.html