搜索引擎查詢?nèi)罩镜脑~性標(biāo)注和挖掘研究
本文選題:日志挖掘 切入點(diǎn):詞性標(biāo)注 出處:《現(xiàn)代圖書(shū)情報(bào)技術(shù)》2009年04期
【摘要】:利用搜狗(Sogou)2007年3月的查詢?nèi)罩?使用詞性標(biāo)注方法,得出高頻詞性標(biāo)注結(jié)果的分布特征。發(fā)現(xiàn)用戶在查詢中以使用名詞為主,動(dòng)詞為輔,鮮有其它詞類出現(xiàn)在高頻詞性標(biāo)注結(jié)果中。以"的"為代表的虛詞較少地出現(xiàn)在高頻詞性標(biāo)注結(jié)果中。網(wǎng)絡(luò)搜索的查詢式與自然語(yǔ)言在句法上存在一定差異,但也有相通之處。用戶主要使用名詞進(jìn)行概念性檢索,關(guān)鍵詞仍為用戶進(jìn)行檢索的主要手段。高頻詞性標(biāo)注結(jié)果部分符合Zipf定律。
[Abstract]:Use Sogou (Sogou) March 2007 query log, using POS annotation method, obtains the high frequency distribution characteristics of POS tagging results. Users found in the query to use nouns, verbs as few other lexical category appear in the high frequency part of speech tagging results in fewer words. "" as the representative to appear in the high frequency part of speech tagging results in web search query. And there are some differences in natural language syntax, but there are also similarities. The main concept of user retrieval using a noun, is still the main method for user keyword retrieval. The high frequency part of speech tagging results according to Zipf law.
【作者單位】: 北京大學(xué)信息管理系;
【分類號(hào)】:TP391.1
【參考文獻(xiàn)】
相關(guān)期刊論文 前1條
1 郭巖,白碩,楊志峰,張凱;網(wǎng)絡(luò)日志規(guī)模分析和用戶興趣挖掘[J];計(jì)算機(jī)學(xué)報(bào);2005年09期
【共引文獻(xiàn)】
相關(guān)期刊論文 前4條
1 呂佳;;Web日志挖掘技術(shù)應(yīng)用研究[J];重慶師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2006年04期
2 邢玲;馬建國(guó);李幼平;劉志文;;一種基于UCL的中文網(wǎng)頁(yè)信息過(guò)濾方法[J];電子學(xué)報(bào);2006年10期
3 楊明花;古志民;;基于興趣特征的WUM數(shù)據(jù)預(yù)處理方法[J];計(jì)算機(jī)應(yīng)用;2006年10期
4 彭文輝;楊宗凱;黃克斌;;網(wǎng)絡(luò)學(xué)習(xí)行為分析及其模型研究[J];中國(guó)電化教育;2006年10期
相關(guān)碩士學(xué)位論文 前7條
1 黃克斌;網(wǎng)絡(luò)學(xué)習(xí)行為及其分析系統(tǒng)研究[D];華中師范大學(xué);2006年
2 呂佳;基于人工免疫系統(tǒng)的Web日志挖掘應(yīng)用研究[D];重慶大學(xué);2006年
3 宋愛(ài)美;Web訪問(wèn)模式發(fā)現(xiàn)與應(yīng)用研究[D];山東科技大學(xué);2006年
4 喬良;基于馬爾科夫模型的用戶瀏覽路徑預(yù)測(cè)研究[D];燕山大學(xué);2007年
5 黎慧娟;校園網(wǎng)用戶行為的分析與研究[D];廣西大學(xué);2007年
6 習(xí)慧丹;基于概念格的Web日志挖掘的研究[D];中南大學(xué);2007年
7 陳祖琴;基于數(shù)據(jù)挖掘的引文分析[D];西南大學(xué);2008年
【二級(jí)參考文獻(xiàn)】
相關(guān)期刊論文 前4條
1 王繼民,陳,
本文編號(hào):1700956
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1700956.html