網(wǎng)頁搜索引擎查詢?nèi)罩镜腟ession劃分研究
本文關(guān)鍵詞: 計(jì)算機(jī)應(yīng)用 中文信息處理 網(wǎng)絡(luò)信息檢索 查詢?nèi)罩?session劃分 搜索引擎 統(tǒng)計(jì)語言模型 行為分析 搜索行為 屬性 出處:《中文信息學(xué)報(bào)》2009年02期 論文類型:期刊論文
【摘要】:搜索引擎查詢?nèi)罩局械膕ession(以下簡稱session)是指某特定用戶為得到某個(gè)信息需求而在一段時(shí)間內(nèi)的搜索行為的連續(xù)序列。Session的正確劃分是進(jìn)行用戶搜索行為分析等一系列工作的重要基礎(chǔ),目前尚沒有關(guān)于session的系統(tǒng)研究工作。本文針對相關(guān)研究工作的問題重新統(tǒng)一定義了session的概念并進(jìn)行探索和比較研究,得出結(jié)論:(1)統(tǒng)計(jì)語言模型因數(shù)據(jù)稀疏問題不適合做session劃分;(2)利用多種屬性的決策樹方法可以得到比較理想的結(jié)果,以session為單位進(jìn)行評價(jià),F值達(dá)到了78.6%。
[Abstract]:Session in search engine query logs (hereinafter referred to as session). The correct division of continuous sequence Session for a certain user in order to obtain a certain information requirement is an important basis for user search behavior analysis and so on. At present, there is no systematic research work on session. This paper redefines the concept of session and carries on the exploration and the comparative research in view of the related research work question. It is concluded that the statistical language model is not suitable for session partitioning because of data sparsity. 2) an ideal result can be obtained by using the decision tree method with many attributes, and the F value of evaluation based on session is 78.6.
【作者單位】: 中國科學(xué)院計(jì)算技術(shù)研究所前瞻研究中心;
【基金】:國家自然科學(xué)基金資助項(xiàng)目(60603094) 北京市自然科學(xué)基金資助項(xiàng)目(4082030) 國家863資助項(xiàng)目(2006AA010105)
【分類號】:TP391.3
【正文快照】: 1引言搜索引擎查詢?nèi)罩疽呀?jīng)成為研究分析用戶的搜索行為、改進(jìn)搜索引擎的寶貴資源。有研究人員和搜索引擎公司做了許多查詢分析工作,來描述搜索用詞的使用習(xí)慣、組成結(jié)構(gòu)、搜索的熱點(diǎn)等等[2,13-14];各大搜索引擎提供商也在自己的網(wǎng)站上提供了搜索風(fēng)云榜[16]之類的內(nèi)容,這是典
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 王桂榮 ,張正卿;抗干擾曲線的一種算法[J];數(shù)值計(jì)算與計(jì)算機(jī)應(yīng)用;1980年02期
2 ;數(shù)值計(jì)算與計(jì)算機(jī)應(yīng)用第1卷1980年總目錄[J];數(shù)值計(jì)算與計(jì)算機(jī)應(yīng)用;1980年04期
3 楊廷郊;蘇聯(lián)計(jì)算機(jī)發(fā)展及應(yīng)用簡況[J];機(jī)器人;1980年02期
4 葉玉澄;關(guān)于算法集的一些特征[J];南昌大學(xué)學(xué)報(bào)(理科版);1980年01期
5 陳明遠(yuǎn),管汀鷺;打字能比說話更快——幾種高速鍵盤的設(shè)計(jì)[J];自然雜志;1980年08期
6 ;電子技術(shù)應(yīng)用——1980年1~6期總目錄[J];電子技術(shù)應(yīng)用;1980年06期
7 錢鋒;計(jì)算語言學(xué)[J];自然雜志;1980年04期
8 平一梅;約瑟夫森器件的計(jì)算機(jī)應(yīng)用[J];西北大學(xué)學(xué)報(bào)(自然科學(xué)版);1980年04期
9 ;“電子計(jì)算機(jī)工程與科學(xué)”1980年征訂啟事[J];計(jì)算機(jī)工程與科學(xué);1980年01期
10 朱三元;徐元宙;;COBOL的變遷[J];計(jì)算機(jī)研究與發(fā)展;1980年06期
相關(guān)會議論文 前10條
1 劉祥官;劉芳;陸劍鋒;李滿喜;蔡漳平;卜敏;高賢成;程克友;;濟(jì)鋼350m~3高爐的煉鐵優(yōu)化專家系統(tǒng)[A];1999中國鋼鐵年會論文集(上)[C];1999年
2 周愛民;鮑愛華;徐必根;徐樹嵐;;我國有色礦山的主要技術(shù)成就與差距[A];第六屆全國采礦學(xué)術(shù)會議論文集[C];1999年
3 蔣繼穆;;“八五”期間重有色金屬冶煉技術(shù)進(jìn)展概述[A];中國有色金屬學(xué)會第三屆學(xué)術(shù)會議論文集——戰(zhàn)略研究綜述部分[C];1997年
4 謝放;;深覆蓋層上面板堆石壩的分析計(jì)算[A];中國土木工程學(xué)會計(jì)算機(jī)應(yīng)用分會第七屆年會論文集[C];1999年
5 高洪深;;企業(yè)管理決策支持系統(tǒng)及其三庫系統(tǒng)的研究[A];企業(yè)發(fā)展與系統(tǒng)工程——中國系統(tǒng)工程學(xué)會第七屆年會論文集[C];1992年
6 王菲菲;;市、縣公共圖書館如何面對計(jì)算機(jī)應(yīng)用新趨勢[A];福建省迎接21世紀(jì)的圖書館服務(wù)學(xué)術(shù)研討會論文集[C];1998年
7 林士敏;;普及CAI知識 培養(yǎng)跨世紀(jì)人才——CAI課程開設(shè)五年回顧[A];廣西高等教育改革與發(fā)展——《廣西高教研究》創(chuàng)刊十周年(1985-1995)論文選集[C];1996年
8 李正仁;;在橋梁工程中計(jì)算機(jī)應(yīng)用的幾點(diǎn)展望[A];中國土木工程學(xué)會計(jì)算機(jī)應(yīng)用分會第七屆年會論文集[C];1999年
9 程軍;胡怡;;走向多元化發(fā)展的21世紀(jì)計(jì)算機(jī)[A];中國土木工程學(xué)會計(jì)算機(jī)應(yīng)用分會第七屆年會論文集[C];1999年
10 黃東;鄭邦民;黃昕;;明渠非恒定流數(shù)值模擬中的計(jì)算機(jī)應(yīng)用初探[A];中國土木工程學(xué)會計(jì)算機(jī)應(yīng)用分會第七屆年會論文集[C];1999年
相關(guān)重要報(bào)紙文章 前10條
1 伊凡;計(jì)算機(jī)應(yīng)用上新臺階[N];中國船舶報(bào);2000年
2 王周文;漢字學(xué)教育學(xué)專家關(guān)注小學(xué)識字教學(xué)[N];中國教育報(bào);2000年
3 柯技;IT產(chǎn)業(yè)推動(dòng)經(jīng)濟(jì)結(jié)構(gòu)調(diào)整[N];中國礦業(yè)報(bào);2000年
4 陳文;IBM開發(fā)出五個(gè)原子的量子計(jì)算機(jī)[N];光明日報(bào);2000年
5 ;形形色色的中文輸入法[N];中國信息報(bào);2000年
6 張長明;語言:人類文明的標(biāo)志[N];安徽日報(bào);2001年
7 李健;反病毒軟件:搶占市場突破口[N];中國電力報(bào);2001年
8 劉萍;我國中文信息處理技術(shù)達(dá)到新水平[N];中國電子報(bào);2001年
9 本報(bào)記者 梁曦 特約記者 楊蓉 董萬森;托起國際工程的平臺[N];中國化工報(bào);2001年
10 國家標(biāo)準(zhǔn)化管理委員會主任助理 宿忠民;加快標(biāo)準(zhǔn)化步伐 促進(jìn)高新技術(shù)產(chǎn)業(yè)發(fā)展[N];中國國門時(shí)報(bào)(中國出入境檢驗(yàn)疫報(bào));2001年
相關(guān)博士學(xué)位論文 前10條
1 姜梅;基于生物免疫系統(tǒng)的計(jì)算機(jī)入侵檢測技術(shù)研究[D];南京航空航天大學(xué);2001年
2 宋春陽;面向信息處理的現(xiàn)代漢語“名+名”邏輯語義研究[D];上海師范大學(xué);2003年
3 方向紅;基于內(nèi)涵邏輯的現(xiàn)代漢語連接詞及關(guān)聯(lián)句式語義研究[D];上海師范大學(xué);2004年
4 涂蓉;肝CT圖像分析的臨床與計(jì)算機(jī)應(yīng)用研究[D];中南大學(xué);2004年
5 王建會;中文信息處理中若干關(guān)鍵技術(shù)的研究[D];復(fù)旦大學(xué);2004年
6 劉杰;泄漏發(fā)射的信息重建與防御對策[D];浙江大學(xué);2004年
7 陳守強(qiáng);丁書文教授用藥規(guī)律的計(jì)算機(jī)輔助分析[D];山東中醫(yī)藥大學(xué);2005年
8 Memon Abdul Ghafoor;[D];浙江大學(xué);2006年
9 單大卯;人體下肢肌肉功能模型及其應(yīng)用的研究[D];上海體育學(xué)院;2003年
10 吳應(yīng)良;網(wǎng)絡(luò)計(jì)算中的智能信息處理方法研究[D];華南理工大學(xué);2000年
相關(guān)碩士學(xué)位論文 前10條
1 李衛(wèi)亮;現(xiàn)代漢語分詞系統(tǒng)中專名識別的實(shí)用策略[D];北京工業(yè)大學(xué);2000年
2 婁(王廷);現(xiàn)代漢語分詞系統(tǒng)通用性設(shè)計(jì)及切分歧義處理[D];北京工業(yè)大學(xué);2000年
3 胡光源;Windows環(huán)境下動(dòng)畫制作系統(tǒng)[D];大連理工大學(xué);2000年
4 陳瑞丹;面向企業(yè)信息系統(tǒng)的可適應(yīng)性建模研究與應(yīng)用[D];大連理工大學(xué);2000年
5 郭卉萍;基于Java的網(wǎng)絡(luò)中文平臺的研究與實(shí)現(xiàn)[D];西安電子科技大學(xué);2001年
6 吳傳喜;一種面向Internet的中文應(yīng)用支撐平臺的研究與實(shí)現(xiàn)[D];西安電子科技大學(xué);2001年
7 劉宏;基于Web的自主學(xué)習(xí)遠(yuǎn)程教學(xué)系統(tǒng)[D];遼寧師范大學(xué);2001年
8 劉向輝;專題性智能搜索引擎的研究與實(shí)現(xiàn)[D];昆明理工大學(xué);2001年
9 程麗芳;基于Ada95的語言識別器生成器的研究[D];西安電子科技大學(xué);2001年
10 張馳;Web信息獲取技術(shù)研究與實(shí)現(xiàn)[D];西北工業(yè)大學(xué);2001年
,本文編號:1457639
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1457639.html