Geeking:基于勝者表的體育新聞搜索引擎系統(tǒng)
本文關(guān)鍵詞:Geeking:基于勝者表的體育新聞搜索引擎系統(tǒng)
更多相關(guān)文章: 搜索引擎 體育新聞 勝者表 編輯距離 聚類 查詢?cè)~校正
【摘要】:文章介紹了體育新聞搜索引擎系統(tǒng)Geeking的框架結(jié)構(gòu)和各項(xiàng)功能,其結(jié)構(gòu)分為網(wǎng)頁(yè)爬取、勝者表構(gòu)建、檢索處理、用戶界面4個(gè)部分,其主要功能包含查詢?cè)~校正、自動(dòng)補(bǔ)全、檢索結(jié)果排序、相似新聞聚類以及顯示頁(yè)面中關(guān)鍵詞高亮并提供網(wǎng)頁(yè)快照。輸入查詢請(qǐng)求時(shí),系統(tǒng)根據(jù)搜索日志和新聞熱詞自動(dòng)補(bǔ)全查詢?cè)~,搜索不到相關(guān)結(jié)果時(shí)校正查詢,給出推薦的查詢?cè)~。檢索新聞文檔時(shí),使用勝者表快速查找查詢?cè)~項(xiàng)的相關(guān)文檔,綜合tf-idf權(quán)重和新聞標(biāo)題、發(fā)布時(shí)間等因素計(jì)算文檔的相關(guān)性并按得分排序。在相似新聞聚類中,結(jié)合最長(zhǎng)公共子序列和編輯距離衡量新聞標(biāo)題之間的相似度,以新聞標(biāo)題相似度代表新聞文檔的相似度。測(cè)試結(jié)果表明,基于勝者表的Geeking搜索引擎系統(tǒng)各項(xiàng)功能協(xié)調(diào)效果好,檢索響應(yīng)速度快。
【作者單位】: 中國(guó)科學(xué)院深圳先進(jìn)技術(shù)研究院;中國(guó)科學(xué)院上海高等研究院;中國(guó)科學(xué)院計(jì)算技術(shù)研究所;中國(guó)科學(xué)院沈陽(yáng)計(jì)算技術(shù)研究所;河北大學(xué)數(shù)學(xué)與信息科學(xué)學(xué)院;
【關(guān)鍵詞】: 搜索引擎 體育新聞 勝者表 編輯距離 聚類 查詢?cè)~校正
【基金】:國(guó)家自然科學(xué)基金(61433012,U1435215,11171086) 河北省自然科學(xué)基金(F2013201064)
【分類號(hào)】:TP391.3
【正文快照】: 1引言傳統(tǒng)搜索引擎沒有對(duì)不同領(lǐng)域的各個(gè)主題設(shè)立一個(gè)專門的搜索欄目,如百度等搜索引擎有“新聞”這個(gè)欄目,但沒有在這個(gè)欄目下設(shè)更加細(xì)致的劃分,如“體育新聞”、“軍事新聞”等。在信息爆炸的當(dāng)代,人們希望更加準(zhǔn)確快捷地獲取需要的特定領(lǐng)域的信息,因此搜索需求會(huì)逐漸領(lǐng)域化
【參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前1條
1 劉一佳;車萬(wàn)翔;劉挺;張梅山;;基于序列標(biāo)注的中文分詞、詞性標(biāo)注模型比較分析[J];中文信息學(xué)報(bào);2013年04期
【共引文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前1條
1 張東香;江長(zhǎng)柱;;基于多重語(yǔ)義的詞典管理方法和實(shí)現(xiàn)[J];信息技術(shù);2015年09期
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前1條
1 劉松;基于全信息的問答系統(tǒng)研究[D];北京郵電大學(xué);2014年
【二級(jí)參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前1條
1 張梅山;鄧知龍;車萬(wàn)翔;劉挺;;統(tǒng)計(jì)與詞典相結(jié)合的領(lǐng)域自適應(yīng)中文分詞[J];中文信息學(xué)報(bào);2012年02期
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 吳清江;吳政;劉琳瑯;;面向僑務(wù)信息主題的搜索引擎系統(tǒng)[J];華僑大學(xué)學(xué)報(bào)(自然科學(xué)版);2006年04期
2 張穎超;段雪英;;個(gè)性化搜索引擎系統(tǒng)機(jī)制的研究[J];計(jì)算機(jī)工程與設(shè)計(jì);2007年13期
3 梁滌塵;任楨;;電力文獻(xiàn)搜索引擎系統(tǒng)設(shè)計(jì)[J];計(jì)算機(jī)與數(shù)字工程;2007年07期
4 高勁松;張俊麗;;幾種典型網(wǎng)格搜索引擎系統(tǒng)的結(jié)構(gòu)體系分析[J];圖書情報(bào)工作;2008年05期
5 姚燁;周盼;;迷你搜索引擎系統(tǒng)的設(shè)計(jì)[J];信息與電腦(理論版);2010年11期
6 張偉哲;張宏莉;許笑;何慧;;分布式搜索引擎系統(tǒng)效能建模與評(píng)價(jià)[J];軟件學(xué)報(bào);2012年02期
7 雷鳴,劉建國(guó),王建勇,陳葆玨;一種基于詞典的搜索引擎系統(tǒng)動(dòng)態(tài)更新模型[J];計(jì)算機(jī)研究與發(fā)展;2000年10期
8 周福才,張利,邵世煌,范曉明;面向遠(yuǎn)程教育的搜索引擎系統(tǒng)的開發(fā)[J];東北大學(xué)學(xué)報(bào);2001年06期
9 劉玲;;搜索引擎系統(tǒng)的研究與實(shí)現(xiàn)[J];科學(xué)之友(B版);2007年02期
10 傅勉;李偉芬;張杰;林雅金;;基于Directory的裝備論證搜索引擎系統(tǒng)設(shè)計(jì)[J];微計(jì)算機(jī)信息;2007年36期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前4條
1 張健沛;徐潑;楊靜;;一種輕量級(jí)個(gè)性化搜索引擎系統(tǒng)[A];第三屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2007年
2 申兵一;鞏青歌;;基于Lucene桌面搜索引擎系統(tǒng)的設(shè)計(jì)和實(shí)現(xiàn)[A];江蘇省電子學(xué)會(huì)2010年學(xué)術(shù)年會(huì)論文集[C];2010年
3 陳e,
本文編號(hào):633170
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/633170.html