天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 搜索引擎論文 >

一種基于詞典的搜索引擎系統(tǒng)動(dòng)態(tài)更新模型

發(fā)布時(shí)間:2018-08-29 18:37
【摘要】:基于詞匯標(biāo)注的特征項(xiàng)提取方法是中文信息處理的有效方法 ,但詞匯的析取是基于詞典的 ,詞典的涵蓋程度決定了詞匯切分的準(zhǔn)確率 .因而不斷地學(xué)習(xí)新詞匯、動(dòng)態(tài)地維護(hù)詞典 ,使整個(gè)中文信息處理系統(tǒng)具有自適應(yīng)性和動(dòng)態(tài)性就成了一個(gè)關(guān)鍵問(wèn)題 .以搜索引擎系統(tǒng)為例 ,提出了一種基于詞典動(dòng)態(tài)變化的搜索引擎系統(tǒng)更新理論模型和實(shí)現(xiàn)模型 .相關(guān)實(shí)驗(yàn)表明 ,該模型對(duì)縮短搜索引擎信息庫(kù)的更新時(shí)間、提高查詢準(zhǔn)確率等方面十分有效
[Abstract]:Feature extraction based on lexical tagging is an effective method for Chinese information processing, but lexical extraction is based on dictionaries. The accuracy of lexical segmentation is determined by the extent of lexical coverage. So it is a key problem to learn new words and maintain dictionaries dynamically so that the whole Chinese information processing system is adaptive and dynamic. Taking search engine system as an example, this paper presents a theoretical model and implementation model of search engine system updating based on dictionary dynamic change. Relevant experiments show that the model is very effective in shortening the update time of search engine information base and improving the query accuracy.
【作者單位】: 北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)系!北京100871 北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)系!北京100871 北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)系!北京100871 北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)系!北京100871
【基金】:國(guó)家“九五”重點(diǎn)科技攻關(guān)項(xiàng)目基金資助!(項(xiàng)目編號(hào) 96 -743 -0 1-0 5 -0 1)
【分類號(hào)】:TP391.3

【共引文獻(xiàn)】

相關(guān)期刊論文 前5條

1 周水庚,關(guān)佶紅,胡運(yùn)發(fā),周傲英;一個(gè)無(wú)需詞典支持和切詞處理的中文文檔分類系統(tǒng)[J];計(jì)算機(jī)研究與發(fā)展;2001年07期

2 馮是聰,張志剛,李曉明;一種中文網(wǎng)頁(yè)自動(dòng)分類方法的實(shí)現(xiàn)及應(yīng)用[J];計(jì)算機(jī)工程;2004年05期

3 吳光遠(yuǎn),何丕廉,曹桂宏,聶頌;基于向量空間模型的詞共現(xiàn)研究及其在文本分類中的應(yīng)用[J];計(jì)算機(jī)應(yīng)用;2003年S1期

4 周水庚,關(guān)佶紅,俞紅奇,胡運(yùn)發(fā);基于Ngram信息的中文文檔分類研究[J];中文信息學(xué)報(bào);2001年01期

5 鄭小慎 ,何丕廉 ,陳治綱 ,任大同 ,吳克敏;基于凝聚點(diǎn)的文本動(dòng)態(tài)聚類分析[J];微型機(jī)與應(yīng)用;2004年08期

相關(guān)博士學(xué)位論文 前2條

1 劉濤;現(xiàn)代信息檢索中的文本分類及圖像恢復(fù)研究[D];北京郵電大學(xué);2006年

2 賈自艷;Web信息智能獲取若干關(guān)鍵問(wèn)題研究[D];中國(guó)科學(xué)院研究生院(計(jì)算技術(shù)研究所);2004年

相關(guān)碩士學(xué)位論文 前5條

1 賈自艷;中文智能搜索引擎關(guān)鍵技術(shù)研究[D];北京工業(yè)大學(xué);2001年

2 楊斌;中文文本數(shù)據(jù)挖掘研究[D];湘潭大學(xué);2002年

3 鄒加棋;中文網(wǎng)頁(yè)自動(dòng)分類關(guān)鍵技術(shù)研究[D];福州大學(xué);2006年

4 付裕;文本分類方案選擇方法及原型系統(tǒng)開(kāi)發(fā)[D];大連理工大學(xué);2006年

5 陳海波;基于自動(dòng)分詞的企業(yè)文檔搜索引擎設(shè)計(jì)與實(shí)現(xiàn)[D];西北工業(yè)大學(xué);2007年

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 王偉;趙東巖;趙偉;;中文新聞關(guān)鍵事件的主題句識(shí)別[J];北京大學(xué)學(xué)報(bào)(自然科學(xué)版);2011年05期

2 楊皓東;江凌;李國(guó)俊;;國(guó)內(nèi)自然語(yǔ)言處理研究熱點(diǎn)分析——基于共詞分析[J];圖書(shū)情報(bào)工作;2011年10期

3 劉一寧;;學(xué)術(shù)定義抽取研究綜述[J];情報(bào)探索;2011年08期

4 史曉東;盧亞軍;;央金藏文分詞系統(tǒng)[J];中文信息學(xué)報(bào);2011年04期

5 楊撼岳;陳笑蓉;鄭高山;;水族文字筆形編碼方法研究[J];計(jì)算機(jī)工程;2011年14期

6 彭成;季培培;;基于確定性退火的中文術(shù)語(yǔ)語(yǔ)義層次關(guān)聯(lián)研究[J];計(jì)算機(jī)應(yīng)用研究;2011年09期

7 王利鑫;耿煥同;孫凱;張茜;;基于自然語(yǔ)言處理的文本泄密自動(dòng)檢測(cè)技術(shù)[J];計(jì)算機(jī)工程與設(shè)計(jì);2011年08期

8 安見(jiàn)才讓;;藏語(yǔ)句子相似度算法的研究[J];中文信息學(xué)報(bào);2011年04期

9 劉興林;鄭啟倫;馬千里;;中文合成詞識(shí)別及分詞修正[J];計(jì)算機(jī)應(yīng)用研究;2011年08期

10 張野;楊建林;;基于KNN和SVM的中文文本自動(dòng)分類研究[J];情報(bào)科學(xué);2011年09期

相關(guān)會(huì)議論文 前10條

1 孫玉芳;;中文信息處理與國(guó)家信息化建設(shè)[A];面向21世紀(jì)的科技進(jìn)步與社會(huì)經(jīng)濟(jì)發(fā)展(上冊(cè))[C];1999年

2 劉群;張浩;白碩;;中文信息處理開(kāi)放平臺(tái)的設(shè)計(jì)[A];第一屆學(xué)生計(jì)算語(yǔ)言學(xué)研討會(huì)論文集[C];2002年

3 由麗萍;劉燾;劉開(kāi)瑛;;信息處理用中文框架語(yǔ)義知識(shí)描述方法研究[A];民族語(yǔ)言文字信息技術(shù)研究——第十一屆全國(guó)民族語(yǔ)言文字信息學(xué)術(shù)研討會(huì)論文集[C];2007年

4 汪華峰;陳峪;;漢語(yǔ)自然語(yǔ)言理解中詞切分中新詞問(wèn)題初探[A];第一屆全國(guó)語(yǔ)言識(shí)別學(xué)術(shù)報(bào)告與展示會(huì)論文集[C];1990年

5 馮志偉;;自然語(yǔ)言處理中的理性主義和經(jīng)驗(yàn)主義[A];民族語(yǔ)言文字信息技術(shù)研究——第十一屆全國(guó)民族語(yǔ)言文字信息學(xué)術(shù)研討會(huì)論文集[C];2007年

6 白剛;張錚;丁宗堯;朱毅;;中文文本聚類在互聯(lián)網(wǎng)搜索的研究與應(yīng)用[A];第三屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2007年

7 支流;朱學(xué)鋒;段慧明;俞士汶;;中文縮略語(yǔ)還原技術(shù)初探[A];全國(guó)第八屆計(jì)算語(yǔ)言學(xué)聯(lián)合學(xué)術(shù)會(huì)議(JSCL-2005)論文集[C];2005年

8 鄭家恒;譚紅葉;王興義;;基于模式匹配的中文專有名詞識(shí)別[A];民族語(yǔ)言文字信息技術(shù)研究——第十一屆全國(guó)民族語(yǔ)言文字信息學(xué)術(shù)研討會(huì)論文集[C];2007年

9 葛詩(shī)利;陳瀟瀟;;中國(guó)EFL學(xué)習(xí)者自動(dòng)作文評(píng)分探索[A];第三屆學(xué)生計(jì)算語(yǔ)言學(xué)研討會(huì)論文集[C];2006年

10 宋柔;;自然語(yǔ)言處理中語(yǔ)言知識(shí)的基礎(chǔ)性地位[A];民族語(yǔ)言文字信息技術(shù)研究——第十一屆全國(guó)民族語(yǔ)言文字信息學(xué)術(shù)研討會(huì)論文集[C];2007年

相關(guān)重要報(bào)紙文章 前10條

1 姚雙云 華中師范大學(xué)語(yǔ)言與語(yǔ)言教育研究中心;虛詞知識(shí)庫(kù):中文信息處理的基石[N];中國(guó)社會(huì)科學(xué)報(bào);2011年

2 記者 梁捷;我國(guó)中文信息處理技術(shù)從實(shí)驗(yàn)室走向全面應(yīng)用[N];光明日?qǐng)?bào);2009年

3 張波 龍雨;中文信息處理國(guó)際學(xué)術(shù)會(huì)議在武漢大學(xué)召開(kāi)[N];中國(guó)社會(huì)科學(xué)院院報(bào);2007年

4 記者 韓曉玲邋通訊員 張波 龍雨;海內(nèi)外專家聚焦中文信息處理[N];湖北日?qǐng)?bào);2007年

5 胡唯元;文字編碼新標(biāo)準(zhǔn):不再為“名”所累[N];科技日?qǐng)?bào);2006年

6 許偉;金友兵 破局國(guó)外辦公套件壟斷[N];中國(guó)企業(yè)報(bào);2008年

7 鄭昊;數(shù)據(jù)挖掘加工海量數(shù)據(jù)[N];中國(guó)計(jì)算機(jī)報(bào);2007年

8 ;浙江天宇信息技術(shù)有限公司[N];中國(guó)計(jì)算機(jī)報(bào);2009年

9 ;開(kāi)天辟地第一回[N];計(jì)算機(jī)世界;2002年

10 劉潔;SAS分析產(chǎn)品鏈增添“新成員”[N];科技日?qǐng)?bào);2008年

相關(guān)博士學(xué)位論文 前10條

1 盧延鑫;基于自然語(yǔ)言處理技術(shù)的循證醫(yī)學(xué)信息提取研究[D];復(fù)旦大學(xué);2011年

2 計(jì)峰;自然語(yǔ)言處理中序列標(biāo)注模型的研究[D];復(fù)旦大學(xué);2012年

3 李良炎;基于詞聯(lián)接的自然語(yǔ)言處理技術(shù)及其應(yīng)用研究[D];重慶大學(xué);2004年

4 李莎莎;面向搜索引擎的自然語(yǔ)言處理關(guān)鍵技術(shù)研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2011年

5 周雅倩;最大熵方法及其在自然語(yǔ)言處理中的應(yīng)用[D];復(fù)旦大學(xué);2005年

6 易勇;計(jì)算機(jī)輔助詩(shī)詞創(chuàng)作中的風(fēng)格辨析及聯(lián)語(yǔ)應(yīng)對(duì)研究[D];重慶大學(xué);2005年

7 方寧;基于認(rèn)知的文本語(yǔ)境生成和度量研究[D];上海大學(xué);2009年

8 鄭逢斌;關(guān)于計(jì)算機(jī)理解自然查詢語(yǔ)言的研究[D];西南交通大學(xué);2004年

9 杜永萍;基于模式知識(shí)庫(kù)的問(wèn)題回答關(guān)鍵技術(shù)研究[D];復(fù)旦大學(xué);2005年

10 王q,

本文編號(hào):2212064


資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2212064.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶f5067***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com