天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 搜索引擎論文 >

基于統(tǒng)計的搜索引擎中文輸入糾錯技術(shù)研究.doc 全文免費在線閱讀

發(fā)布時間:2016-10-02 18:13

  本文關(guān)鍵詞:基于統(tǒng)計的搜索引擎中文輸入糾錯技術(shù)研究,,由筆耕文化傳播整理發(fā)布。


文檔介紹:
【精品】畢業(yè)論文優(yōu)秀畢業(yè)論文本科論文專業(yè)學術(shù)論文參考文獻資料計算機應用技術(shù)專業(yè)優(yōu)秀論文--基于統(tǒng)計的搜索引擎中文輸入糾錯技術(shù)研究關(guān)鍵詞:搜索引擎中文輸入糾錯 N-gram 模型統(tǒng)計語言 TF/IDF 權(quán)重分布式計算摘要:在已經(jīng)到來的 Web2.0 時代,搜索引擎在互聯(lián)網(wǎng)上扮演了越來越重要的角色,而日益增多并且成熟的互聯(lián)網(wǎng)用戶對搜索引擎的要求也越來越高,其功能也在不斷豐富和完善當中,輸入自動檢查糾錯功能就是一項非常重要的附加技術(shù),并且已經(jīng)得到了較為廣泛的應用和推廣。對于中文搜索引擎來說,輸入自動檢查糾錯功能是指,用戶在輸入關(guān)鍵詞進行搜索之后,如果搜索引擎在返回結(jié)果中計算出與此關(guān)鍵詞相似的另一形式(如詞組中出現(xiàn)同音不同字,或者某一錯別字現(xiàn)象)得到大量的搜索結(jié)果,用戶將會在搜索結(jié)果頁面看到系統(tǒng)提供的推測到的關(guān)鍵詞項。針對以上問題,首次將一種完全通過分析上下文統(tǒng)計信息的方法引入搜索引擎的輸入糾錯技術(shù)中(未見文獻報道),根據(jù)中文語言的特點,對中文語料庫建立了 N-gram 統(tǒng)計語言模型,并且對其進行了詳細的分析,確定了語言模型所必需的參數(shù),以及對其進行了優(yōu)化處理,使其更加接近真實情況下的語言。研究中引入了 TF/IDF 權(quán)重計算方法,將初步統(tǒng)計語言模型得出的糾... 內(nèi)容來自轉(zhuǎn)載請標明出處.


  本文關(guān)鍵詞:基于統(tǒng)計的搜索引擎中文輸入糾錯技術(shù)研究,由筆耕文化傳播整理發(fā)布。



本文編號:129180

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/129180.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶e657e***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com