基于統(tǒng)計的云搜索中文分詞算法
發(fā)布時間:2017-08-23 00:15
本文關鍵詞:基于統(tǒng)計的云搜索中文分詞算法
【摘要】:針對當前云搜索系統(tǒng)中中文分詞僅僅采用簡單的正向匹配最大算法和逆向最大匹配算法容易產(chǎn)生歧義的問題,提出了采用平均最大分詞算法分詞,并用最小分詞偏離標準差消除歧義的方法進行云搜索系統(tǒng)的中文分詞。經(jīng)過測試,該算法明顯優(yōu)于正向最大匹配算法和逆向最大匹配算法。
【作者單位】: 深圳大學圖書館;長安大學理學院;
【關鍵詞】: 云搜索 搜索引擎 中文分詞算法
【基金】:陜西省科技攻關基金資助項目(2013k06-27)
【分類號】:TP391.3;TP391.1
【正文快照】: 隨著云計算技術(shù)的發(fā)展,基于云計算的垂直搜索也逐漸成為搜索引擎發(fā)展的一個重要方面,國內(nèi)外許多研究人員都開展了基于云計算的垂直搜索引擎研究工作,并取得了相應的研究成果,如基于阿里云的圖書館搜索系統(tǒng)[1]、分布式企業(yè)搜索引擎[2]、云平臺的水利垂直搜索引擎[3]、基于云計
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前3條
1 林樂然;陳德龍;;基于云計算的分布式企業(yè)搜索引擎研究[J];電腦知識與技術(shù);2009年33期
2 周遠超;葉楓;高依e,
本文編號:721868
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/721868.html
最近更新
教材專著