具有概念聯(lián)想功能的特定領域分詞詞典的自動構建
本文選題:語義詞典 + 未登錄詞 ; 參考:《計算機工程》2004年20期
【摘要】:提出了一種基于PAT樹型結構的高頻字串提取的改進算法,并以此用來獲得特定領域網頁中的未登錄詞集合,利用基于語義距離的概念相似度計算公式來獲得任一概念的相關概念,從而給出了用于特定領域搜索引擎的語義詞典完整的自動構建方法。將生成的語義詞典用于搜索引擎FlyingSender中。實驗結果證明新的詞典比原有的手工構建的詞典分詞效果要理想得多,而且提供了概念聯(lián)想的功能。
[Abstract]:In this paper, an improved algorithm of high frequency string extraction based on Pat tree structure is proposed. The concept similarity calculation formula based on semantic distance is used to obtain the related concepts of any concept, and a complete automatic construction method of semantic dictionary for specific search engine is presented. The generated semantic dictionary is used in the FlyingSender search engine. The experimental results show that the new dictionary is much more effective than the original dictionary constructed by hand, and provides the function of concept association.
【作者單位】: 華東理工大學計算機科學與工程系 華東理工大學計算機科學與工程系
【基金】:上海市青年科技啟明星計劃(99QD14038)
【分類號】:TP391.2
【相似文獻】
相關期刊論文 前10條
1 張小龍,姚天順;用于理解的語義詞典的構造和設計[J];中文信息學報;1987年02期
2 姚天順,馬黎環(huán);漢英機器翻譯系統(tǒng)的概念分析模型[J];中文信息學報;1988年03期
3 萬建成;可分隔動詞及其在拼音-漢字輸入中同音詞識別的應用[J];中文信息學報;1992年04期
4 陳祖舜;;信息語義學:一個新計算語義學的構想[J];計算機科學;1995年06期
5 鄭澤芝,張永奎;《現(xiàn)代漢語語義詞典》管理系統(tǒng)的設計與實現(xiàn)[J];計算機工程;2001年06期
6 侯國峰;一個自然語言理解系統(tǒng)的設計和實現(xiàn)[J];計算機應用研究;2001年02期
7 于江生 ,俞士汶;中文概念詞典的結構[J];中文信息學報;2002年04期
8 于水源,杜利民;GL理論與漢語詞意網絡[J];黑龍江大學自然科學學報;2002年04期
9 晉薇;黃河燕;夏云慶;;基于語義相似度并運用語言學知識進行雙語語句詞對齊[J];計算機科學;2002年11期
10 尹榮,鄭兆瑞,郭海儒;一種基于圖元的多級圖像檢索系統(tǒng)[J];太原理工大學學報;2004年03期
相關會議論文 前10條
1 王惠;;漢英機器翻譯中基于大型語義詞典的漢語詞義消歧[A];機器翻譯研究進展——2002年全國機器翻譯研討會論文集[C];2002年
2 王惠;俞士汶;詹衛(wèi)東;;現(xiàn)代漢語語義詞典(SKCC)的新進展[A];語言計算與基于內容的文本處理——全國第七屆計算語言學聯(lián)合學術會議論文集[C];2003年
3 王惠;李康年;;大型語義詞典的計算機輔助開發(fā)與管理[A];Advances in Computation of Oriental Languages--Proceedings of the 20th International Conference on Computer Processing of Oriental Languages[C];2003年
4 顏偉;荀恩東;;基于WordNet的英語詞語相似度計算[A];第二屆全國學生計算語言學研討會論文集[C];2004年
5 陸勇;侯漢清;;基于詞典注釋的漢語同義詞自動識別[A];NCIRCS2004第一屆全國信息檢索與內容安全學術會議論文集[C];2004年
6 邱立坤;;現(xiàn)代漢語動名語串結構關系的判定[A];第六屆漢語詞匯語義學研討會論文集[C];2005年
7 蘇新春;王惠;盧偉清;秦少康;;語言知識庫的內化與細化——完善詞義知識庫之設想[A];第六屆漢語詞匯語義學研討會論文集[C];2005年
8 周強;陳祖舜;梅立軍;;情境描述的構建方法研究[A];全國第八屆計算語言學聯(lián)合學術會議(JSCL-2005)論文集[C];2005年
9 姚愛鋼;武斌;易綿竹;;基于語義詞典的俄語語義自動分析研究[A];全國第八屆計算語言學聯(lián)合學術會議(JSCL-2005)論文集[C];2005年
10 鄒文科;孟祥武;;基于語義Web的商品語義檢索系統(tǒng)[A];2006年全國理論計算機科學學術年會論文集[C];2006年
相關碩士學位論文 前3條
1 巢文涵;基于CFM的漢語小句語義分析[D];中國人民解放軍國防科學技術大學;2002年
2 曹晶;同義詞挖掘及其在概念信息檢索系統(tǒng)中的應用研究[D];東北師范大學;2006年
3 劉恒;支持語義的圖像檢索系統(tǒng)研究與實現(xiàn)[D];上海海事大學;2006年
,本文編號:2063181
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2063181.html