唐宋詩(shī)中詞匯語(yǔ)義相似度的統(tǒng)計(jì)分析及應(yīng)用
本文選題:詞義相似度 + 詞義聯(lián)想。 參考:《中文信息學(xué)報(bào)》2002年04期
【摘要】:基于上下文的詞匯向量空間模型可以用來(lái)近似地描述詞匯的語(yǔ)義。在此基礎(chǔ)上定義的詞匯相似關(guān)系或聚類關(guān)系可以應(yīng)用于詞典編纂、智能搜索引擎的開(kāi)發(fā)等許多領(lǐng)域。本研究 基于 6 40萬(wàn)字的唐宋詩(shī)語(yǔ)料。在進(jìn)行多字詞計(jì)算機(jī)輔助提取的基礎(chǔ)上 ,定義了相應(yīng)的詞匯語(yǔ)義的統(tǒng)計(jì)表達(dá)。建立了詞匯相似關(guān)系的語(yǔ)義網(wǎng)絡(luò)。開(kāi)發(fā)了具有詞義聯(lián)想功能的面向概念的唐宋詩(shī)搜索引擎。實(shí)驗(yàn)表明 ,達(dá)到了接近實(shí)用的水平
[Abstract]:Context-based lexical vector space model can be used to describe lexical semantics approximately. On this basis, the lexical similarity relation or clustering relation can be used in many fields such as dictionary compilation, intelligent search engine development and so on. This study is based on 6 400000 characters of Tang and Song poetry corpus. Based on the computer-aided extraction of multi-words, the corresponding statistical expressions of lexical semantics are defined. The semantic network of lexical similarity relation is established. The concept-oriented search engine of Tang and Song poetry with the function of word meaning association is developed. The experimental results show that it is close to practical level.
【基金】:國(guó)家社會(huì)科學(xué)基金項(xiàng)目 (98BYY0 2 2 ) 北京大學(xué) 985項(xiàng)目
【分類號(hào)】:TP391.1
【參考文獻(xiàn)】
相關(guān)期刊論文 前2條
1 胡俊峰,俞士汶;唐宋詩(shī)之計(jì)算機(jī)輔助深層研究[J];北京大學(xué)學(xué)報(bào)(自然科學(xué)版);2001年05期
2 黃昌寧,李涓子;詞義排歧的一種語(yǔ)言模型[J];語(yǔ)言文字應(yīng)用;2000年03期
【共引文獻(xiàn)】
相關(guān)期刊論文 前10條
1 毛建軍;;古籍?dāng)?shù)字化研究的回顧與思考[J];國(guó)家圖書館學(xué)刊;2007年03期
2 盧志茂;劉挺;李生;;統(tǒng)計(jì)詞義消歧的研究進(jìn)展[J];電子學(xué)報(bào);2006年02期
3 李朝虹,陸建湖;現(xiàn)代漢語(yǔ)自動(dòng)分析研究現(xiàn)狀綜述[J];廣西教育學(xué)院學(xué)報(bào);2003年01期
4 王川;張小紅;韓采華;;古漢語(yǔ)句子切分與句讀標(biāo)記方法研究[J];河南大學(xué)學(xué)報(bào)(自然科學(xué)版);2009年05期
5 范海虹;劉大勇;;論計(jì)算語(yǔ)言學(xué)的學(xué)科交叉性[J];廊坊師范學(xué)院學(xué)報(bào)(自然科學(xué)版);2012年03期
6 何婷婷;基于HNC理論的一種詞匯歧義消解規(guī)則[J];華中師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2002年01期
7 雒自清;幾種漢語(yǔ)移位現(xiàn)象的HNC研究[J];晉東南師范?茖W(xué)校學(xué)報(bào);2004年04期
8 王美艷,趙偉;基于唐詩(shī)語(yǔ)料庫(kù)“詞”的提取及深入研究[J];長(zhǎng)春工業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版);2005年03期
9 王紅玲;呂強(qiáng);徐瑞;;中文語(yǔ)義相關(guān)度計(jì)算模型研究[J];計(jì)算機(jī)工程與應(yīng)用;2009年07期
10 陳麗江;陳小荷;;VN結(jié)構(gòu)識(shí)別的一種概率分布模型[J];計(jì)算機(jī)工程與應(yīng)用;2009年17期
相關(guān)會(huì)議論文 前6條
1 俞士汶;;計(jì)算語(yǔ)言學(xué)的應(yīng)用研究與基礎(chǔ)研究[A];輝煌二十年——中國(guó)中文信息學(xué)會(huì)二十周年學(xué)術(shù)會(huì)議論文集[C];2001年
2 唐興全;;現(xiàn)代漢語(yǔ)復(fù)雜句蛻塊研究[A];語(yǔ)言計(jì)算與基于內(nèi)容的文本處理——全國(guó)第七屆計(jì)算語(yǔ)言學(xué)聯(lián)合學(xué)術(shù)會(huì)議論文集[C];2003年
3 章成志;;詞語(yǔ)的語(yǔ)義相似度計(jì)算及其應(yīng)用研究[A];NCIRCS2004第一屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2004年
4 周強(qiáng);趙穎澤;;漢語(yǔ)功能塊自動(dòng)分析[A];內(nèi)容計(jì)算的研究與應(yīng)用前沿——第九屆全國(guó)計(jì)算語(yǔ)言學(xué)學(xué)術(shù)會(huì)議論文集[C];2007年
5 王紅玲;呂強(qiáng);徐瑞;;一種基于知網(wǎng)的中文語(yǔ)義相關(guān)度計(jì)算模型[A];第三屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2007年
6 李國(guó)臣;王瑞波;李濟(jì)洪;;基于基本塊的漢語(yǔ)功能塊自動(dòng)標(biāo)注[A];第四屆全國(guó)學(xué)生計(jì)算語(yǔ)言學(xué)研討會(huì)會(huì)議論文集[C];2008年
相關(guān)博士學(xué)位論文 前10條
1 何因;排序?qū)W習(xí)中基于直接優(yōu)化信息檢索評(píng)價(jià)準(zhǔn)則算法的理論分析[D];中國(guó)科學(xué)技術(shù)大學(xué);2010年
2 葉黛瑩;從閱讀到創(chuàng)作的詩(shī)學(xué)歷程[D];武漢大學(xué);2011年
3 范冬梅;基于統(tǒng)計(jì)學(xué)習(xí)的詞義識(shí)別方法研究[D];哈爾濱工程大學(xué);2011年
4 朱鎖玲;命名實(shí)體識(shí)別在方志內(nèi)容挖掘中的應(yīng)用研究[D];南京農(nóng)業(yè)大學(xué);2011年
5 何婷婷;語(yǔ)料庫(kù)研究[D];華中師范大學(xué);2003年
6 陳清才;基于粗集的漢語(yǔ)建模及其應(yīng)用研究[D];哈爾濱工業(yè)大學(xué);2003年
7 達(dá)胡白乙拉;蒙古語(yǔ)基本動(dòng)詞短語(yǔ)自動(dòng)識(shí)別研究[D];內(nèi)蒙古大學(xué);2005年
8 曹玲;農(nóng)業(yè)古籍?dāng)?shù)字化整理研究[D];南京農(nóng)業(yè)大學(xué);2006年
9 楊震;文本分類和聚類中若干問(wèn)題的研究[D];北京郵電大學(xué);2007年
10 常娥;古籍智能處理技術(shù)研究[D];南京農(nóng)業(yè)大學(xué);2007年
相關(guān)碩士學(xué)位論文 前10條
1 程國(guó)斌;基于指示詞語(yǔ)義擴(kuò)展的詞義識(shí)別方法的研究[D];哈爾濱工程大學(xué);2010年
2 鄧賓;中文詞義消岐研究[D];昆明理工大學(xué);2009年
3 馬東;基于Nutch搜索引擎的中文分詞算法研究與實(shí)現(xiàn)[D];內(nèi)蒙古農(nóng)業(yè)大學(xué);2011年
4 唐興全;現(xiàn)代漢語(yǔ)復(fù)雜句蛻塊研究[D];北京語(yǔ)言文化大學(xué);2002年
5 章成志;基于文本層次模型的Web概念挖掘研究[D];南京農(nóng)業(yè)大學(xué);2002年
6 李盛;面向真實(shí)文本的漢語(yǔ)詞義排歧系統(tǒng)[D];山西大學(xué);2003年
7 王源媛;中文未登錄名詞短語(yǔ)的識(shí)別方法研究[D];重慶大學(xué);2004年
8 陳浩;基于二階上下文的無(wú)導(dǎo)詞義消歧研究[D];華中師范大學(xué);2005年
9 許超;漢英雙語(yǔ)網(wǎng)頁(yè)資源中相同事件文本對(duì)的提取[D];南京師范大學(xué);2005年
10 羅慧慧;基于語(yǔ)義神經(jīng)網(wǎng)絡(luò)的深層語(yǔ)義的計(jì)算[D];湘潭大學(xué);2005年
【二級(jí)參考文獻(xiàn)】
相關(guān)期刊論文 前1條
1 穗志方,俞士汶,羅鳳珠;宋代名家詩(shī)自動(dòng)注音研究及系統(tǒng)實(shí)現(xiàn)[J];中文信息學(xué)報(bào);1998年02期
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 張偉利;;探求唐宋詩(shī)內(nèi)在嬗變軌跡——《唐宋詩(shī)宏觀結(jié)構(gòu)論》讀后[J];中國(guó)出版;2007年03期
2 韓駿偉;禪思詩(shī)語(yǔ)——讀張晶《禪與唐宋詩(shī)學(xué)》[J];中國(guó)出版;2004年04期
3 熊益沙;;唐宋詩(shī)人對(duì)理想人居環(huán)境的探索[J];湖南大眾傳媒職業(yè)技術(shù)學(xué)院學(xué)報(bào);2010年01期
4 蔡科;史曉東;陳毅東;黃哲煌;;基于層次聚類的中文詞義歸納(英文)[J];心智與計(jì)算;2010年03期
5 阮堂明;詩(shī)學(xué)本位與當(dāng)代意識(shí)——讀陶文鵬《唐宋詩(shī)美學(xué)與藝術(shù)論》[J];蘇州大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版);2004年02期
6 張德建;讀陶文鵬《唐宋詩(shī)美學(xué)與藝術(shù)論》有感[J];中國(guó)文化研究;2004年02期
7 索紅光;劉玉樹;曹淑英;;一種基于詞匯鏈的關(guān)鍵詞抽取方法[J];中文信息學(xué)報(bào);2006年06期
8 宋巍;秦兵;郎君;劉挺;;句法與詞義相結(jié)合的中文代詞消解[J];中文信息學(xué)報(bào);2008年06期
9 游維;周昌樂(lè);;基于統(tǒng)計(jì)的漢語(yǔ)隱喻生成模型及其系統(tǒng)實(shí)現(xiàn)[J];心智與計(jì)算;2007年01期
10 毛翰;;“一切好詩(shī)到唐已被做完”了嗎?[J];中國(guó)圖書評(píng)論;2010年03期
相關(guān)會(huì)議論文 前10條
1 郭鵬;;“以文為詩(shī)”辨——關(guān)于唐宋詩(shī)變中一個(gè)文學(xué)觀念的檢討[A];中國(guó)語(yǔ)言文學(xué)資料信息(1999.2)[C];1999年
2 敬永諒;;《送友人》別考[A];中國(guó)李白研究(2005年集)——中國(guó)李白研究會(huì)第十一次學(xué)術(shù)研討會(huì)論文集[C];2005年
3 胡曼妮;;英語(yǔ)詞義聯(lián)想與英語(yǔ)學(xué)習(xí)詞典編纂[A];中國(guó)辭書學(xué)會(huì)雙語(yǔ)詞典專業(yè)委員會(huì)第七屆年會(huì)論文集[C];2007年
4 吉靈娟;;論文化翻譯與文學(xué)翻譯的意境傳達(dá)[A];福建省首屆外事翻譯研討會(huì)論文集[C];2007年
5 尹楚彬;;《李白全集校注匯釋集評(píng)》求疵[A];中國(guó)李白研究(2000年集)[C];2000年
6 房日晰;;論李白詩(shī)的飄逸風(fēng)格及其成因[A];李白學(xué)刊(第一輯)——紀(jì)念李白逝世1225周年[C];1987年
7 崔仲平;;《元日》屠蘇考[A];中華中醫(yī)藥學(xué)會(huì)醫(yī)古文分會(huì)成立30周年暨第二十次學(xué)術(shù)交流會(huì)論文集[C];2011年
8 楊明;;讀李瑣記[A];中國(guó)李白研究(一九九零年集·下)[C];1990年
9 康懷遠(yuǎn);;論李白詩(shī)歌的法度(中)[A];中國(guó)李白研究(1995-1996年集)[C];1995年
10 姜光斗;;論李白對(duì)韓愈奇險(xiǎn)詩(shī)風(fēng)的影響[A];中國(guó)李白研究(一九九零年集·上)——中國(guó)李白學(xué)會(huì)第二屆年會(huì)紀(jì)事[C];1989年
相關(guān)重要報(bào)紙文章 前10條
1 周月亮;恢復(fù)直覺(jué)的“活法”[N];人民政協(xié)報(bào);2003年
2 郭鋒;唐宋詩(shī)學(xué)對(duì)詞學(xué)的影響[N];光明日?qǐng)?bào);2007年
3 白振奎;詩(shī)筆禪心[N];人民政協(xié)報(bào);2003年
4 金丹霞;歷經(jīng)滄桑 重見(jiàn)天日[N];溫州日?qǐng)?bào);2006年
5 董耀章;古今人文精神的對(duì)接[N];太原日?qǐng)?bào);2010年
6 杜寒風(fēng);禪與詩(shī)學(xué)[N];光明日?qǐng)?bào);2004年
7 張劍;感悟、學(xué)理與情采的結(jié)合[N];中華讀書報(bào);2003年
8 魏運(yùn)亨;正月十五“鬧”元宵,“全民狂歡”兩千年[N];新華每日電訊;2008年
9 程大利;書印相合 雅正委婉[N];中國(guó)藝術(shù)報(bào);2008年
10 李金玉;略談?wù)撛?shī)唱和[N];山西政協(xié)報(bào);2009年
相關(guān)博士學(xué)位論文 前9條
1 張仲謀;清代宋詩(shī)師承論[D];蘇州大學(xué);1997年
2 周薇;陳衍詩(shī)學(xué)研究[D];華東師范大學(xué);2006年
3 侯長(zhǎng)生;同光體派的宋詩(shī)學(xué)[D];復(fù)旦大學(xué);2007年
4 張毅;陸游詩(shī)傳播、閱讀專題研究[D];復(fù)旦大學(xué);2008年
5 韓勝;清代唐詩(shī)選本研究[D];南開(kāi)大學(xué);2005年
6 劉磊;朱彝尊詩(shī)學(xué)理論研究[D];遼寧大學(xué);2007年
7 鄭永曉;江西詩(shī)派研究史[D];中國(guó)社會(huì)科學(xué)院研究生院;2003年
8 陳曉紅;方東樹詩(shī)學(xué)研究[D];復(fù)旦大學(xué);2010年
9 史宏云;古代花鳥畫題畫詩(shī)的意象研究[D];山西大學(xué);2011年
相關(guān)碩士學(xué)位論文 前10條
1 胡玉平;唐宋劍門詩(shī)文化研究[D];西南大學(xué);2011年
2 李秋霞;袁枚與唐宋詩(shī)關(guān)系研究[D];江西師范大學(xué);2009年
3 宋巍;基于句法特征的代詞消解方法研究[D];哈爾濱工業(yè)大學(xué);2008年
4 李迪;基于文本聚類和語(yǔ)料庫(kù)的信譽(yù)維度發(fā)現(xiàn)研究[D];華中科技大學(xué);2010年
5 李囡囡;從《瀛奎律髓》看方回論宋詩(shī)[D];東北師范大學(xué);2008年
6 胡爽;朝鮮詩(shī)家對(duì)明詩(shī)的批評(píng)[D];延邊大學(xué);2010年
7 岳永;錢謙益宗唐禰宋的詩(shī)學(xué)思想[D];新疆師范大學(xué);2006年
8 華德勇;唐宋山水詩(shī)境界與山水畫意境比較研究[D];西北民族大學(xué);2011年
9 張?jiān)诮?論杜甫和韓愈詩(shī)歌的“警策”[D];廣西師范大學(xué);2008年
10 王品;基于加權(quán)語(yǔ)法依存度的查詢模型研究[D];河南科技大學(xué);2011年
,本文編號(hào):1800336
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1800336.html