先秦文獻《孟子》自動分詞方法研究
本文關(guān)鍵詞:先秦文獻《孟子》自動分詞方法研究
更多相關(guān)文章: 先秦文獻 《孟子》 自動分詞 條件隨機場 注疏文獻
【摘要】:自動分詞是中文信息處理重要的基礎(chǔ)課題。文章主要探討了先秦文獻《孟子》基于條件隨機場統(tǒng)計模型的自動分詞方法和利用相關(guān)注疏文獻的自動分詞方法等自動分詞技術(shù)。自動分詞實驗結(jié)果表明,這兩種分詞方法效果顯著,詞語F值和小句F值均達到了較高的水平。在用不同的方法對《孟子》進行自動分詞時,在詞語F值的統(tǒng)計指標(biāo)外,首次嘗試引入了小句F值這一統(tǒng)計指標(biāo)。
【作者單位】: 南京師范大學(xué)國際文化教育學(xué)院;南京師范大學(xué)文學(xué)院;
【關(guān)鍵詞】: 先秦文獻 《孟子》 自動分詞 條件隨機場 注疏文獻
【基金】:江蘇省教育廳高校哲學(xué)社會科學(xué)基金項目(編號:2011SJB740010) 教育部人文社會科學(xué)研究項目(編號:12YJCZH121) 江蘇高校重點研究基地重大項目(編號:2010JDXM023) “江蘇高校優(yōu)勢學(xué)科建設(shè)工程資助項目”資助
【分類號】:H141
【正文快照】: 自動分詞作為中文信息處理的基礎(chǔ)課題之一,在近二十年來取得了長足進步,多個成熟的自動分詞系統(tǒng)被設(shè)計和使用[1]。實際上,一個較為成熟的自動分詞系統(tǒng)既可以為繼續(xù)深入研究語言提供基礎(chǔ)和數(shù)據(jù)支持,也是構(gòu)建句法分析、機器翻譯、文獻檢索等復(fù)雜系統(tǒng)的必要前提。從這層意義上來
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前5條
1 石民;李斌;陳小荷;;基于CRF的先秦漢語分詞標(biāo)注一體化研究[J];中文信息學(xué)報;2010年02期
2 徐潤華;陳小荷;;一種利用注疏的《左傳》分詞新方法[J];中文信息學(xué)報;2012年02期
3 邱冰;皇甫娟;;基于中文信息處理的古代漢語分詞研究[J];微計算機信息;2008年24期
4 宗成慶;曹右琦;俞士汶;;中文信息處理60年[J];語言文字應(yīng)用;2009年04期
5 沈達陽,孫茂松,黃昌寧;基于統(tǒng)計的漢語分詞模型及實現(xiàn)方法[J];中文信息;1998年Z1期
【共引文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 葛宇;梁靜;陳曉敏;;搜索引擎系統(tǒng)中熱點問題的探討[J];成都電子機械高等?茖W(xué)校學(xué)報;2009年04期
2 赫琳;張榴琳;;副詞“才”的語義指向及其計算機識別研究[J];長江學(xué)術(shù);2012年01期
3 徐紫云;徐雪松;;從自動分詞角度看先秦與現(xiàn)代漢語詞匯區(qū)別[J];華東交通大學(xué)學(xué)報;2009年06期
4 陳其暉,應(yīng)志偉,柴佩琪;基于歧義二叉樹的漢語分詞方法[J];計算機輔助工程;1999年04期
5 曹倩,丁艷,王超,潘金貴;漢語自動分詞研究及其在信息檢索中的應(yīng)用[J];計算機應(yīng)用研究;2004年05期
6 石民;李斌;陳小荷;;基于CRF的先秦漢語分詞標(biāo)注一體化研究[J];中文信息學(xué)報;2010年02期
7 陳順強;;彝文自動分詞技術(shù)研究[J];中文信息學(xué)報;2011年03期
8 徐潤華;陳小荷;;一種利用注疏的《左傳》分詞新方法[J];中文信息學(xué)報;2012年02期
9 張穎杰;李斌;陳家駿;陳小荷;;基于詞典信息的先秦漢語全文詞義標(biāo)注方法研究[J];中文信息學(xué)報;2012年03期
10 彭煒明;宋繼華;王寧;康明吉;;漢語傳統(tǒng)語法及其在中文信息處理中的應(yīng)用展望[J];中文信息學(xué)報;2012年04期
中國重要會議論文全文數(shù)據(jù)庫 前4條
1 徐潤華;陳小荷;;一種利用注疏的《左傳》分詞新方法[A];中國計算語言學(xué)研究前沿進展(2009-2011)[C];2011年
2 張穎杰;李斌;陳家駿;陳小荷;;基于詞典的半指導(dǎo)學(xué)習(xí)古漢語全文詞義標(biāo)注[A];中國計算語言學(xué)研究前沿進展(2009-2011)[C];2011年
3 石民;陳小荷;于麗麗;李斌;;基于CRF的古漢語分詞標(biāo)注一體化研究[A];中國計算機語言學(xué)研究前沿進展(2007-2009)[C];2009年
4 康生巧;白宇;韓亞冬;蔡東風(fēng);;基于句子相似的古今句子檢索[A];第六屆全國信息檢索學(xué)術(shù)會議論文集[C];2010年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前3條
1 盧建平;基于拓撲學(xué)和統(tǒng)計學(xué)的無字庫漢字智能造字研究[D];華南理工大學(xué);2010年
2 舒江波;面向中文信息處理的復(fù)句關(guān)系詞自動標(biāo)識研究[D];華中師范大學(xué);2011年
3 王邁;語言形式化原理[D];上海外國語大學(xué);2011年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 柴艷麗;復(fù)音同義詞檢索與分析系統(tǒng)的設(shè)計與研究[D];廣西民族大學(xué);2010年
2 郭劍;語義檢索在出版社網(wǎng)站中的應(yīng)用研究[D];北京印刷學(xué)院;2010年
3 戴霖;網(wǎng)絡(luò)輿情信息挖掘關(guān)鍵技術(shù)研究與應(yīng)用[D];浙江工商大學(xué);2011年
4 李長進;基于中文帶權(quán)關(guān)鍵詞樹的受限領(lǐng)域問答系統(tǒng)研究[D];山東經(jīng)濟學(xué)院;2011年
5 劉冬雪;搜索引擎檢索結(jié)果聚類系統(tǒng)的研究與實現(xiàn)[D];北京郵電大學(xué);2011年
6 李海光;基于位置和語義特征的中文命名實體關(guān)系抽取研究[D];合肥工業(yè)大學(xué);2011年
7 蘇燕;現(xiàn)代漢語標(biāo)題結(jié)構(gòu)類型的計算機自動分析[D];廣西民族大學(xué);2011年
8 陳利東;寧波市數(shù)字圖書館若干關(guān)鍵技術(shù)的研究與應(yīng)用[D];浙江工業(yè)大學(xué);2010年
9 杜爾斌;基于改進KNN的文本分類算法的設(shè)計與實現(xiàn)[D];上海交通大學(xué);2010年
10 康生巧;中醫(yī)藥知識檢索系統(tǒng)的研究與實現(xiàn)[D];沈陽航空航天大學(xué);2011年
【二級參考文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 俞士汶;;語言隨計算齊飛——特邀編審的話[J];當(dāng)代語言學(xué);2009年02期
2 尉遲治平;計算機技術(shù)和漢語史研究[J];古漢語研究;2000年03期
3 陳肇雄;SC文法功能體系[J];計算機學(xué)報;1992年11期
4 何克抗,徐輝,孫波;書面漢語自動分詞專家系統(tǒng)設(shè)計原理[J];中文信息學(xué)報;1991年02期
5 常娥;侯漢清;曹玲;;古籍自動校勘的研究和實現(xiàn)[J];中文信息學(xué)報;2007年02期
6 俞士汶;;建設(shè)綜合型語言知識庫的理念與成果的價值[J];中文信息學(xué)報;2007年06期
7 石民;李斌;陳小荷;;基于CRF的先秦漢語分詞標(biāo)注一體化研究[J];中文信息學(xué)報;2010年02期
8 肖磊;陳小荷;;古籍版本異文的自動發(fā)現(xiàn)[J];中文信息學(xué)報;2010年05期
9 劉挺,吳巖,王開鑄;串頻統(tǒng)計和詞形匹配相結(jié)合的漢語自動分詞系統(tǒng)[J];中文信息學(xué)報;1998年01期
10 宋彥;蔡東風(fēng);張桂平;趙海;;一種基于字詞聯(lián)合解碼的中文分詞方法[J];軟件學(xué)報;2009年09期
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 宋永澤;《孟子》代詞綜考[J];山西師大學(xué)報(社會科學(xué)版);1998年02期
2 路飛飛;《孟子》假設(shè)復(fù)句初探[J];中北大學(xué)學(xué)報(社會科學(xué)版);2005年01期
3 孫尊章;徐凌;梁任芝;;《論語》《孟子》時間副詞比較研究[J];重慶職業(yè)技術(shù)學(xué)院學(xué)報;2007年02期
4 劉春娟;;《孟子》中的“焉”[J];安徽文學(xué)(下半月);2009年12期
5 熊浩莉;《孟子》詞句類比喻論析[J];重慶師范大學(xué)學(xué)報(哲學(xué)社會科學(xué)版);2005年04期
6 白雁南;;《世說新語》語氣副詞繼承中的發(fā)展[J];語文學(xué)刊;2007年09期
7 韓慧鴿;;《顏氏家訓(xùn)》語氣副詞繼承中的發(fā)展[J];現(xiàn)代語文(語言研究版);2010年05期
8 張琳琳;;淺析《孟子》中狀語的語義指向——從語義平面研究歸納《孟子》狀中結(jié)構(gòu)中狀語的語義指向規(guī)律[J];黔南民族師范學(xué)院學(xué)報;2010年02期
9 敏春芳;《孟子》標(biāo)注獻疑——《古代漢語》教學(xué)札記[J];絲綢之路;2004年S2期
10 王靜靜;;《孟子》否定副詞研究[J];襄樊職業(yè)技術(shù)學(xué)院學(xué)報;2009年06期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 徐艷華;;面向自動分詞的三音節(jié)新詞語構(gòu)詞法研究[A];中國計算語言學(xué)研究前沿進展(2009-2011)[C];2011年
2 李小明;王亞莉;易立夫;楊靜;孫金城;;自動分詞中的單字虛詞處理[A];新世紀(jì)的現(xiàn)代語音學(xué)——第五屆全國現(xiàn)代語音學(xué)學(xué)術(shù)會議論文集[C];2001年
3 高璐;陳琪;李永宏;于洪志;;藏語語音合成中本文分析的若干問題研究[A];第九屆中國語音學(xué)學(xué)術(shù)會議論文集[C];2010年
4 鄭澤之;;中文自動分詞的一些問題[A];內(nèi)容計算的研究與應(yīng)用前沿——第九屆全國計算語言學(xué)學(xué)術(shù)會議論文集[C];2007年
5 錢揖麗;張虎;;漢語分詞及詞性標(biāo)注自動校驗方法研究[A];第一屆學(xué)生計算語言學(xué)研討會論文集[C];2002年
6 鄭家恒;李文花;;新詞語自動識別方法研究[A];自然語言理解與機器翻譯——全國第六屆計算語言學(xué)聯(lián)合學(xué)術(shù)會議論文集[C];2001年
7 侯敏;;漢語自動分析中的若干問題與對策[A];自然語言理解與機器翻譯——全國第六屆計算語言學(xué)聯(lián)合學(xué)術(shù)會議論文集[C];2001年
8 吾守爾·斯拉木;;前言[A];少數(shù)民族青年自然語言處理技術(shù)研究與進展——第三屆全國少數(shù)民族青年自然語言信息處理、第二屆全國多語言知識庫建設(shè)聯(lián)合學(xué)術(shù)研討會論文集[C];2010年
9 陳玉忠;李保利;俞士汶;蘭措吉;;基于格助詞和接續(xù)特征的藏文自動分詞方案[A];第一屆學(xué)生計算語言學(xué)研討會論文集[C];2002年
10 羅江文;;由古文字談儒家忠孝觀[A];孔學(xué)研究(第五輯)——云南孔子學(xué)術(shù)研究會第五次學(xué)術(shù)研討會暨海峽兩岸第三次孔學(xué)研討會論文集[C];1998年
中國重要報紙全文數(shù)據(jù)庫 前10條
1 顧農(nóng);《孟子》里的一處標(biāo)點[N];中華讀書報;2009年
2 王們;說“巨擘”[N];語言文字周報;2011年
3 教育部語信司;語言資源監(jiān)測與服務(wù)論壇舉行[N];語言文字周報;2010年
4 心言;文字的刪繁就簡[N];楚雄日報(漢);2005年
5 賈作林;談?wù)劮窖缘谋Wo問題[N];學(xué)習(xí)時報;2008年
6 教育部語信司;國家語言資源監(jiān)測與研究中心召開2007數(shù)據(jù)發(fā)布專題研討會[N];語言文字周報;2008年
7 于亭;現(xiàn)代語言學(xué)形態(tài)視野中的甲骨刻辭語法學(xué)研究[N];中華讀書報;2004年
8 仁樂水;搜羅全備的古漢語通假字工具書[N];中華讀書報;2007年
9 南京大學(xué)中國思想家研究中心 許蘇民;漢語不如德語富于思辨性嗎[N];光明日報;2009年
10 學(xué)者 王立群;漢字要穩(wěn)定,不要折騰[N];中華讀書報;2009年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前6條
1 周文德;《孟子》單音節(jié)實詞同義詞研究[D];四川大學(xué);2002年
2 馮敏萱;論漢英平行語料的平行處理[D];南京師范大學(xué);2006年
3 焦毓梅;《十誦律》常用動作語義場詞匯研究[D];四川大學(xué);2007年
4 龍丹;魏晉核心詞研究[D];華中科技大學(xué);2008年
5 朱湘云;《梁書》詞語研究[D];廈門大學(xué);2008年
6 施真珍;《后漢書》核心詞研究[D];華中科技大學(xué);2009年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 劉化平;《孟子》中的排比研究[D];湖北師范學(xué)院;2013年
2 陸從蘭;出土先秦文獻中的“也”“只”及相關(guān)字研究[D];安徽大學(xué);2011年
3 孔亞飛;《孟子》修辭研究[D];曲阜師范大學(xué);2011年
4 張琳娜;順應(yīng)—關(guān)聯(lián)模式下《孟子》中的隱喻構(gòu)建與理解[D];廣西師范大學(xué);2011年
5 李海燕;評價理論視角下的《孟子》話語分析[D];曲阜師范大學(xué);2012年
6 雷淑娟;《孟子》類比[D];黑龍江大學(xué);2001年
7 王晶晶;《孟子》的介詞“以”[D];遼寧師范大學(xué);2010年
8 普布旦增;藏文自動分詞技術(shù)方法研究[D];西藏大學(xué);2010年
9 于飛;《論語》《孟子》述賓結(jié)構(gòu)語義關(guān)系綜合考察[D];黑龍江大學(xué);2013年
10 郭萍;《孟子》復(fù)音詞研究[D];廈門大學(xué);2002年
,本文編號:933190
本文鏈接:http://sikaile.net/wenyilunwen/hanyulw/933190.html