基于遠監(jiān)督的語義知識資源擴展研究
本文關(guān)鍵詞:基于遠監(jiān)督的語義知識資源擴展研究
更多相關(guān)文章: 資源擴展 遠監(jiān)督 語義知識資源
【摘要】:語義知識資源蘊含了深刻的語言學理論,是語言學知識和語言工程的重要接口。該文以形容詞句法語義詞典為研究對象,探索對語義知識資源自動擴展的方法。該文的目標是利用大規(guī)模語料庫,擴展原有詞典的詞表及其對應的句法格式。具體方法是根據(jù)詞的句法格式將詞典的詞分類,將待擴展的新詞通過分類器映射到原有詞典的詞中,以此把詞典擴展問題轉(zhuǎn)化為多類分類問題。依據(jù)的原理是詞典詞和待擴展新詞在大規(guī)模語料中句法結(jié)構(gòu)的相似性。該文通過遠監(jiān)督的方法構(gòu)造訓練數(shù)據(jù),避免大量的人工標注。訓練過程結(jié)合了淺層機器學習方法和深度神經(jīng)網(wǎng)絡(luò),取得了有意義的成果。實驗結(jié)果顯示,深度神經(jīng)網(wǎng)絡(luò)能夠習得句法結(jié)構(gòu)信息,有效提升匹配的準確率。
【作者單位】: 北京大學中文系;北京語言大學信息科學學院;
【關(guān)鍵詞】: 資源擴展 遠監(jiān)督 語義知識資源
【基金】:教育部人文社會科學研究青年項目(16YJC740050) 中國博士后科學基金第60批面上項目(2016M600838) 國家社科基金重大招標項目(12&ZD175) 國家重點基礎(chǔ)研究計劃(973計劃)(2014CB340502)
【分類號】:H146.3;TP391.1
【正文快照】: 1引言語義知識資源是在特定的語言學理論基礎(chǔ)上,以詞型(Type)為標注對象進行語言描寫的語言工程實踐的成果,是語言學理論和自然語言處理技術(shù)結(jié)合的重要手段。相比以詞例(Token)為標注對象的語料庫標注,語義知識資源庫建設(shè)更為便捷,且對自然語料的覆蓋面更大,對系統(tǒng)的可移植性
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前4條
1 宋文杰;顧彥慧;周俊生;孫玉杰;嚴杰;曲維光;;多策略同義詞獲取方法研究[J];北京大學學報(自然科學版);2015年02期
2 袁毓林;李強;;怎樣用物性結(jié)構(gòu)知識解決“網(wǎng)球問題”?[J];中文信息學報;2014年05期
3 袁毓林;;基于生成詞庫論和論元結(jié)構(gòu)理論的語義知識體系研究[J];中文信息學報;2013年06期
4 孫霞;董樂紅;;基于監(jiān)督學習的同義關(guān)系自動抽取方法[J];西北大學學報(自然科學版);2008年01期
【共引文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 盧達威;王星友;袁毓林;;基于遠監(jiān)督的語義知識資源擴展研究[J];中文信息學報;2016年06期
2 汪昌松;靳瑋;;句法—音系接口視閾下的容納句研究[J];語言教學與研究;2016年06期
3 李曉瑛;夏光輝;李丹亞;;主題標引文獻的語義關(guān)系發(fā)現(xiàn)研究[J];現(xiàn)代圖書情報技術(shù);2016年Z1期
4 李強;袁毓林;;從生成詞庫論看名詞的詞典釋義[J];辭書研究;2016年04期
5 吉益民;;“V+目的賓語”論略[J];漢語學報;2016年03期
6 李強;;生成詞庫理論研究述評[J];外國語(上海外國語大學學報);2016年03期
7 李強;;謂詞隱含、物性角色和“NP1+的+NP2”結(jié)構(gòu)[J];語言研究;2015年04期
8 李強;袁毓林;;名詞詞義描寫和研究需要什么樣的語義學知識?[J];中文信息學報;2015年05期
9 靳瑋;喬曉東;劉耀;齊曉亞;;面向中國專利文獻的零形回指消解規(guī)則研究[J];圖書情報工作;2015年09期
10 李強;袁毓林;;服務于國際漢語教學的同義名詞辨析查詢系統(tǒng)建設(shè)[J];對外漢語研究;2014年02期
【二級參考文獻】
中國期刊全文數(shù)據(jù)庫 前9條
1 袁毓林;;基于生成詞庫論和論元結(jié)構(gòu)理論的語義知識體系研究[J];中文信息學報;2013年06期
2 袁毓林;;語義資源建設(shè)的最新趨勢和長遠目標——通過映射對比、走向統(tǒng)一聯(lián)合、實現(xiàn)自動推理[J];中文信息學報;2008年03期
3 袁毓林;;語義角色的精細等級及其在信息處理中的應用[J];中文信息學報;2007年04期
4 董樂紅;耿國華;趙清;;基于模糊推理的青銅器鑒定專家系統(tǒng)[J];西北大學學報(自然科學版);2006年02期
5 張劍;李春平;;基于WordNet概念向量空間模型的文本分類[J];計算機工程與應用;2006年04期
6 袁毓林;信息抽取的語義知識資源研究[J];中文信息學報;2002年05期
7 俞士汶,朱學鋒,王惠;《現(xiàn)代漢語語法信息詞典》的新進展[J];中文信息學報;2001年01期
8 俞士汶,,朱學鋒,王惠,張蕓蕓;現(xiàn)代漢語語法信息詞典規(guī)格說明書[J];中文信息學報;1996年02期
9 陸勇;侯漢清;;基于模式匹配的漢語同義詞自動識別[J];情報學報;2006年06期
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前6條
1 李瓊;李志;;基于語義知識的書讀前后非分句語言片段識別[J];湖北社會科學;2010年03期
2 田占偉;張慶普;劉臣;;語義知識網(wǎng)絡(luò)的結(jié)構(gòu)分析與構(gòu)建[J];情報理論與實踐;2011年10期
3 彭玉海;關(guān)于語義知識和語義操作[J];外語學刊(黑龍江大學學報);1997年04期
4 金花,劉鶴齡,楊婭玲,莫雷;語義知識神經(jīng)表征的fMRI研究:通道特異性或類別特異性?[J];心理學報;2005年02期
5 徐莉娜;;從譯者失語看翻譯教學的缺失環(huán)節(jié)[J];中國翻譯;2012年02期
6 ;[J];;年期
中國重要會議論文全文數(shù)據(jù)庫 前5條
1 宋煒;;語義知識獲取與網(wǎng)絡(luò)信息集成的分析[A];信息科學與微電子技術(shù):中國科協(xié)第三屆青年學術(shù)年會論文集[C];1998年
2 劉開瑛;由麗萍;;漢語框架語義知識庫構(gòu)建工程[A];中文信息處理前沿進展——中國中文信息學會二十五周年學術(shù)會議論文集[C];2006年
3 楊柳;何婷婷;涂新輝;;基于網(wǎng)絡(luò)百科全書的中文關(guān)聯(lián)語義知識獲取[A];第五屆全國青年計算語言學研討會論文集[C];2010年
4 由麗萍;劉燾;劉開瑛;;信息處理用中文框架語義知識描述方法研究[A];民族語言文字信息技術(shù)研究——第十一屆全國民族語言文字信息學術(shù)研討會論文集[C];2007年
5 郝曉燕;劉偉;李茹;劉開瑛;;漢語框架語義知識庫及軟件描述體系[A];內(nèi)容計算的研究與應用前沿——第九屆全國計算語言學學術(shù)會議論文集[C];2007年
中國博士學位論文全文數(shù)據(jù)庫 前1條
1 郭鴻志;多源語義知識庫融合方法研究[D];哈爾濱工業(yè)大學;2011年
中國碩士學位論文全文數(shù)據(jù)庫 前5條
1 李佳南;館藏資源語義知識庫及服務系統(tǒng)平臺的構(gòu)建研究[D];南京理工大學;2015年
2 崔磊;交互式開放語義知識庫構(gòu)建方法研究[D];哈爾濱工業(yè)大學;2010年
3 徐忠明;基于二元組合文法的語義知識庫構(gòu)建[D];山東大學;2008年
4 馬德華;基于語義知識的監(jiān)控執(zhí)行模式設(shè)計與實現(xiàn)[D];吉林大學;2013年
5 劉燾;漢語框架語義知識庫信息組織與表示方法研究[D];山西大學;2007年
本文關(guān)鍵詞:基于遠監(jiān)督的語義知識資源擴展研究
更多相關(guān)文章: 資源擴展 遠監(jiān)督 語義知識資源
本文編號:514057
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/514057.html