借重于人工知識庫的詞和義項的向量表示:以HowNet為例
發(fā)布時間:2017-10-31 09:33
本文關鍵詞:借重于人工知識庫的詞和義項的向量表示:以HowNet為例
更多相關文章: 詞向量 義項向量 義原向量 HowNet 神經(jīng)網(wǎng)絡語言模型
【摘要】:該文旨在以HowNet為例,探討在表示學習模型中引入人工知識庫的必要性和有效性。目前詞向量多是通過構造神經(jīng)網(wǎng)絡模型,在大規(guī)模語料庫上無監(jiān)督訓練得到,但這種框架面臨兩個問題:一是低頻詞的詞向量質量難以保證;二是多義詞的義項向量無法獲得。該文提出了融合HowNet和大規(guī)模語料庫的義原向量學習神經(jīng)網(wǎng)絡模型,并以義原向量為橋梁,自動得到義項向量及完善詞向量。初步的實驗結果表明該模型能有效提升在詞相似度和詞義消歧任務上的性能,有助于低頻詞和多義詞的處理。作者指出,借重于人工知識庫的神經(jīng)網(wǎng)絡語言模型應該成為今后一段時期自然語言處理的研究重點之一。
【作者單位】: 清華大學計算機科學與技術系清華信息科學技術國家實驗室清華大學智能技術與系統(tǒng)國家重點實驗室;首都師范大學北京市成像技術高精尖創(chuàng)新中心;
【關鍵詞】: 詞向量 義項向量 義原向量 HowNet 神經(jīng)網(wǎng)絡語言模型
【基金】:國家社會科學基金(13&ZD190) 國家自然科學基金(61133012)
【分類號】:TP391.1
【正文快照】: 1引言詞向量表示旨在學習詞的低維實數(shù)向量表示,是自然語言處理的重要任務之一。訓練得到的詞向量可直接用于計算兩個詞之間的語義相關性,同時可作為特征廣泛應用于諸多后續(xù)的自然語言處理任務中,如信息檢索、語言模型、詞義消歧、詞義組合和命名實體識別等。目前的詞向量一般
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 劉亞清;于純妍;張瑾;;改進的基于義原同現(xiàn)頻率的漢語詞義排歧方法[J];計算機工程與科學;2006年12期
2 張振幸;李金厚;;一種基于義原重合度的詞語相似度計算[J];信陽師范學院學報(自然科學版);2010年02期
3 劉亞清;張瑾;于純妍;;基于義原同現(xiàn)頻率的漢語詞義排歧系統(tǒng)[J];計算機技術與發(fā)展;2006年05期
4 袁曉峰;;《知網(wǎng)》義原相似度計算的研究[J];遼寧大學學報(自然科學版);2011年04期
5 肖志軍;馮廣麗;;基于《知網(wǎng)》義原空間的文本相似度計算[J];科學技術與工程;2013年29期
6 郭充;張仰森;;基于《知網(wǎng)》義原搭配的中文文本語義級自動查錯研究[J];計算機工程與設計;2010年17期
7 張瑾;劉亞清;于純妍;;漢語詞義排歧的另一種方法[J];小型微型計算機系統(tǒng);2006年04期
8 郭志兵;黃廣君;盧朝華;;一種改進的詞義排歧算法[J];計算機工程與應用;2010年19期
9 柳玉;賁可榮;馬U,
本文編號:1121790
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1121790.html
最近更新
教材專著