天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

面向音樂(lè)領(lǐng)域的信息抽取技術(shù)研究

發(fā)布時(shí)間:2021-11-07 01:21
  近年來(lái),網(wǎng)絡(luò)上音樂(lè)數(shù)量不斷增加,相應(yīng)的音樂(lè)信息也飛速增長(zhǎng),人們對(duì)于快速準(zhǔn)確的獲取音樂(lè)信息的需求越來(lái)越迫切。因此,面向音樂(lè)領(lǐng)域的信息抽取具有一定研究意義,其主要研究?jī)?nèi)容是從自然語(yǔ)言文本描述的音樂(lè)信息中進(jìn)行命名實(shí)體識(shí)別和關(guān)系抽取。音樂(lè)領(lǐng)域的信息抽取是音樂(lè)知識(shí)圖譜自動(dòng)構(gòu)建的首要步驟,可廣泛應(yīng)用于音樂(lè)領(lǐng)域的信息檢索、推薦系統(tǒng)、問(wèn)答系統(tǒng)和對(duì)話系統(tǒng)等研究。本文首先定義了需要抽取的音樂(lè)實(shí)體類型和關(guān)系類別,構(gòu)建了音樂(lè)領(lǐng)域的標(biāo)注語(yǔ)料,然后在此基礎(chǔ)上,對(duì)音樂(lè)實(shí)體識(shí)別和關(guān)系抽取相關(guān)技術(shù)進(jìn)行了深入研究。針對(duì)音樂(lè)領(lǐng)域的命名實(shí)體識(shí)別任務(wù),本文首先設(shè)計(jì)實(shí)現(xiàn)了基于字符特征的BLSTM-CRF模型作為基準(zhǔn),然后分別采用三種預(yù)訓(xùn)練的字符向量改進(jìn)基準(zhǔn)模型的嵌入層:1.使用Word2vec模型訓(xùn)練靜態(tài)字向量2.使用Flair框架的雙向循環(huán)神經(jīng)網(wǎng)絡(luò)語(yǔ)言模型訓(xùn)練動(dòng)態(tài)字向量3.使用Google官方提供的中文動(dòng)態(tài)字向量BERT-Base-Chinese前兩種字向量均由本文使用對(duì)應(yīng)模型在音樂(lè)領(lǐng)域的未標(biāo)注語(yǔ)料上訓(xùn)練得到,第三種字向量為Google使用BERT模型訓(xùn)練的中文字向量。實(shí)驗(yàn)結(jié)果表明,三種改進(jìn)后的模型相比基準(zhǔn)模型的識(shí)別效果在宏平...

【文章來(lái)源】: 華南理工大學(xué)廣東省 211工程院校 985工程院校 教育部直屬院校

【文章頁(yè)數(shù)】:77 頁(yè)

【文章目錄】:
摘要
Abstract
第一章 緒論
    1.1 研究背景與意義
    1.2 國(guó)內(nèi)外相關(guān)研究現(xiàn)狀
        1.2.1 實(shí)體識(shí)別
        1.2.2 關(guān)系抽取
        1.2.3 實(shí)體關(guān)系聯(lián)合抽取
        1.2.4 音樂(lè)領(lǐng)域的信息抽取
    1.3 研究?jī)?nèi)容
    1.4 論文的組織結(jié)構(gòu)
第二章 相關(guān)理論和技術(shù)
    2.1 詞向量
        2.1.1 語(yǔ)言模型
        2.1.2 靜態(tài)詞向量
        2.1.3 動(dòng)態(tài)詞向量
    2.2 條件隨機(jī)場(chǎng)
    2.3 循環(huán)神經(jīng)網(wǎng)絡(luò)
        2.3.1 RNN
        2.3.2 長(zhǎng)短時(shí)記憶單元
    2.4 注意力機(jī)制
        2.4.1 基本的注意力機(jī)制
        2.4.2 自注意力機(jī)制
        2.4.3 多頭注意力機(jī)制
    2.5 本章小結(jié)
第三章 語(yǔ)料說(shuō)明
    3.1 語(yǔ)料來(lái)源
    3.2 實(shí)體識(shí)別數(shù)據(jù)集說(shuō)明
        3.2.1 實(shí)體類型及數(shù)據(jù)集分布
        3.2.2 實(shí)體識(shí)別的標(biāo)簽體系
    3.3 關(guān)系抽取數(shù)據(jù)集說(shuō)明
    3.4 評(píng)價(jià)指標(biāo)
    3.5 本章小結(jié)
第四章 音樂(lè)命名實(shí)體識(shí)別
    4.1 BLSTM-CRF基準(zhǔn)模型
        4.1.1 輸入層
        4.1.2 嵌入層
        4.1.3 BLSTM編碼層
        4.1.4 CRF輸出層
    4.2 改進(jìn)的嵌入層
    4.3 實(shí)驗(yàn)對(duì)比分析
        4.3.1 參數(shù)設(shè)置
        4.3.2 WORD2VEC詞向量維度的選擇
        4.3.3 模型的效果對(duì)比
        4.3.4 模型的時(shí)間對(duì)比
        4.3.5 動(dòng)態(tài)字向量模型的具體對(duì)比
    4.4 本章小結(jié)
第五章 音樂(lè)實(shí)體間關(guān)系抽取
    5.1 模型整體框架
    5.2 模型的具體實(shí)現(xiàn)
        5.2.1 輸入層
        5.2.2 嵌入層
        5.2.3 注意力層
        5.2.4 特征融合與輸出層
    5.3 誤差函數(shù)
    5.4 實(shí)驗(yàn)與結(jié)果分析
        5.4.1 數(shù)據(jù)預(yù)處理
        5.4.2 模型的細(xì)節(jié)與參數(shù)
        5.4.3 循環(huán)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)選擇
        5.4.4 特征的比較與選擇
        5.4.5 注意力機(jī)制的比較
        5.4.6 整體模型的對(duì)比
        5.4.7 誤差函數(shù)的對(duì)比
    5.5 本章小結(jié)
總結(jié)與展望
參考文獻(xiàn)
攻讀碩士學(xué)位期間取得的研究成果
致謝
附件


【參考文獻(xiàn)】:
期刊論文
[1]基于句法語(yǔ)義特征的中文實(shí)體關(guān)系抽取 [J]. 郭喜躍,何婷婷,胡小華,陳前軍.  中文信息學(xué)報(bào). 2014(06)
[2]基于多層條件隨機(jī)場(chǎng)的中文命名實(shí)體識(shí)別 [J]. 胡文博,都云程,呂學(xué)強(qiáng),施水才.  計(jì)算機(jī)工程與應(yīng)用. 2009(01)
[3]實(shí)體關(guān)系自動(dòng)抽取 [J]. 車萬(wàn)翔,劉挺,李生.  中文信息學(xué)報(bào). 2005(02)

碩士論文
[1]基于多代理策略的中文實(shí)體關(guān)系抽取[D]. 王敏.大連理工大學(xué) 2011
[2]基于多模板HMM的中文命名實(shí)體識(shí)別[D]. 藍(lán)雁玲.華南理工大學(xué) 2011
[3]音樂(lè)領(lǐng)域全局實(shí)體關(guān)系抽取研究[D]. 劉龍.哈爾濱工業(yè)大學(xué) 2010
[4]規(guī)則與統(tǒng)計(jì)相結(jié)合的音樂(lè)領(lǐng)域命名實(shí)體識(shí)別[D]. 張學(xué)清.電子科技大學(xué) 2010
[5]音樂(lè)命名實(shí)體識(shí)別技術(shù)研究[D]. 付瑞吉.哈爾濱工業(yè)大學(xué) 2009
[6]音樂(lè)領(lǐng)域中文實(shí)體關(guān)系抽取研究[D]. 周藍(lán)珺.哈爾濱工業(yè)大學(xué) 2009



本文編號(hào):3480889

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3480889.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶06c68***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com