面向音樂領(lǐng)域的信息抽取技術(shù)研究
發(fā)布時間:2021-11-07 01:21
近年來,網(wǎng)絡(luò)上音樂數(shù)量不斷增加,相應(yīng)的音樂信息也飛速增長,人們對于快速準確的獲取音樂信息的需求越來越迫切。因此,面向音樂領(lǐng)域的信息抽取具有一定研究意義,其主要研究內(nèi)容是從自然語言文本描述的音樂信息中進行命名實體識別和關(guān)系抽取。音樂領(lǐng)域的信息抽取是音樂知識圖譜自動構(gòu)建的首要步驟,可廣泛應(yīng)用于音樂領(lǐng)域的信息檢索、推薦系統(tǒng)、問答系統(tǒng)和對話系統(tǒng)等研究。本文首先定義了需要抽取的音樂實體類型和關(guān)系類別,構(gòu)建了音樂領(lǐng)域的標(biāo)注語料,然后在此基礎(chǔ)上,對音樂實體識別和關(guān)系抽取相關(guān)技術(shù)進行了深入研究。針對音樂領(lǐng)域的命名實體識別任務(wù),本文首先設(shè)計實現(xiàn)了基于字符特征的BLSTM-CRF模型作為基準,然后分別采用三種預(yù)訓(xùn)練的字符向量改進基準模型的嵌入層:1.使用Word2vec模型訓(xùn)練靜態(tài)字向量2.使用Flair框架的雙向循環(huán)神經(jīng)網(wǎng)絡(luò)語言模型訓(xùn)練動態(tài)字向量3.使用Google官方提供的中文動態(tài)字向量BERT-Base-Chinese前兩種字向量均由本文使用對應(yīng)模型在音樂領(lǐng)域的未標(biāo)注語料上訓(xùn)練得到,第三種字向量為Google使用BERT模型訓(xùn)練的中文字向量。實驗結(jié)果表明,三種改進后的模型相比基準模型的識別效果在宏平...
【文章來源】: 華南理工大學(xué)廣東省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:77 頁
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 研究背景與意義
1.2 國內(nèi)外相關(guān)研究現(xiàn)狀
1.2.1 實體識別
1.2.2 關(guān)系抽取
1.2.3 實體關(guān)系聯(lián)合抽取
1.2.4 音樂領(lǐng)域的信息抽取
1.3 研究內(nèi)容
1.4 論文的組織結(jié)構(gòu)
第二章 相關(guān)理論和技術(shù)
2.1 詞向量
2.1.1 語言模型
2.1.2 靜態(tài)詞向量
2.1.3 動態(tài)詞向量
2.2 條件隨機場
2.3 循環(huán)神經(jīng)網(wǎng)絡(luò)
2.3.1 RNN
2.3.2 長短時記憶單元
2.4 注意力機制
2.4.1 基本的注意力機制
2.4.2 自注意力機制
2.4.3 多頭注意力機制
2.5 本章小結(jié)
第三章 語料說明
3.1 語料來源
3.2 實體識別數(shù)據(jù)集說明
3.2.1 實體類型及數(shù)據(jù)集分布
3.2.2 實體識別的標(biāo)簽體系
3.3 關(guān)系抽取數(shù)據(jù)集說明
3.4 評價指標(biāo)
3.5 本章小結(jié)
第四章 音樂命名實體識別
4.1 BLSTM-CRF基準模型
4.1.1 輸入層
4.1.2 嵌入層
4.1.3 BLSTM編碼層
4.1.4 CRF輸出層
4.2 改進的嵌入層
4.3 實驗對比分析
4.3.1 參數(shù)設(shè)置
4.3.2 WORD2VEC詞向量維度的選擇
4.3.3 模型的效果對比
4.3.4 模型的時間對比
4.3.5 動態(tài)字向量模型的具體對比
4.4 本章小結(jié)
第五章 音樂實體間關(guān)系抽取
5.1 模型整體框架
5.2 模型的具體實現(xiàn)
5.2.1 輸入層
5.2.2 嵌入層
5.2.3 注意力層
5.2.4 特征融合與輸出層
5.3 誤差函數(shù)
5.4 實驗與結(jié)果分析
5.4.1 數(shù)據(jù)預(yù)處理
5.4.2 模型的細節(jié)與參數(shù)
5.4.3 循環(huán)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)選擇
5.4.4 特征的比較與選擇
5.4.5 注意力機制的比較
5.4.6 整體模型的對比
5.4.7 誤差函數(shù)的對比
5.5 本章小結(jié)
總結(jié)與展望
參考文獻
攻讀碩士學(xué)位期間取得的研究成果
致謝
附件
【參考文獻】:
期刊論文
[1]基于句法語義特征的中文實體關(guān)系抽取 [J]. 郭喜躍,何婷婷,胡小華,陳前軍. 中文信息學(xué)報. 2014(06)
[2]基于多層條件隨機場的中文命名實體識別 [J]. 胡文博,都云程,呂學(xué)強,施水才. 計算機工程與應(yīng)用. 2009(01)
[3]實體關(guān)系自動抽取 [J]. 車萬翔,劉挺,李生. 中文信息學(xué)報. 2005(02)
碩士論文
[1]基于多代理策略的中文實體關(guān)系抽取[D]. 王敏.大連理工大學(xué) 2011
[2]基于多模板HMM的中文命名實體識別[D]. 藍雁玲.華南理工大學(xué) 2011
[3]音樂領(lǐng)域全局實體關(guān)系抽取研究[D]. 劉龍.哈爾濱工業(yè)大學(xué) 2010
[4]規(guī)則與統(tǒng)計相結(jié)合的音樂領(lǐng)域命名實體識別[D]. 張學(xué)清.電子科技大學(xué) 2010
[5]音樂命名實體識別技術(shù)研究[D]. 付瑞吉.哈爾濱工業(yè)大學(xué) 2009
[6]音樂領(lǐng)域中文實體關(guān)系抽取研究[D]. 周藍珺.哈爾濱工業(yè)大學(xué) 2009
本文編號:3480889
【文章來源】: 華南理工大學(xué)廣東省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:77 頁
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 研究背景與意義
1.2 國內(nèi)外相關(guān)研究現(xiàn)狀
1.2.1 實體識別
1.2.2 關(guān)系抽取
1.2.3 實體關(guān)系聯(lián)合抽取
1.2.4 音樂領(lǐng)域的信息抽取
1.3 研究內(nèi)容
1.4 論文的組織結(jié)構(gòu)
第二章 相關(guān)理論和技術(shù)
2.1 詞向量
2.1.1 語言模型
2.1.2 靜態(tài)詞向量
2.1.3 動態(tài)詞向量
2.2 條件隨機場
2.3 循環(huán)神經(jīng)網(wǎng)絡(luò)
2.3.1 RNN
2.3.2 長短時記憶單元
2.4 注意力機制
2.4.1 基本的注意力機制
2.4.2 自注意力機制
2.4.3 多頭注意力機制
2.5 本章小結(jié)
第三章 語料說明
3.1 語料來源
3.2 實體識別數(shù)據(jù)集說明
3.2.1 實體類型及數(shù)據(jù)集分布
3.2.2 實體識別的標(biāo)簽體系
3.3 關(guān)系抽取數(shù)據(jù)集說明
3.4 評價指標(biāo)
3.5 本章小結(jié)
第四章 音樂命名實體識別
4.1 BLSTM-CRF基準模型
4.1.1 輸入層
4.1.2 嵌入層
4.1.3 BLSTM編碼層
4.1.4 CRF輸出層
4.2 改進的嵌入層
4.3 實驗對比分析
4.3.1 參數(shù)設(shè)置
4.3.2 WORD2VEC詞向量維度的選擇
4.3.3 模型的效果對比
4.3.4 模型的時間對比
4.3.5 動態(tài)字向量模型的具體對比
4.4 本章小結(jié)
第五章 音樂實體間關(guān)系抽取
5.1 模型整體框架
5.2 模型的具體實現(xiàn)
5.2.1 輸入層
5.2.2 嵌入層
5.2.3 注意力層
5.2.4 特征融合與輸出層
5.3 誤差函數(shù)
5.4 實驗與結(jié)果分析
5.4.1 數(shù)據(jù)預(yù)處理
5.4.2 模型的細節(jié)與參數(shù)
5.4.3 循環(huán)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)選擇
5.4.4 特征的比較與選擇
5.4.5 注意力機制的比較
5.4.6 整體模型的對比
5.4.7 誤差函數(shù)的對比
5.5 本章小結(jié)
總結(jié)與展望
參考文獻
攻讀碩士學(xué)位期間取得的研究成果
致謝
附件
【參考文獻】:
期刊論文
[1]基于句法語義特征的中文實體關(guān)系抽取 [J]. 郭喜躍,何婷婷,胡小華,陳前軍. 中文信息學(xué)報. 2014(06)
[2]基于多層條件隨機場的中文命名實體識別 [J]. 胡文博,都云程,呂學(xué)強,施水才. 計算機工程與應(yīng)用. 2009(01)
[3]實體關(guān)系自動抽取 [J]. 車萬翔,劉挺,李生. 中文信息學(xué)報. 2005(02)
碩士論文
[1]基于多代理策略的中文實體關(guān)系抽取[D]. 王敏.大連理工大學(xué) 2011
[2]基于多模板HMM的中文命名實體識別[D]. 藍雁玲.華南理工大學(xué) 2011
[3]音樂領(lǐng)域全局實體關(guān)系抽取研究[D]. 劉龍.哈爾濱工業(yè)大學(xué) 2010
[4]規(guī)則與統(tǒng)計相結(jié)合的音樂領(lǐng)域命名實體識別[D]. 張學(xué)清.電子科技大學(xué) 2010
[5]音樂命名實體識別技術(shù)研究[D]. 付瑞吉.哈爾濱工業(yè)大學(xué) 2009
[6]音樂領(lǐng)域中文實體關(guān)系抽取研究[D]. 周藍珺.哈爾濱工業(yè)大學(xué) 2009
本文編號:3480889
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3480889.html
最近更新
教材專著