財經(jīng)領(lǐng)域?qū)嶓w關(guān)系抽取技術(shù)的研究與系統(tǒng)實現(xiàn)
發(fā)布時間:2022-12-11 07:27
財經(jīng)領(lǐng)域信息蘊含極大價值,分析財經(jīng)領(lǐng)域信息對指導個人和社會經(jīng)濟活動具有重要意義。但是,財經(jīng)領(lǐng)域信息數(shù)據(jù)量大,增長速度快,依靠人工處理費時耗力,難以充分利用這些信息。關(guān)系抽取技術(shù)可以自動化地抽取自由文本中的實體關(guān)系,領(lǐng)域內(nèi)數(shù)據(jù)分析人員在抽取出的關(guān)系基礎(chǔ)上進行數(shù)據(jù)分析,單位時間內(nèi)可以分析更多的財經(jīng)領(lǐng)域信息。因此,本課題的研究可以幫助領(lǐng)域內(nèi)數(shù)據(jù)分析人員更加充分地利用財經(jīng)領(lǐng)域信息,具有重要意義。財經(jīng)領(lǐng)域信息具有一些明顯的領(lǐng)域特點,這些特點導致現(xiàn)有的主流模型在財經(jīng)領(lǐng)域這個特定領(lǐng)域上,關(guān)系抽取的精確率和召回率比較低。首先,財經(jīng)領(lǐng)域信息句子長度普遍較長。其次,財經(jīng)領(lǐng)域信息中存在一些單詞具有特殊領(lǐng)域含義且與常見含義差別較大,還有一些領(lǐng)域特色的俚語表達。最后,財經(jīng)領(lǐng)域信息一個句子中包含多個領(lǐng)域?qū)嶓w且不同實體對之間具有不同的關(guān)系類型。這篇論文針對以上問題提出了基于BiGRU和Attention機制的聯(lián)合模型——BGAJM模型(BiGRU Attention Joint Model,BGAJM)。BGAJM模型對以上特點導致的問題,做了針對性改進以提高模型的精確率和召回率。該模型具有以下特點:(1)針對句子...
【文章頁數(shù)】:91 頁
【學位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第一章 緒論
1.1 研究背景和意義
1.1.1 研究背景
1.1.2 研究意義
1.2 研究現(xiàn)狀部分
1.2.1 財經(jīng)領(lǐng)域信息利用及關(guān)系抽取在其他領(lǐng)域應(yīng)用的研究現(xiàn)狀
1.2.2 關(guān)系抽取技術(shù)的研究現(xiàn)狀
1.2.3 命名實體識別技術(shù)的研究現(xiàn)狀
1.3 研究內(nèi)容及創(chuàng)新點
1.3.1 研究內(nèi)容
1.3.2 論文創(chuàng)新點
1.4 論文的組織結(jié)構(gòu)
第二章 相關(guān)技術(shù)
2.1 詞表示技術(shù)
2.1.1 分布式詞表示技術(shù)
2.2 深度神經(jīng)網(wǎng)絡(luò)模型
2.2.1 RNN網(wǎng)絡(luò)模型
2.2.2 長短期記憶網(wǎng)絡(luò)模型
2.2.3 基于門結(jié)構(gòu)的循環(huán)單元模型
2.3 Attention機制
2.4 本章小結(jié)
第三章 財經(jīng)領(lǐng)域?qū)嶓w關(guān)系抽取技術(shù)的研究
3.1 財經(jīng)領(lǐng)域數(shù)據(jù)特點介紹
3.1.1 句子長度普遍較長
3.1.2 存在具有特殊含義的單詞和俚語化表達
3.1.3 句子中包含多個實體且不同實體具有不同的關(guān)系
3.2 關(guān)系抽取目標
3.3 基于BiGRU和Attention機制的聯(lián)合模型
3.3.1 詞嵌入層
3.3.2 BiGRU層
3.3.3 注意力層
3.3.4 實體識別模塊
3.3.5 關(guān)系抽取模塊
3.4 相關(guān)實驗及結(jié)果分析
3.4.1 數(shù)據(jù)集介紹
3.4.2 性能評價指標
3.4.3 關(guān)系抽取模型超參數(shù)實驗
3.4.4 分別用BiGRU和BiLSTM作為隱藏層網(wǎng)絡(luò)模型的對比實驗
3.4.5 不同詞向量之間的對比實驗
3.4.6 不同方法模型之間對比實驗
3.5 本章小結(jié)
第四章 財經(jīng)領(lǐng)域信息抽取系統(tǒng)的設(shè)計與實現(xiàn)
4.1 需求分析
4.1.1 業(yè)務(wù)需求
4.1.2 用戶需求
4.1.3 功能需求
4.1.4 性能需求
4.2 概要設(shè)計
4.2.1 數(shù)據(jù)庫概要設(shè)計
4.2.2 系統(tǒng)功能及架構(gòu)概要設(shè)計
4.3 詳細設(shè)計
4.3.1 數(shù)據(jù)庫表詳細設(shè)計
4.3.2 功能界面設(shè)計
4.4 系統(tǒng)各功能模塊實現(xiàn)
4.4.1 用戶管理模塊
4.4.2 信息爬取模塊
4.4.3 實體識別和關(guān)系抽取模塊
4.5 系統(tǒng)測試
4.5.1 用戶管理相關(guān)功能測試
4.5.2 信息爬取相關(guān)功能測試
4.5.3 關(guān)系抽取相關(guān)功能測試
4.5.4 系統(tǒng)性能測試
4.6 本章小結(jié)
第五章 總結(jié)與展望
5.1 論文工作總結(jié)
5.2 下一步工作展望
參考文獻
致謝
攻讀碩士學位期間研究成果
【參考文獻】:
期刊論文
[1]基于詞匯-語義模式的金融事件信息抽取方法[J]. 羅明,黃海量. 計算機應(yīng)用. 2018(01)
[2]大數(shù)據(jù)時代財經(jīng)報道領(lǐng)域的數(shù)據(jù)新聞實踐[J]. 莫謹榕. 新媒體研究. 2017(13)
[3]網(wǎng)絡(luò)媒體對股票市場的影響——以東方財富網(wǎng)股吧為例的實證研究[J]. 金雪軍,祝宇,楊曉蘭. 新聞與傳播研究. 2013(12)
[4]中文人稱名詞短語單復數(shù)自動識別[J]. 郎君,秦兵,劉挺,李正華,李生. 自動化學報. 2008(08)
碩士論文
[1]社交數(shù)據(jù)和股票價格波動關(guān)系的研究[D]. 馬樹東.哈爾濱工業(yè)大學 2016
[2]財經(jīng)網(wǎng)絡(luò)社區(qū)對投資者行為影響的調(diào)研報告[D]. 伍韻.浙江大學 2016
[3]財經(jīng)領(lǐng)域命名實體識別方法的研究與系統(tǒng)實現(xiàn)[D]. 吳陽.哈爾濱工業(yè)大學 2015
[4]財經(jīng)新聞導航:一種新的知識網(wǎng)絡(luò)框架研究[D]. 周麗麗.中國科學技術(shù)大學 2015
[5]財經(jīng)問答系統(tǒng)問句解析子系統(tǒng)的設(shè)計與實現(xiàn)[D]. 林沛坤.哈爾濱工業(yè)大學 2014
[6]網(wǎng)絡(luò)信息對于股票市場的影響[D]. 祝宇.浙江大學 2013
[7]基于網(wǎng)絡(luò)輿論的我國股票市場有效性檢驗研究[D]. 陳江鵬.西南財經(jīng)大學 2013
本文編號:3718380
【文章頁數(shù)】:91 頁
【學位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第一章 緒論
1.1 研究背景和意義
1.1.1 研究背景
1.1.2 研究意義
1.2 研究現(xiàn)狀部分
1.2.1 財經(jīng)領(lǐng)域信息利用及關(guān)系抽取在其他領(lǐng)域應(yīng)用的研究現(xiàn)狀
1.2.2 關(guān)系抽取技術(shù)的研究現(xiàn)狀
1.2.3 命名實體識別技術(shù)的研究現(xiàn)狀
1.3 研究內(nèi)容及創(chuàng)新點
1.3.1 研究內(nèi)容
1.3.2 論文創(chuàng)新點
1.4 論文的組織結(jié)構(gòu)
第二章 相關(guān)技術(shù)
2.1 詞表示技術(shù)
2.1.1 分布式詞表示技術(shù)
2.2 深度神經(jīng)網(wǎng)絡(luò)模型
2.2.1 RNN網(wǎng)絡(luò)模型
2.2.2 長短期記憶網(wǎng)絡(luò)模型
2.2.3 基于門結(jié)構(gòu)的循環(huán)單元模型
2.3 Attention機制
2.4 本章小結(jié)
第三章 財經(jīng)領(lǐng)域?qū)嶓w關(guān)系抽取技術(shù)的研究
3.1 財經(jīng)領(lǐng)域數(shù)據(jù)特點介紹
3.1.1 句子長度普遍較長
3.1.2 存在具有特殊含義的單詞和俚語化表達
3.1.3 句子中包含多個實體且不同實體具有不同的關(guān)系
3.2 關(guān)系抽取目標
3.3 基于BiGRU和Attention機制的聯(lián)合模型
3.3.1 詞嵌入層
3.3.2 BiGRU層
3.3.3 注意力層
3.3.4 實體識別模塊
3.3.5 關(guān)系抽取模塊
3.4 相關(guān)實驗及結(jié)果分析
3.4.1 數(shù)據(jù)集介紹
3.4.2 性能評價指標
3.4.3 關(guān)系抽取模型超參數(shù)實驗
3.4.4 分別用BiGRU和BiLSTM作為隱藏層網(wǎng)絡(luò)模型的對比實驗
3.4.5 不同詞向量之間的對比實驗
3.4.6 不同方法模型之間對比實驗
3.5 本章小結(jié)
第四章 財經(jīng)領(lǐng)域信息抽取系統(tǒng)的設(shè)計與實現(xiàn)
4.1 需求分析
4.1.1 業(yè)務(wù)需求
4.1.2 用戶需求
4.1.3 功能需求
4.1.4 性能需求
4.2 概要設(shè)計
4.2.1 數(shù)據(jù)庫概要設(shè)計
4.2.2 系統(tǒng)功能及架構(gòu)概要設(shè)計
4.3 詳細設(shè)計
4.3.1 數(shù)據(jù)庫表詳細設(shè)計
4.3.2 功能界面設(shè)計
4.4 系統(tǒng)各功能模塊實現(xiàn)
4.4.1 用戶管理模塊
4.4.2 信息爬取模塊
4.4.3 實體識別和關(guān)系抽取模塊
4.5 系統(tǒng)測試
4.5.1 用戶管理相關(guān)功能測試
4.5.2 信息爬取相關(guān)功能測試
4.5.3 關(guān)系抽取相關(guān)功能測試
4.5.4 系統(tǒng)性能測試
4.6 本章小結(jié)
第五章 總結(jié)與展望
5.1 論文工作總結(jié)
5.2 下一步工作展望
參考文獻
致謝
攻讀碩士學位期間研究成果
【參考文獻】:
期刊論文
[1]基于詞匯-語義模式的金融事件信息抽取方法[J]. 羅明,黃海量. 計算機應(yīng)用. 2018(01)
[2]大數(shù)據(jù)時代財經(jīng)報道領(lǐng)域的數(shù)據(jù)新聞實踐[J]. 莫謹榕. 新媒體研究. 2017(13)
[3]網(wǎng)絡(luò)媒體對股票市場的影響——以東方財富網(wǎng)股吧為例的實證研究[J]. 金雪軍,祝宇,楊曉蘭. 新聞與傳播研究. 2013(12)
[4]中文人稱名詞短語單復數(shù)自動識別[J]. 郎君,秦兵,劉挺,李正華,李生. 自動化學報. 2008(08)
碩士論文
[1]社交數(shù)據(jù)和股票價格波動關(guān)系的研究[D]. 馬樹東.哈爾濱工業(yè)大學 2016
[2]財經(jīng)網(wǎng)絡(luò)社區(qū)對投資者行為影響的調(diào)研報告[D]. 伍韻.浙江大學 2016
[3]財經(jīng)領(lǐng)域命名實體識別方法的研究與系統(tǒng)實現(xiàn)[D]. 吳陽.哈爾濱工業(yè)大學 2015
[4]財經(jīng)新聞導航:一種新的知識網(wǎng)絡(luò)框架研究[D]. 周麗麗.中國科學技術(shù)大學 2015
[5]財經(jīng)問答系統(tǒng)問句解析子系統(tǒng)的設(shè)計與實現(xiàn)[D]. 林沛坤.哈爾濱工業(yè)大學 2014
[6]網(wǎng)絡(luò)信息對于股票市場的影響[D]. 祝宇.浙江大學 2013
[7]基于網(wǎng)絡(luò)輿論的我國股票市場有效性檢驗研究[D]. 陳江鵬.西南財經(jīng)大學 2013
本文編號:3718380
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3718380.html
最近更新
教材專著