天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于文本分類的信息解析研究

發(fā)布時間:2021-12-25 00:08
  信息解析在自然語言處理中是一項極具重要性和挑戰(zhàn)性的工作,同時也在自然語言處理應(yīng)用中扮演著重要的角色。例如:輿情監(jiān)控、網(wǎng)絡(luò)搜索和智能問答等。近年來,隨著深度學(xué)習(xí)的不斷發(fā)展,信息解析在自然語言處理中的研究取得了豐富的研究成果,并且已經(jīng)在工程上實現(xiàn)了廣泛的應(yīng)用。但是在某些方面還存在一些不足之處,如有監(jiān)督的深度學(xué)習(xí)方法需要大量高質(zhì)量的人工標注的訓(xùn)練數(shù)據(jù),其過程十分的耗時耗力,以及在中文文本中,文本數(shù)據(jù)會出現(xiàn)分詞的歧義性、單個中文字符表達的意思不準確和不豐富,和在不同情況下,中文的詞語和字符在句子中的重要性不一樣的情況,導(dǎo)致了信息解析在工程應(yīng)用中存在一些問題。為了解決上述問題,本文首先提出新的主動學(xué)習(xí)方法,并且將其與深度學(xué)習(xí)方法相結(jié)合;其次融合不同權(quán)重的中文詞語級別的特征和字符級別的特征,使得模型最終的結(jié)果可以同時考慮到詞語級別特征和字符級別特征。本文針對基于文本分類的信息解析進行了相關(guān)研究,主要工作如下:(1)提出了一個新的主動學(xué)習(xí)方法,并將其與深度學(xué)習(xí)方法相結(jié)合去實現(xiàn)信息解析。有監(jiān)督的深度學(xué)習(xí)模型在訓(xùn)練過程中通常需要大量高質(zhì)量的、已標注的訓(xùn)練樣本數(shù)據(jù)。通過人工來得到這樣的樣本數(shù)據(jù)是繁瑣的、不... 

【文章來源】:安徽大學(xué)安徽省 211工程院校

【文章頁數(shù)】:68 頁

【學(xué)位級別】:碩士

【部分圖文】:

基于文本分類的信息解析研究


圖3.2卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖??Figure?3.2?The?structure?diagram?of?convolutional?neural?network??

基于文本分類的信息解析研究


圖4.7企業(yè)公告數(shù)據(jù)集上的實驗結(jié)果??Figure?4.7?Experimental?results?on?the?Enterprise?announcement?dataset??

【參考文獻】:
期刊論文
[1]基于Spark框架的高效KNN中文文本分類算法[J]. 于蘋蘋,倪建成,姚彬修,李淋淋,曹博.  計算機應(yīng)用. 2016(12)
[2]信息抽取研究綜述[J]. 李保利,陳玉忠,俞士汶.  計算機工程與應(yīng)用. 2003(10)



本文編號:3551442

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3551442.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶899bb***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com