基于文本分類的信息解析研究
發(fā)布時間:2021-12-25 00:08
信息解析在自然語言處理中是一項極具重要性和挑戰(zhàn)性的工作,同時也在自然語言處理應用中扮演著重要的角色。例如:輿情監(jiān)控、網(wǎng)絡搜索和智能問答等。近年來,隨著深度學習的不斷發(fā)展,信息解析在自然語言處理中的研究取得了豐富的研究成果,并且已經在工程上實現(xiàn)了廣泛的應用。但是在某些方面還存在一些不足之處,如有監(jiān)督的深度學習方法需要大量高質量的人工標注的訓練數(shù)據(jù),其過程十分的耗時耗力,以及在中文文本中,文本數(shù)據(jù)會出現(xiàn)分詞的歧義性、單個中文字符表達的意思不準確和不豐富,和在不同情況下,中文的詞語和字符在句子中的重要性不一樣的情況,導致了信息解析在工程應用中存在一些問題。為了解決上述問題,本文首先提出新的主動學習方法,并且將其與深度學習方法相結合;其次融合不同權重的中文詞語級別的特征和字符級別的特征,使得模型最終的結果可以同時考慮到詞語級別特征和字符級別特征。本文針對基于文本分類的信息解析進行了相關研究,主要工作如下:(1)提出了一個新的主動學習方法,并將其與深度學習方法相結合去實現(xiàn)信息解析。有監(jiān)督的深度學習模型在訓練過程中通常需要大量高質量的、已標注的訓練樣本數(shù)據(jù)。通過人工來得到這樣的樣本數(shù)據(jù)是繁瑣的、不...
【文章來源】:安徽大學安徽省 211工程院校
【文章頁數(shù)】:68 頁
【學位級別】:碩士
【部分圖文】:
圖3.2卷積神經網(wǎng)絡結構圖??Figure?3.2?The?structure?diagram?of?convolutional?neural?network??
圖4.7企業(yè)公告數(shù)據(jù)集上的實驗結果??Figure?4.7?Experimental?results?on?the?Enterprise?announcement?dataset??
【參考文獻】:
期刊論文
[1]基于Spark框架的高效KNN中文文本分類算法[J]. 于蘋蘋,倪建成,姚彬修,李淋淋,曹博. 計算機應用. 2016(12)
[2]信息抽取研究綜述[J]. 李保利,陳玉忠,俞士汶. 計算機工程與應用. 2003(10)
本文編號:3551442
【文章來源】:安徽大學安徽省 211工程院校
【文章頁數(shù)】:68 頁
【學位級別】:碩士
【部分圖文】:
圖3.2卷積神經網(wǎng)絡結構圖??Figure?3.2?The?structure?diagram?of?convolutional?neural?network??
圖4.7企業(yè)公告數(shù)據(jù)集上的實驗結果??Figure?4.7?Experimental?results?on?the?Enterprise?announcement?dataset??
【參考文獻】:
期刊論文
[1]基于Spark框架的高效KNN中文文本分類算法[J]. 于蘋蘋,倪建成,姚彬修,李淋淋,曹博. 計算機應用. 2016(12)
[2]信息抽取研究綜述[J]. 李保利,陳玉忠,俞士汶. 計算機工程與應用. 2003(10)
本文編號:3551442
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3551442.html
最近更新
教材專著