自然語(yǔ)言處理技術(shù)在項(xiàng)目文檔管理中的應(yīng)用研究
發(fā)布時(shí)間:2022-01-14 11:53
隨著IT技術(shù)的發(fā)展和大數(shù)據(jù)時(shí)代的到來(lái),以往針對(duì)項(xiàng)目文檔自動(dòng)化管理的研究面對(duì)項(xiàng)目文檔管理工作已經(jīng)沒(méi)辦法系統(tǒng)的滿(mǎn)足項(xiàng)目管理需求,特別是沒(méi)辦法解決文檔內(nèi)容中關(guān)鍵信息的處理問(wèn)題。本文試圖提出基于自然語(yǔ)言處理技術(shù)的方式來(lái)解決項(xiàng)目文檔管理過(guò)程當(dāng)中的當(dāng)文檔關(guān)鍵信息處理問(wèn)題里,希望能夠在理論上結(jié)合新的自然語(yǔ)言處理技術(shù)找到項(xiàng)目文檔管理的新辦法,在實(shí)踐上提升項(xiàng)目文檔管理的通用性、時(shí)效性、安全性和易用性。本文以項(xiàng)目文檔管理為研究背景,以某金融證券公司為研究對(duì)象,基于自然處理技術(shù),應(yīng)用DG公司的自然語(yǔ)言處理技術(shù)軟件,對(duì)項(xiàng)目文檔關(guān)鍵信息提取進(jìn)行研究。試圖說(shuō)明自然語(yǔ)言處理技術(shù)能夠在項(xiàng)目文檔管理當(dāng)中發(fā)揮作用。論文首先介紹了該企業(yè)項(xiàng)目文檔管理當(dāng)中的現(xiàn)狀和問(wèn)題,然后介紹了如何將自然語(yǔ)言處理技術(shù)應(yīng)用到項(xiàng)目文檔管理當(dāng)中,最后通過(guò)實(shí)驗(yàn)驗(yàn)證自然語(yǔ)言處理技術(shù)在項(xiàng)目文檔管理過(guò)程中的實(shí)際效果;谧罱K實(shí)驗(yàn),發(fā)現(xiàn)基于自然語(yǔ)言處理技術(shù)處理文檔,在準(zhǔn)確率、召回率、F1值等重要指標(biāo)上接近或超過(guò)人工。在時(shí)效性上可以大大提高。因此證明應(yīng)用自然語(yǔ)言處理技術(shù)在項(xiàng)目文檔管理當(dāng)中,可以一方面保證準(zhǔn)確性,另一方面提升項(xiàng)目文檔處理的時(shí)效性。進(jìn)而提升項(xiàng)目文檔...
【文章來(lái)源】:北京郵電大學(xué)北京市 211工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:58 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖5-1測(cè)試流程圖??首先,先確定文檔類(lèi)別為項(xiàng)目文檔當(dāng)中的基金合同,單份基金合同大概頁(yè)數(shù)??
掃描件等)存在的,本次智能文檔處理系統(tǒng)使用OCR識(shí)別技術(shù)將這類(lèi)文檔??轉(zhuǎn)化為文本。對(duì)以圖片形式存在的文本進(jìn)行轉(zhuǎn)化,提取出文本內(nèi)容,便是OCR??服務(wù)。它的實(shí)現(xiàn)邏輯如圖5-3所示:??SKtf與處????a?????圖像分割????文字《部????EB還煙??圖5-3?OCR原理圖??首先,對(duì)于目標(biāo)圖像進(jìn)行分析和處理,特別是進(jìn)行版面分析,找出圖片當(dāng)中??的關(guān)鍵圖像。然后再對(duì)關(guān)鍵圖像進(jìn)行圖像分割,把一張大的圖片格式的文檔處理??為一個(gè)個(gè)小的文字圖像塊。然后對(duì)于分割好的文體圖像進(jìn)行文字識(shí)別。最后將識(shí)??別到的問(wèn)題進(jìn)行組合
?北京郵電大學(xué)工程管理碩士學(xué)位論文???而對(duì)于長(zhǎng)文本字段對(duì)于長(zhǎng)文本,例如條款、章程等,使用文本分類(lèi)技術(shù)能夠達(dá)到??較好召回和準(zhǔn)確率_『31]。??5.?3.?3.?3深度學(xué)習(xí)技術(shù)??5.?3.?3.?3.?1基于深度學(xué)習(xí)的信息抽取??傳統(tǒng)的機(jī)器學(xué)習(xí)算法先進(jìn)行特征工程然后再去處理相關(guān)的其它任務(wù),絕大多??數(shù)的工作量都是用來(lái)完成特征工程工作了。而Deep?learning顛覆了這個(gè)過(guò)程,不??需要做特征工程。對(duì)于文本這樣的序列數(shù)據(jù)而言,文字間語(yǔ)義具有上下文的依賴(lài)??關(guān)系,在深度學(xué)習(xí)中的一些模型RNN、LSTM能夠?qū)ξ淖中蛄羞M(jìn)行很好的建模。??對(duì)于局部特征,可以用CNN方式代替以前的n-gmm對(duì)局部特征進(jìn)行已很好的把??握。深度學(xué)習(xí)和傳統(tǒng)機(jī)器學(xué)習(xí)的主要區(qū)別如下圖5-4所示。??
【參考文獻(xiàn)】:
期刊論文
[1]人工智能:人類(lèi)命運(yùn)的天使抑或魔鬼——兼論新技術(shù)與青年發(fā)展[J]. 張耀銘,張路曦. 中國(guó)青年社會(huì)科學(xué). 2019(01)
[2]智能時(shí)代文化藝術(shù)管理的思維拓展與實(shí)踐突圍[J]. 張旭. 藝術(shù)教育. 2019(01)
[3]基于自然語(yǔ)言處理技術(shù)的醫(yī)學(xué)命名實(shí)體解析研究[J]. 易應(yīng)萍,張志強(qiáng),王強(qiáng). 中國(guó)數(shù)字醫(yī)學(xué). 2018(12)
[4]習(xí)近平:確保人工智能關(guān)鍵核心技術(shù)牢牢掌握在自己手里[J]. 本刊綜合. 保密工作. 2018(11)
[5]情報(bào)學(xué)視角下的國(guó)際人工智能研究前沿分析[J]. 余厚強(qiáng),曹嘉君,王曰芬. 情報(bào)雜志. 2018(09)
[6]工程項(xiàng)目管理中的文檔管理研究[J]. 邵一晶. 山東工業(yè)技術(shù). 2018(14)
[7]人工智能技術(shù)的企業(yè)文件智能監(jiān)察系統(tǒng)的研發(fā)[J]. 肖招娣. 微型電腦應(yīng)用. 2018(06)
[8]國(guó)內(nèi)自然語(yǔ)言處理的研究主題與合作能力分析[J]. 布優(yōu)祥,陳苗,龐佳昊,石晶晶,劉凡瑩,楊克虎,張俊華,田金徽. 中國(guó)醫(yī)藥導(dǎo)刊. 2018(05)
[9]國(guó)外自然語(yǔ)言處理研究主題可視化分析[J]. 布優(yōu)祥,劉凡瑩,陳苗,龐佳昊,石晶晶,田金徽. 中國(guó)醫(yī)藥導(dǎo)刊. 2018(05)
[10]自然語(yǔ)言處理在網(wǎng)站分類(lèi)中的應(yīng)用[J]. 李曼. 電信網(wǎng)技術(shù). 2018(05)
碩士論文
[1]基于自然語(yǔ)言處理的合同風(fēng)險(xiǎn)評(píng)估研究[D]. 盛越.哈爾濱工程大學(xué) 2017
[2]Y公司項(xiàng)目管理辦公室的應(yīng)用研究[D]. 焦巖策.吉林大學(xué) 2016
[3]基于條件隨機(jī)場(chǎng)的命名實(shí)體識(shí)別及實(shí)體關(guān)系識(shí)別的研究與應(yīng)用[D]. 闞琪.北京交通大學(xué) 2015
本文編號(hào):3588458
【文章來(lái)源】:北京郵電大學(xué)北京市 211工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:58 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖5-1測(cè)試流程圖??首先,先確定文檔類(lèi)別為項(xiàng)目文檔當(dāng)中的基金合同,單份基金合同大概頁(yè)數(shù)??
掃描件等)存在的,本次智能文檔處理系統(tǒng)使用OCR識(shí)別技術(shù)將這類(lèi)文檔??轉(zhuǎn)化為文本。對(duì)以圖片形式存在的文本進(jìn)行轉(zhuǎn)化,提取出文本內(nèi)容,便是OCR??服務(wù)。它的實(shí)現(xiàn)邏輯如圖5-3所示:??SKtf與處????a?????圖像分割????文字《部????EB還煙??圖5-3?OCR原理圖??首先,對(duì)于目標(biāo)圖像進(jìn)行分析和處理,特別是進(jìn)行版面分析,找出圖片當(dāng)中??的關(guān)鍵圖像。然后再對(duì)關(guān)鍵圖像進(jìn)行圖像分割,把一張大的圖片格式的文檔處理??為一個(gè)個(gè)小的文字圖像塊。然后對(duì)于分割好的文體圖像進(jìn)行文字識(shí)別。最后將識(shí)??別到的問(wèn)題進(jìn)行組合
?北京郵電大學(xué)工程管理碩士學(xué)位論文???而對(duì)于長(zhǎng)文本字段對(duì)于長(zhǎng)文本,例如條款、章程等,使用文本分類(lèi)技術(shù)能夠達(dá)到??較好召回和準(zhǔn)確率_『31]。??5.?3.?3.?3深度學(xué)習(xí)技術(shù)??5.?3.?3.?3.?1基于深度學(xué)習(xí)的信息抽取??傳統(tǒng)的機(jī)器學(xué)習(xí)算法先進(jìn)行特征工程然后再去處理相關(guān)的其它任務(wù),絕大多??數(shù)的工作量都是用來(lái)完成特征工程工作了。而Deep?learning顛覆了這個(gè)過(guò)程,不??需要做特征工程。對(duì)于文本這樣的序列數(shù)據(jù)而言,文字間語(yǔ)義具有上下文的依賴(lài)??關(guān)系,在深度學(xué)習(xí)中的一些模型RNN、LSTM能夠?qū)ξ淖中蛄羞M(jìn)行很好的建模。??對(duì)于局部特征,可以用CNN方式代替以前的n-gmm對(duì)局部特征進(jìn)行已很好的把??握。深度學(xué)習(xí)和傳統(tǒng)機(jī)器學(xué)習(xí)的主要區(qū)別如下圖5-4所示。??
【參考文獻(xiàn)】:
期刊論文
[1]人工智能:人類(lèi)命運(yùn)的天使抑或魔鬼——兼論新技術(shù)與青年發(fā)展[J]. 張耀銘,張路曦. 中國(guó)青年社會(huì)科學(xué). 2019(01)
[2]智能時(shí)代文化藝術(shù)管理的思維拓展與實(shí)踐突圍[J]. 張旭. 藝術(shù)教育. 2019(01)
[3]基于自然語(yǔ)言處理技術(shù)的醫(yī)學(xué)命名實(shí)體解析研究[J]. 易應(yīng)萍,張志強(qiáng),王強(qiáng). 中國(guó)數(shù)字醫(yī)學(xué). 2018(12)
[4]習(xí)近平:確保人工智能關(guān)鍵核心技術(shù)牢牢掌握在自己手里[J]. 本刊綜合. 保密工作. 2018(11)
[5]情報(bào)學(xué)視角下的國(guó)際人工智能研究前沿分析[J]. 余厚強(qiáng),曹嘉君,王曰芬. 情報(bào)雜志. 2018(09)
[6]工程項(xiàng)目管理中的文檔管理研究[J]. 邵一晶. 山東工業(yè)技術(shù). 2018(14)
[7]人工智能技術(shù)的企業(yè)文件智能監(jiān)察系統(tǒng)的研發(fā)[J]. 肖招娣. 微型電腦應(yīng)用. 2018(06)
[8]國(guó)內(nèi)自然語(yǔ)言處理的研究主題與合作能力分析[J]. 布優(yōu)祥,陳苗,龐佳昊,石晶晶,劉凡瑩,楊克虎,張俊華,田金徽. 中國(guó)醫(yī)藥導(dǎo)刊. 2018(05)
[9]國(guó)外自然語(yǔ)言處理研究主題可視化分析[J]. 布優(yōu)祥,劉凡瑩,陳苗,龐佳昊,石晶晶,田金徽. 中國(guó)醫(yī)藥導(dǎo)刊. 2018(05)
[10]自然語(yǔ)言處理在網(wǎng)站分類(lèi)中的應(yīng)用[J]. 李曼. 電信網(wǎng)技術(shù). 2018(05)
碩士論文
[1]基于自然語(yǔ)言處理的合同風(fēng)險(xiǎn)評(píng)估研究[D]. 盛越.哈爾濱工程大學(xué) 2017
[2]Y公司項(xiàng)目管理辦公室的應(yīng)用研究[D]. 焦巖策.吉林大學(xué) 2016
[3]基于條件隨機(jī)場(chǎng)的命名實(shí)體識(shí)別及實(shí)體關(guān)系識(shí)別的研究與應(yīng)用[D]. 闞琪.北京交通大學(xué) 2015
本文編號(hào):3588458
本文鏈接:http://sikaile.net/guanlilunwen/yunyingzuzhiguanlilunwen/3588458.html
最近更新
教材專(zhuān)著