基于最大熵的智能提問系統(tǒng)及其在審計(jì)中的應(yīng)用
發(fā)布時(shí)間:2024-02-21 23:11
隨著信息技術(shù)的發(fā)展,審計(jì)領(lǐng)域的信息量劇增,傳統(tǒng)的計(jì)算機(jī)輔助審計(jì)軟件在處理這些巨量信息時(shí),逐漸表現(xiàn)出審計(jì)周期長、智能化程度低的局限性。為了克服這些局限性,本文提出了智能提問系統(tǒng)。與傳統(tǒng)的以查報(bào)表為手段的審計(jì)方式相比,該系統(tǒng)的靈活性較高,能夠迅速確定審計(jì)疑點(diǎn)。 本文首先歸納概括了漢語疑問句常用的十大問點(diǎn)類型,然后研究了使用最大熵模型進(jìn)行問點(diǎn)標(biāo)注的方法,以標(biāo)注好的語料為輸入生成問句。另外,借鑒犯罪心理測試領(lǐng)域的問題編排技術(shù),對生成的問句進(jìn)行了篩選編排。本文構(gòu)造的智能提問系統(tǒng)主要包含兩個(gè)模塊:一個(gè)是問句自動生成模塊;另一個(gè)是問題編排模塊。問句自動生成模塊使用社會保險(xiǎn)領(lǐng)域中的政策文本作為輸入,在構(gòu)建了該領(lǐng)域中常用句型模板的基礎(chǔ)上,對文本中的事實(shí)和規(guī)則實(shí)施抽取,并以此為基礎(chǔ)生成問句,作為輸出。在生成問句時(shí),使用最大熵理論:對社保審計(jì)領(lǐng)域具有代表性的政策文本實(shí)施人工標(biāo)注,作為訓(xùn)練語料對最大熵模型進(jìn)行訓(xùn)練,確定模型參數(shù)。然后使用該模型對從文本中抽取出的信息進(jìn)行標(biāo)注,將標(biāo)注后的句子輸入到本文所提出的問句生成算法,產(chǎn)生問句。問題編排模塊則以生成的問句為基礎(chǔ),借鑒犯罪心理測試領(lǐng)域中的編題技術(shù)并結(jié)合社保審計(jì)領(lǐng)...
【文章頁數(shù)】:68 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
目錄
第1章 緒論
1.1 研究背景和意義
1.1.1 研究背景
1.1.2 研究目的及意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 提問技術(shù)研究現(xiàn)狀
1.2.2 計(jì)算機(jī)輔助審計(jì)研究現(xiàn)狀
1.3 論文組織結(jié)構(gòu)
第2章 相關(guān)理論和技術(shù)
2.1 疑問句及問點(diǎn)類型分析
2.1.1 漢語疑問句類型
2.1.2 問點(diǎn)類型分析
2.2 最大熵原理
2.2.1 概述
2.2.2 最大熵原理
2.2.3 數(shù)學(xué)框架
2.2.4 參數(shù)估計(jì)
2.2.5 模型優(yōu)缺點(diǎn)
2.3 本章小結(jié)
第3章 問句自動生成及問題編排
3.1 文本預(yù)處理
3.1.1 文本信息抽取
3.1.2 分詞及詞性標(biāo)注
3.2 基于最大熵模型的問點(diǎn)標(biāo)注
3.2.1 特征模板構(gòu)建
3.2.2 候選特征生成
3.2.3 基本特征選取
3.2.4 最大熵模型訓(xùn)練及問點(diǎn)標(biāo)注
3.3 問句自動生成
3.3.1 事實(shí)性問句生成
3.3.2 規(guī)則性問句生成
3.4 問題編排
3.4.1 犯罪心理分析及測試
3.4.2 問題編排
3.5 本章小結(jié)
第4章 系統(tǒng)實(shí)現(xiàn)及分析
4.1 系統(tǒng)結(jié)構(gòu)
4.2 系統(tǒng)實(shí)現(xiàn)及結(jié)果分析
4.2.1 實(shí)驗(yàn)數(shù)據(jù)
4.2.2 系統(tǒng)界面
4.2.3 信息抽取
4.2.4 最大熵模型訓(xùn)練
4.2.5 問句生成模塊
4.3 本章小結(jié)
結(jié)論
參考文獻(xiàn)
攻讀碩士學(xué)位期間發(fā)表的論文和取得的科研成果
致謝
本文編號:3906031
【文章頁數(shù)】:68 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
目錄
第1章 緒論
1.1 研究背景和意義
1.1.1 研究背景
1.1.2 研究目的及意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 提問技術(shù)研究現(xiàn)狀
1.2.2 計(jì)算機(jī)輔助審計(jì)研究現(xiàn)狀
1.3 論文組織結(jié)構(gòu)
第2章 相關(guān)理論和技術(shù)
2.1 疑問句及問點(diǎn)類型分析
2.1.1 漢語疑問句類型
2.1.2 問點(diǎn)類型分析
2.2 最大熵原理
2.2.1 概述
2.2.2 最大熵原理
2.2.3 數(shù)學(xué)框架
2.2.4 參數(shù)估計(jì)
2.2.5 模型優(yōu)缺點(diǎn)
2.3 本章小結(jié)
第3章 問句自動生成及問題編排
3.1 文本預(yù)處理
3.1.1 文本信息抽取
3.1.2 分詞及詞性標(biāo)注
3.2 基于最大熵模型的問點(diǎn)標(biāo)注
3.2.1 特征模板構(gòu)建
3.2.2 候選特征生成
3.2.3 基本特征選取
3.2.4 最大熵模型訓(xùn)練及問點(diǎn)標(biāo)注
3.3 問句自動生成
3.3.1 事實(shí)性問句生成
3.3.2 規(guī)則性問句生成
3.4 問題編排
3.4.1 犯罪心理分析及測試
3.4.2 問題編排
3.5 本章小結(jié)
第4章 系統(tǒng)實(shí)現(xiàn)及分析
4.1 系統(tǒng)結(jié)構(gòu)
4.2 系統(tǒng)實(shí)現(xiàn)及結(jié)果分析
4.2.1 實(shí)驗(yàn)數(shù)據(jù)
4.2.2 系統(tǒng)界面
4.2.3 信息抽取
4.2.4 最大熵模型訓(xùn)練
4.2.5 問句生成模塊
4.3 本章小結(jié)
結(jié)論
參考文獻(xiàn)
攻讀碩士學(xué)位期間發(fā)表的論文和取得的科研成果
致謝
本文編號:3906031
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/3906031.html
最近更新
教材專著