社保審計領(lǐng)域語料庫構(gòu)建研究
本文關(guān)鍵詞:社保審計領(lǐng)域語料庫構(gòu)建研究 出處:《哈爾濱工程大學(xué)》2011年碩士論文 論文類型:學(xué)位論文
更多相關(guān)文章: 社保審計領(lǐng)域 信息動態(tài)管理 智能化審計 語料分類 細(xì)語料提取
【摘要】:社會保障體系的正常運(yùn)行關(guān)系到廣大人民的切身利益,如何能在信息爆炸時代的今天有效的利用領(lǐng)域信息,來指導(dǎo)社保審計體系的調(diào)整是領(lǐng)域內(nèi)急待解決的問題。社保審計語料庫用于社保審計領(lǐng)域語言處理,管理領(lǐng)域信息,進(jìn)而支持領(lǐng)域?qū)徲嫹椒ǖ膬?yōu)化。 本文對社保審計領(lǐng)域信息進(jìn)行分析,并根據(jù)領(lǐng)域信息的特征提出采用原始語料和處理后語料不斷更新的半自動管理方式來構(gòu)建領(lǐng)域語料庫,通過語料信息的評價評定領(lǐng)域中語料源和領(lǐng)域細(xì)語料集。采用半自動網(wǎng)絡(luò)搜索下載的方式從指定的領(lǐng)域語料源獲取不斷更新的領(lǐng)域粗語料。在領(lǐng)域細(xì)語料集的支持下采用迭代的方式應(yīng)用雙詞典回溯遍歷算法不斷提取領(lǐng)域細(xì)語料,豐富領(lǐng)域細(xì)語料集,同時給出了領(lǐng)域細(xì)語料集的組織結(jié)構(gòu)和更新管理方式。在細(xì)語料表示領(lǐng)域語料時以語料的時間、頻度、流通度、語料源等級作為特征值,采用基于向量支持的方式對領(lǐng)域語料進(jìn)行分類管理。 在獲得大規(guī)模領(lǐng)域語料庫的同時,本文應(yīng)用語料信息與社保審計領(lǐng)域?qū)徲嫹椒ㄟM(jìn)行信息對比,根據(jù)領(lǐng)域細(xì)語料的更新和領(lǐng)域語料的分類情況動態(tài)的監(jiān)測不斷更新的領(lǐng)域語料,發(fā)掘語料所包含領(lǐng)域信息的變化,通過反饋領(lǐng)域信息的變化指導(dǎo)社保審計方法體系的調(diào)整,以最終實(shí)現(xiàn)領(lǐng)域語料庫支持下的社保智能化審計。
【學(xué)位授予單位】:哈爾濱工程大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2011
【分類號】:F239.6;TP391.1
【參考文獻(xiàn)】
相關(guān)期刊論文 前10條
1 丁信善;語料庫語言學(xué)的發(fā)展及研究現(xiàn)狀[J];當(dāng)代語言學(xué);1998年01期
2 趙世奇;劉挺;李生;;基于自動構(gòu)建語料庫的詞匯級復(fù)述研究[J];電子學(xué)報;2009年05期
3 王繼成,潘金貴,張福炎;Web文本挖掘技術(shù)研究[J];計算機(jī)研究與發(fā)展;2000年05期
4 崔世起;劉群;孟遙;于浩;西野文人;;基于大規(guī)模語料庫的新詞檢測[J];計算機(jī)研究與發(fā)展;2006年05期
5 周強(qiáng);;基于語料庫和面向統(tǒng)計學(xué)的自然語言處理技術(shù)[J];計算機(jī)科學(xué);1995年04期
6 馮永;李華;鐘將;葉春曉;;基于自適應(yīng)中文分詞和近似SVM的文本分類算法[J];計算機(jī)科學(xué);2010年01期
7 張晶,趙鐵軍,姚建民,李生;基于語料庫的英語從句識別研究[J];中文信息學(xué)報;2000年06期
8 金翔宇,孫正興,張福炎;一種中文文檔的非受限無詞典抽詞方法[J];中文信息學(xué)報;2001年06期
9 俞士汶,段慧明,朱學(xué)鋒,孫斌;北京大學(xué)現(xiàn)代漢語語料庫基本加工規(guī)范[J];中文信息學(xué)報;2002年05期
10 俞士汶,段慧明,朱學(xué)鋒,孫斌;北京大學(xué)現(xiàn)代漢語語料庫基本加工規(guī)范(續(xù))[J];中文信息學(xué)報;2002年06期
相關(guān)會議論文 前3條
1 張普;;關(guān)于大規(guī)模真實(shí)文本語料庫的幾點(diǎn)理論思考[A];世紀(jì)之交的中國應(yīng)用語言學(xué)研究——第二屆全國語言文字應(yīng)用學(xué)術(shù)研討會論文集[C];1998年
2 尹斌庸;方世增;;詞頻統(tǒng)計的新概念和新方法[A];語言文字應(yīng)用研究論文集(Ⅱ)[C];2004年
3 柏曉靜;常寶寶;詹衛(wèi)東;吳擁華;;構(gòu)建大規(guī)模的漢英雙語平行語料庫[A];機(jī)器翻譯研究進(jìn)展——2002年全國機(jī)器翻譯研討會論文集[C];2002年
,本文編號:1333384
本文鏈接:http://sikaile.net/guanlilunwen/shenjigli/1333384.html