天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

政務領域自動問答系統研究與實現

發(fā)布時間:2021-04-11 09:38
  近年來,我國的電子政務市場規(guī)模逐年增長,在線政務服務用戶占整體網民比重越來越高,人們對于政務服務辦事需求越來越多。目前許多省份推出了政務服務問答系統,但大都應用關鍵詞匹配技術,到已有的數據庫中查找與關鍵詞相關的信息并返回給用戶,或者構建常用問題庫進行政務問答,F有系統中問題和問句相對固定,很難解決用戶的實際問題。在政務服務問答系統中主要涉及一些服務事項,其描述具有有以下特點:1、辦事事項數量多,事項之間存在關聯。由于不同的行政區(qū)劃,省級、市級、縣級辦事事項的總體數量龐大,辦事種類也很繁雜,同時辦事事項也并非獨立存在,還存在一個事項關聯其他事項、同一事項關聯不同部門的情況。2、政務問答中問句特殊。由于政務辦事事項存在部分名稱較長、意義并列的情況,對于用戶問句中政務辦事事項的識別比一般的命名實體識別更為復雜。3、答案查找相對復雜。以簡單的關鍵詞匹配不能準確定位答案,以常見問題進行問答,用戶不能自定義問題進行問答,只能詢問固定的常見問題,同時由于事項之間存在關聯,辦事部門也并非獨立存在,答案查找可能涉及推理過程。針對上述問題,本文的主要工作有:1)政務領域知識庫構建:針對政務服務事項關聯復雜... 

【文章來源】:西南科技大學四川省

【文章頁數】:65 頁

【學位級別】:碩士

【部分圖文】:

政務領域自動問答系統研究與實現


四川政務服務網數據

流程圖,政務,本體,流程圖


2政務領域知識庫構建11ORE[18]是首個大規(guī)模的中英文知識圖譜,它的知識來源主要是不同結構的百科中的結構化數據,目前包含了2466956個概念,446236個屬性和16284901個實體。通用知識圖譜一般注重廣度,概念、屬性、實體的個數相對領域知識圖譜較多,但其數據精確率不高。而領域知識圖譜一般注重深度,其實體的屬性以及數據的模式相對豐富。知識圖譜結構上可以分為模式層、數據層兩部分[19]。模式層中結點表示本體,邊表示本體的概念關系。數據層則是由具體的事實組成,是對模式層定義的本體、概念關系的填充,在存儲方面,圖數據庫則通過存儲具體事實來存儲知識圖譜,其存儲形式可以為:“實體-關系-實體”等。在構建方法上主要有有自底向上、自頂向下兩種,此外,還可以綜合以上兩種構建方法來構建知識圖譜,這類典型的知識圖譜有百度知識圖譜,就是采用混合方法來構建的。2.3.2構建流程對于政務知識庫,由于政務服務數據的結構化程度非常高,對于其中的實體、屬性、關系的抽取較為方便,因此本文采用自頂向下的構建方法,自頂向下的構建方法需要首先定義好知識圖譜的模式層,然后依據構建的模式層再對知識圖譜進行數據的填充。政務領域知識圖譜構建主要由兩個步驟組成,包括概念層設計以及知識圖譜生成。構建流程如圖2-3所示。圖2-3政務本體構建流程圖

行政區(qū)劃圖,實體,政務,行政區(qū)劃


西南科技大學碩士學位論文14表2-6政務本體及屬性表(續(xù))政務本體類/屬性省級部門電話服務主題名稱服務對象名稱權力名稱DataPropertyDataPropertyDataPropertyDataProperty2.3.4政務模式層構建概念層的設計是構建領域知識圖譜的重要步驟,概念層確定后,其他數據就可以依據模式層進行填充,通過2.3.3節(jié)對政務領域數據的分析及提煉出的概念、屬性、關系,本文使用本體構建工具Protege[26]構建了政務本體模式層。如圖2-4所示。其中,實線表示類與子類的關系,虛線表示對象屬性關系。圖2-4政務本體模式層定義了事項實體、服務主題實體、服務對象實體、權力類型實體、行政區(qū)劃實體、部門六類實體,并設計了各實體之間的關系,包括下設、主題對象、事項主題、事項對象、從屬、辦事層級、擁有權責、權力事項、權責事項、管轄十種關系。最終形成了包含實體及關系的概念模式。本文采用了W3C開發(fā)的網絡本體語言OWL來描述政務領域本體,類表示定義的政務領域實體,相互之間是互斥的。屬性包括對象屬性以及數據屬性,對象屬性描述的是類之間的關系,所屬領域及值域都是類,例如<行政區(qū)劃下設部門>這一組關系,‘下設’指的就是對象屬性,用來描述‘行政區(qū)劃’和‘部門’之間的關系。數據屬性描述的是類的屬性,所屬領域為類,值域為數據類型,例如<事項辦理地點具體地點>這一組關系,‘辦理地點’指的就是數據屬性,描述的是‘事項’的屬性‘辦理地點’,‘具體地點’則是一種具體的數據類型,如‘xsd:string’。本文構建的政務領域本體部分代碼如圖2-5所示。

【參考文獻】:
期刊論文
[1]基于社區(qū)問答數據遷移學習的FAQ問答模型研究[J]. 邵明銳,馬登豪,陳躍國,覃雄派,杜小勇.  華東師范大學學報(自然科學版). 2019(05)
[2]知識圖譜研究綜述[J]. 黃恒琪,于娟,廖曉,席運江.  計算機系統應用. 2019(06)
[3]基于關鍵詞加權的法律文本主題模型研究[J]. 張揚武,李國和,王立梅.  計算機與數字工程. 2019(05)
[4]基于深度神經網絡的維吾爾文命名實體識別研究[J]. 王路路,艾山·吾買爾,吐爾根·依布拉音,買合木提·買買提,卡哈爾江·阿比的熱西提.  中文信息學報. 2019(03)
[5]基于LSTM-CRF的中醫(yī)醫(yī)案癥狀術語識別[J]. 李明浩,劉忠,姚遠哲.  計算機應用. 2018(S2)
[6]Research of Clinical Named Entity Recognition Based on Bi-LSTM-CRF[J]. 秦穎,曾穎菲.  Journal of Shanghai Jiaotong University(Science). 2018(03)
[7]基于知識庫的開放領域問答系統[J]. 張濤,賈真,李天瑞,黃雁勇.  智能系統學報. 2018(04)
[8]命名實體識別研究綜述[J]. 劉瀏,王東波.  情報學報. 2018(03)
[9]基于CNN-BLSTM-CRF模型的生物醫(yī)學命名實體識別[J]. 李麗雙,郭元凱.  中文信息學報. 2018(01)
[10]基于改進的Jaccard系數文檔相似度計算方法[J]. 俞婷婷,徐彭娜,江育娥,林劼.  計算機系統應用. 2017(12)

博士論文
[1]面向大規(guī)模知識圖譜的彈性語義推理方法研究及應用[D]. 陳曦.浙江大學 2017



本文編號:3131020

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3131020.html


Copyright(c)文論論文網All Rights Reserved | 網站地圖 |

版權申明:資料由用戶32829***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com