天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 軟件論文 >

基于命名實體識別的手機領(lǐng)域知識庫問答系統(tǒng)

發(fā)布時間:2021-07-10 14:25
  隨著信息產(chǎn)業(yè)的發(fā)展,手機普及到我們的生活之中。智能手機種類繁多,功能多樣,使得用戶在售前和售后過程中都會遇到許許多多的問題。企業(yè)一般通過設(shè)置客服系統(tǒng)結(jié)合人工客服來解決此類問題,這給企業(yè)帶來了巨大的成本壓力。傳統(tǒng)的客服系統(tǒng)只能提供預(yù)設(shè)好的問題供用戶選擇,無法很好的解決用戶的問題,此時就需要有一個可以真正理解用戶的問答系統(tǒng)來緩解此類問題。知識庫問答是指給定一段自然語言提問,利用多種方式語義分析,利用知識庫進行查詢推理從而得出答案的一種問答系統(tǒng)。近年來,雖然知識庫問答領(lǐng)域已經(jīng)取得了長足的發(fā)展,但是目前業(yè)界尚未研發(fā)出一套成熟的手機領(lǐng)域的問答系統(tǒng)。本文圍繞著手機領(lǐng)域,以命名實體識別為核心,設(shè)計并實現(xiàn)了一個知識庫問答系統(tǒng)。本文的主要工作有以下三個方面:第一,完成了手機領(lǐng)域的知識庫構(gòu)建:本文使用基于語法分析與句法分析的方法,結(jié)合一些外部數(shù)據(jù),實現(xiàn)了手機領(lǐng)域相關(guān)實體的抽取,主要包含手機屬性類實體,手機功能類實體,手機故障類實體,以及手機名稱實體幾大類。并將其存儲到了基于Hbase的實體庫之中。第二,實現(xiàn)了手機領(lǐng)域命名實體識別服務(wù)系統(tǒng):使用Bi-LSTM+CRF模型,結(jié)合挖掘到的實體庫進行語料回標,實現(xiàn)... 

【文章來源】:北京交通大學(xué)北京市 211工程院校 教育部直屬院校

【文章頁數(shù)】:90 頁

【學(xué)位級別】:碩士

【部分圖文】:

基于命名實體識別的手機領(lǐng)域知識庫問答系統(tǒng)


圖3-1本項目的用例圖??Figure?3-1?Use?Case?Diagram?of?the?Project??

功能圖,知識庫構(gòu)建,功能


聯(lián)網(wǎng)中獲取最新數(shù)據(jù),經(jīng)過實體抽取功能抽取出文本中包含的實體,將抽取到的實??體經(jīng)過組織整理,再建立索引以后,最后將存儲到知識庫之中。此功能的IPO圖??如圖3-2所示。??輸入?處理?輸出??原始網(wǎng)頁?j?1.?數(shù)據(jù)爬取?j原始網(wǎng)頁數(shù)據(jù)??2.?數(shù)據(jù)預(yù)處理?純文本數(shù)據(jù)??3.?實體抽取?實體??4.?數(shù)據(jù)格式化及存儲?實體庫??圖3-2知識庫構(gòu)建功能IPO圖??Figure?3-2?IPO?Diagram?of?Knowledge?Base?Building?Function??IPO圖中處理流程的需求描述如下:??(1)定期網(wǎng)頁數(shù)據(jù)獲取??網(wǎng)頁數(shù)據(jù)總是具有一定的時效性,例如手機產(chǎn)品每隔一段時間就會有所更新,??因此數(shù)據(jù)需要定期從網(wǎng)絡(luò)中獲取,本文獲取的數(shù)據(jù)主要用于解決系統(tǒng)需求。手機的??產(chǎn)品型號名稱等信息從中關(guān)村在線網(wǎng)站獲取。中關(guān)村在線囊括了幾乎市面上全部??手機、并且參數(shù)也較為詳細。功能和故障從某品牌的服務(wù)與支持系統(tǒng)、以及說明書??資料獲取,由于該服務(wù)與支持系統(tǒng)包含了用戶大量的提問與解決步驟。此外一些手??機論壇、評測網(wǎng)站也作為數(shù)據(jù)的重要來源。這些數(shù)據(jù)獲取下來以后需要以原始網(wǎng)頁??文本文件的形式分類進行存儲。?'??12??

識別功能,實體


聯(lián)網(wǎng)中獲取最新數(shù)據(jù),經(jīng)過實體抽取功能抽取出文本中包含的實體,將抽取到的實??體經(jīng)過組織整理,再建立索引以后,最后將存儲到知識庫之中。此功能的IPO圖??如圖3-2所示。??輸入?處理?輸出??原始網(wǎng)頁?j?1.?數(shù)據(jù)爬取?j原始網(wǎng)頁數(shù)據(jù)??2.?數(shù)據(jù)預(yù)處理?純文本數(shù)據(jù)??3.?實體抽取?實體??4.?數(shù)據(jù)格式化及存儲?實體庫??圖3-2知識庫構(gòu)建功能IPO圖??Figure?3-2?IPO?Diagram?of?Knowledge?Base?Building?Function??IPO圖中處理流程的需求描述如下:??(1)定期網(wǎng)頁數(shù)據(jù)獲取??網(wǎng)頁數(shù)據(jù)總是具有一定的時效性,例如手機產(chǎn)品每隔一段時間就會有所更新,??因此數(shù)據(jù)需要定期從網(wǎng)絡(luò)中獲取,本文獲取的數(shù)據(jù)主要用于解決系統(tǒng)需求。手機的??產(chǎn)品型號名稱等信息從中關(guān)村在線網(wǎng)站獲取。中關(guān)村在線囊括了幾乎市面上全部??手機、并且參數(shù)也較為詳細。功能和故障從某品牌的服務(wù)與支持系統(tǒng)、以及說明書??資料獲取,由于該服務(wù)與支持系統(tǒng)包含了用戶大量的提問與解決步驟。此外一些手??機論壇、評測網(wǎng)站也作為數(shù)據(jù)的重要來源。這些數(shù)據(jù)獲取下來以后需要以原始網(wǎng)頁??文本文件的形式分類進行存儲。?'??12??

【參考文獻】:
期刊論文
[1]基于表示學(xué)習(xí)的知識庫問答研究進展與展望[J]. 劉康,張元哲,紀國良,來斯惟,趙軍.  自動化學(xué)報. 2016(06)



本文編號:3276084

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3276084.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶f68b3***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com