基于命名實(shí)體識(shí)別的手機(jī)領(lǐng)域知識(shí)庫問答系統(tǒng)
發(fā)布時(shí)間:2021-07-10 14:25
隨著信息產(chǎn)業(yè)的發(fā)展,手機(jī)普及到我們的生活之中。智能手機(jī)種類繁多,功能多樣,使得用戶在售前和售后過程中都會(huì)遇到許許多多的問題。企業(yè)一般通過設(shè)置客服系統(tǒng)結(jié)合人工客服來解決此類問題,這給企業(yè)帶來了巨大的成本壓力。傳統(tǒng)的客服系統(tǒng)只能提供預(yù)設(shè)好的問題供用戶選擇,無法很好的解決用戶的問題,此時(shí)就需要有一個(gè)可以真正理解用戶的問答系統(tǒng)來緩解此類問題。知識(shí)庫問答是指給定一段自然語言提問,利用多種方式語義分析,利用知識(shí)庫進(jìn)行查詢推理從而得出答案的一種問答系統(tǒng)。近年來,雖然知識(shí)庫問答領(lǐng)域已經(jīng)取得了長足的發(fā)展,但是目前業(yè)界尚未研發(fā)出一套成熟的手機(jī)領(lǐng)域的問答系統(tǒng)。本文圍繞著手機(jī)領(lǐng)域,以命名實(shí)體識(shí)別為核心,設(shè)計(jì)并實(shí)現(xiàn)了一個(gè)知識(shí)庫問答系統(tǒng)。本文的主要工作有以下三個(gè)方面:第一,完成了手機(jī)領(lǐng)域的知識(shí)庫構(gòu)建:本文使用基于語法分析與句法分析的方法,結(jié)合一些外部數(shù)據(jù),實(shí)現(xiàn)了手機(jī)領(lǐng)域相關(guān)實(shí)體的抽取,主要包含手機(jī)屬性類實(shí)體,手機(jī)功能類實(shí)體,手機(jī)故障類實(shí)體,以及手機(jī)名稱實(shí)體幾大類。并將其存儲(chǔ)到了基于Hbase的實(shí)體庫之中。第二,實(shí)現(xiàn)了手機(jī)領(lǐng)域命名實(shí)體識(shí)別服務(wù)系統(tǒng):使用Bi-LSTM+CRF模型,結(jié)合挖掘到的實(shí)體庫進(jìn)行語料回標(biāo),實(shí)現(xiàn)...
【文章來源】:北京交通大學(xué)北京市 211工程院校 教育部直屬院校
【文章頁數(shù)】:90 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖3-1本項(xiàng)目的用例圖??Figure?3-1?Use?Case?Diagram?of?the?Project??
聯(lián)網(wǎng)中獲取最新數(shù)據(jù),經(jīng)過實(shí)體抽取功能抽取出文本中包含的實(shí)體,將抽取到的實(shí)??體經(jīng)過組織整理,再建立索引以后,最后將存儲(chǔ)到知識(shí)庫之中。此功能的IPO圖??如圖3-2所示。??輸入?處理?輸出??原始網(wǎng)頁?j?1.?數(shù)據(jù)爬取?j原始網(wǎng)頁數(shù)據(jù)??2.?數(shù)據(jù)預(yù)處理?純文本數(shù)據(jù)??3.?實(shí)體抽取?實(shí)體??4.?數(shù)據(jù)格式化及存儲(chǔ)?實(shí)體庫??圖3-2知識(shí)庫構(gòu)建功能IPO圖??Figure?3-2?IPO?Diagram?of?Knowledge?Base?Building?Function??IPO圖中處理流程的需求描述如下:??(1)定期網(wǎng)頁數(shù)據(jù)獲取??網(wǎng)頁數(shù)據(jù)總是具有一定的時(shí)效性,例如手機(jī)產(chǎn)品每隔一段時(shí)間就會(huì)有所更新,??因此數(shù)據(jù)需要定期從網(wǎng)絡(luò)中獲取,本文獲取的數(shù)據(jù)主要用于解決系統(tǒng)需求。手機(jī)的??產(chǎn)品型號(hào)名稱等信息從中關(guān)村在線網(wǎng)站獲取。中關(guān)村在線囊括了幾乎市面上全部??手機(jī)、并且參數(shù)也較為詳細(xì)。功能和故障從某品牌的服務(wù)與支持系統(tǒng)、以及說明書??資料獲取,由于該服務(wù)與支持系統(tǒng)包含了用戶大量的提問與解決步驟。此外一些手??機(jī)論壇、評(píng)測(cè)網(wǎng)站也作為數(shù)據(jù)的重要來源。這些數(shù)據(jù)獲取下來以后需要以原始網(wǎng)頁??文本文件的形式分類進(jìn)行存儲(chǔ)。?'??12??
聯(lián)網(wǎng)中獲取最新數(shù)據(jù),經(jīng)過實(shí)體抽取功能抽取出文本中包含的實(shí)體,將抽取到的實(shí)??體經(jīng)過組織整理,再建立索引以后,最后將存儲(chǔ)到知識(shí)庫之中。此功能的IPO圖??如圖3-2所示。??輸入?處理?輸出??原始網(wǎng)頁?j?1.?數(shù)據(jù)爬取?j原始網(wǎng)頁數(shù)據(jù)??2.?數(shù)據(jù)預(yù)處理?純文本數(shù)據(jù)??3.?實(shí)體抽取?實(shí)體??4.?數(shù)據(jù)格式化及存儲(chǔ)?實(shí)體庫??圖3-2知識(shí)庫構(gòu)建功能IPO圖??Figure?3-2?IPO?Diagram?of?Knowledge?Base?Building?Function??IPO圖中處理流程的需求描述如下:??(1)定期網(wǎng)頁數(shù)據(jù)獲取??網(wǎng)頁數(shù)據(jù)總是具有一定的時(shí)效性,例如手機(jī)產(chǎn)品每隔一段時(shí)間就會(huì)有所更新,??因此數(shù)據(jù)需要定期從網(wǎng)絡(luò)中獲取,本文獲取的數(shù)據(jù)主要用于解決系統(tǒng)需求。手機(jī)的??產(chǎn)品型號(hào)名稱等信息從中關(guān)村在線網(wǎng)站獲取。中關(guān)村在線囊括了幾乎市面上全部??手機(jī)、并且參數(shù)也較為詳細(xì)。功能和故障從某品牌的服務(wù)與支持系統(tǒng)、以及說明書??資料獲取,由于該服務(wù)與支持系統(tǒng)包含了用戶大量的提問與解決步驟。此外一些手??機(jī)論壇、評(píng)測(cè)網(wǎng)站也作為數(shù)據(jù)的重要來源。這些數(shù)據(jù)獲取下來以后需要以原始網(wǎng)頁??文本文件的形式分類進(jìn)行存儲(chǔ)。?'??12??
【參考文獻(xiàn)】:
期刊論文
[1]基于表示學(xué)習(xí)的知識(shí)庫問答研究進(jìn)展與展望[J]. 劉康,張?jiān)?紀(jì)國良,來斯惟,趙軍. 自動(dòng)化學(xué)報(bào). 2016(06)
本文編號(hào):3276084
【文章來源】:北京交通大學(xué)北京市 211工程院校 教育部直屬院校
【文章頁數(shù)】:90 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖3-1本項(xiàng)目的用例圖??Figure?3-1?Use?Case?Diagram?of?the?Project??
聯(lián)網(wǎng)中獲取最新數(shù)據(jù),經(jīng)過實(shí)體抽取功能抽取出文本中包含的實(shí)體,將抽取到的實(shí)??體經(jīng)過組織整理,再建立索引以后,最后將存儲(chǔ)到知識(shí)庫之中。此功能的IPO圖??如圖3-2所示。??輸入?處理?輸出??原始網(wǎng)頁?j?1.?數(shù)據(jù)爬取?j原始網(wǎng)頁數(shù)據(jù)??2.?數(shù)據(jù)預(yù)處理?純文本數(shù)據(jù)??3.?實(shí)體抽取?實(shí)體??4.?數(shù)據(jù)格式化及存儲(chǔ)?實(shí)體庫??圖3-2知識(shí)庫構(gòu)建功能IPO圖??Figure?3-2?IPO?Diagram?of?Knowledge?Base?Building?Function??IPO圖中處理流程的需求描述如下:??(1)定期網(wǎng)頁數(shù)據(jù)獲取??網(wǎng)頁數(shù)據(jù)總是具有一定的時(shí)效性,例如手機(jī)產(chǎn)品每隔一段時(shí)間就會(huì)有所更新,??因此數(shù)據(jù)需要定期從網(wǎng)絡(luò)中獲取,本文獲取的數(shù)據(jù)主要用于解決系統(tǒng)需求。手機(jī)的??產(chǎn)品型號(hào)名稱等信息從中關(guān)村在線網(wǎng)站獲取。中關(guān)村在線囊括了幾乎市面上全部??手機(jī)、并且參數(shù)也較為詳細(xì)。功能和故障從某品牌的服務(wù)與支持系統(tǒng)、以及說明書??資料獲取,由于該服務(wù)與支持系統(tǒng)包含了用戶大量的提問與解決步驟。此外一些手??機(jī)論壇、評(píng)測(cè)網(wǎng)站也作為數(shù)據(jù)的重要來源。這些數(shù)據(jù)獲取下來以后需要以原始網(wǎng)頁??文本文件的形式分類進(jìn)行存儲(chǔ)。?'??12??
聯(lián)網(wǎng)中獲取最新數(shù)據(jù),經(jīng)過實(shí)體抽取功能抽取出文本中包含的實(shí)體,將抽取到的實(shí)??體經(jīng)過組織整理,再建立索引以后,最后將存儲(chǔ)到知識(shí)庫之中。此功能的IPO圖??如圖3-2所示。??輸入?處理?輸出??原始網(wǎng)頁?j?1.?數(shù)據(jù)爬取?j原始網(wǎng)頁數(shù)據(jù)??2.?數(shù)據(jù)預(yù)處理?純文本數(shù)據(jù)??3.?實(shí)體抽取?實(shí)體??4.?數(shù)據(jù)格式化及存儲(chǔ)?實(shí)體庫??圖3-2知識(shí)庫構(gòu)建功能IPO圖??Figure?3-2?IPO?Diagram?of?Knowledge?Base?Building?Function??IPO圖中處理流程的需求描述如下:??(1)定期網(wǎng)頁數(shù)據(jù)獲取??網(wǎng)頁數(shù)據(jù)總是具有一定的時(shí)效性,例如手機(jī)產(chǎn)品每隔一段時(shí)間就會(huì)有所更新,??因此數(shù)據(jù)需要定期從網(wǎng)絡(luò)中獲取,本文獲取的數(shù)據(jù)主要用于解決系統(tǒng)需求。手機(jī)的??產(chǎn)品型號(hào)名稱等信息從中關(guān)村在線網(wǎng)站獲取。中關(guān)村在線囊括了幾乎市面上全部??手機(jī)、并且參數(shù)也較為詳細(xì)。功能和故障從某品牌的服務(wù)與支持系統(tǒng)、以及說明書??資料獲取,由于該服務(wù)與支持系統(tǒng)包含了用戶大量的提問與解決步驟。此外一些手??機(jī)論壇、評(píng)測(cè)網(wǎng)站也作為數(shù)據(jù)的重要來源。這些數(shù)據(jù)獲取下來以后需要以原始網(wǎng)頁??文本文件的形式分類進(jìn)行存儲(chǔ)。?'??12??
【參考文獻(xiàn)】:
期刊論文
[1]基于表示學(xué)習(xí)的知識(shí)庫問答研究進(jìn)展與展望[J]. 劉康,張?jiān)?紀(jì)國良,來斯惟,趙軍. 自動(dòng)化學(xué)報(bào). 2016(06)
本文編號(hào):3276084
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3276084.html
最近更新
教材專著