天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

面向電商領(lǐng)域的智能問答系統(tǒng)若干關(guān)鍵技術(shù)研究

發(fā)布時(shí)間:2018-03-28 17:35

  本文選題:問答系統(tǒng) 切入點(diǎn):電子商務(wù) 出處:《華東師范大學(xué)》2016年博士論文


【摘要】:隨著互聯(lián)網(wǎng)和人工智能的飛速發(fā)展,智能問答系統(tǒng)由于能夠?yàn)橛脩籼峁┚珳?zhǔn)的答案和智能化的服務(wù)而成為目前的研究熱點(diǎn),它正逐步進(jìn)入商業(yè)化領(lǐng)域代替部分人工工作,電商領(lǐng)域服務(wù)正在從線下轉(zhuǎn)為線上,人工客服成本激增,智能問答系統(tǒng)可幫助節(jié)約80%的人工客服工作量。因此,研究電商領(lǐng)域的智能問答系統(tǒng)具有較大的應(yīng)用需求和實(shí)用價(jià)值。智能問答系統(tǒng)的核心就是理解用戶問題并給出正確的答案,基于結(jié)構(gòu)化數(shù)據(jù)問答系統(tǒng)是目前事實(shí)類問答的主流方法,然而,復(fù)雜豐富的專業(yè)詞匯、中文口語表達(dá)的弱語法性和多樣性,使得自然語言轉(zhuǎn)化成為邏輯查詢語言成為目前研究的難點(diǎn)。海量的知識(shí)是問答系統(tǒng)具有智能性的關(guān)鍵,然而,人工構(gòu)建大規(guī)模行業(yè)數(shù)據(jù)的代價(jià)很大,自動(dòng)化信息抽取的準(zhǔn)確率有限,存在語義模糊、數(shù)據(jù)缺失以及不確定性和矛盾性而且電商領(lǐng)域知識(shí)更新速度快,因此,快速準(zhǔn)確構(gòu)建語義關(guān)系豐富、表達(dá)清晰的大規(guī)模知識(shí)庫是目前的需求和難點(diǎn),高效的自學(xué)習(xí)能力是未來智能問答系統(tǒng)的發(fā)展趨勢。智能問答系統(tǒng)具有很強(qiáng)的領(lǐng)域相關(guān)性,結(jié)合領(lǐng)域特點(diǎn),增強(qiáng)對語義理解、知識(shí)表示和推理能力是提升領(lǐng)域問答系統(tǒng)效率的核心問題。本文針對電商領(lǐng)域的實(shí)際需求和目前存在的問題,在問句理解方面,實(shí)現(xiàn)了中文領(lǐng)域基于模板自動(dòng)生成的語義解析方法,并且在相關(guān)算法上進(jìn)行了改進(jìn);在知識(shí)庫構(gòu)建方面,提出了改進(jìn)的知識(shí)表示模型以及知識(shí)自動(dòng)融合和補(bǔ)全的方法,實(shí)現(xiàn)了電商領(lǐng)域更為精準(zhǔn)的并且支持推理、計(jì)算功能的智能問答系統(tǒng)。具體研究內(nèi)容如下:針對在問句理解和知識(shí)庫構(gòu)建時(shí)存在的別名、縮寫尤其是中英文混雜的商品領(lǐng)域名詞的問題,提出了基于CRF的實(shí)體識(shí)別算法,在電商領(lǐng)域標(biāo)題數(shù)據(jù)中訓(xùn)練,識(shí)別準(zhǔn)確率高達(dá)95%以上,并且提出了融入語義特征的CRF同義詞抽取算法,解決了由于中英文混合詞性標(biāo)注容易錯(cuò)誤引入噪聲等問題,提高了同義詞抽取的準(zhǔn)確性,實(shí)體識(shí)別和同義詞關(guān)系抽取是問句語義理解和知識(shí)庫構(gòu)建的重要基礎(chǔ)和關(guān)鍵技術(shù)。針對問句理解常用的模板法準(zhǔn)確率高,但是不能解析中文并且模板定義固定,不能處理同一語義不同表達(dá)的問句語義理解的問題,提出了中文問句模板自動(dòng)生成的語義解析方法,為了解決目前語義依存分析工具對于領(lǐng)域問句解析復(fù)雜化的問題,提出了依賴縮減的方法,準(zhǔn)確率提升了40%,并利用Word2vec語義特征對實(shí)體鏈接進(jìn)行改進(jìn),緩解在缺少領(lǐng)域數(shù)據(jù)詞典的情況下難以正確將多樣化表達(dá)與知識(shí)庫資源進(jìn)行語義鏈接的問題,CQPT算法較Baseline算法準(zhǔn)確率提升了近80%。針對目前知識(shí)庫中知識(shí)表示模式復(fù)雜、語義模糊、難以擴(kuò)展等問題,本文提出了歸納和演繹知識(shí)庫構(gòu)建框架,并將本體語義清晰嚴(yán)謹(jǐn)?shù)哪J胶椭R(shí)圖譜數(shù)據(jù)驅(qū)動(dòng)的特點(diǎn)相結(jié)合,提出了CyberSchema核心本體知識(shí)表示模型,內(nèi)核簡化、易于擴(kuò)展、領(lǐng)域無關(guān),提高了語義表達(dá)確定性和自動(dòng)化構(gòu)建效率,從模型上保證自動(dòng)問答系統(tǒng)準(zhǔn)確率和推理計(jì)算能力。由于知識(shí)庫數(shù)據(jù)來源于多個(gè)異構(gòu)網(wǎng)站,而且電商領(lǐng)域數(shù)據(jù)屬性深度深、格式復(fù)雜,多源異構(gòu)數(shù)據(jù)存在的屬性數(shù)據(jù)表示不統(tǒng)一、不確定和矛盾等問題,本文提出了基于圖模型的異構(gòu)知識(shí)融合算法,實(shí)現(xiàn)了基于詞形和語義的屬性模式匹配和基于數(shù)據(jù)源置信度最優(yōu)值決策算法,自動(dòng)生成統(tǒng)一、完備、準(zhǔn)確的CyberSchema商品屬性模式和實(shí)體屬性的最優(yōu)值。對于知識(shí)庫中蘊(yùn)含著大量的隱式關(guān)系,可以通過對知識(shí)庫自動(dòng)推理和預(yù)測獲得,本文結(jié)合張量分解和詞嵌入的優(yōu)點(diǎn),提出了基于張量和詞嵌入的知識(shí)補(bǔ)全算法,綜合利用知識(shí)庫本身的統(tǒng)計(jì)、語義等特性,對知識(shí)庫進(jìn)行統(tǒng)一模型表征,預(yù)測任意兩個(gè)實(shí)體間的具體關(guān)系類型,滿足問答系統(tǒng)邏輯推理和大規(guī)模知識(shí)庫進(jìn)化需求,算法能夠適合于本文提出的CyberSchema知識(shí)庫,效果達(dá)到最優(yōu)。最后,本文基于以上算法,提出了面向電商領(lǐng)域的中文智能問答系統(tǒng),分為語義理解、知識(shí)抽取、知識(shí)融合和知識(shí)補(bǔ)全四大模塊。提高了電商領(lǐng)域問答系統(tǒng)語義解析和專業(yè)術(shù)語識(shí)別的準(zhǔn)確性,有效提高了知識(shí)庫中細(xì)粒度知識(shí)表達(dá)的準(zhǔn)確性和一致性,支持統(tǒng)計(jì)、比較和推理的知識(shí)的問答,具有較大的研究及應(yīng)用價(jià)值。
[Abstract]:......
【學(xué)位授予單位】:華東師范大學(xué)
【學(xué)位級別】:博士
【學(xué)位授予年份】:2016
【分類號(hào)】:TP391.1

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 毛先領(lǐng);李曉明;;問答系統(tǒng)研究綜述[J];計(jì)算機(jī)科學(xué)與探索;2012年03期

2 莫麗萍,王樹西,姜吉發(fā),雷雨霞;問答系統(tǒng)和淺層結(jié)構(gòu)模式推理[J];廣西師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2004年01期

3 盧志堅(jiān),張冬茉;中文問答系統(tǒng)中的問句理解[J];計(jì)算機(jī)工程;2004年18期

4 王樹西;問答系統(tǒng):核心技術(shù)、發(fā)展趨勢[J];計(jì)算機(jī)工程與應(yīng)用;2005年18期

5 林曉慶;;問答系統(tǒng)中基于列表類問題的研究[J];電腦知識(shí)與技術(shù)(學(xué)術(shù)交流);2007年07期

6 張積賓;徐志明;王恒;潘啟樹;;面向大規(guī)模網(wǎng)絡(luò)數(shù)據(jù)的社會(huì)化問答系統(tǒng)[J];哈爾濱工業(yè)大學(xué)學(xué)報(bào);2008年12期

7 賈君枝;毛海飛;;漢語框架網(wǎng)絡(luò)問答系統(tǒng)問句處理研究[J];圖書情報(bào)工作;2008年10期

8 胡小華;劉軒;劉丹;陸偉;;基于冗余的仿真問答系統(tǒng)的輕量級局部文本分析[J];圖書情報(bào)知識(shí);2009年01期

9 張中峰;李秋丹;;社區(qū)問答系統(tǒng)研究綜述[J];計(jì)算機(jī)科學(xué);2010年11期

10 陳玉;;基于“為什么”問句的中文問答系統(tǒng)研究[J];農(nóng)業(yè)網(wǎng)絡(luò)信息;2010年11期

相關(guān)會(huì)議論文 前10條

1 何靖;陳,

本文編號(hào):1677343


資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/jingjilunwen/dianzishangwulunwen/1677343.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶d8f4f***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請E-mail郵箱bigeng88@qq.com