天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 軟件論文 >

基于中文知識圖譜的電商領(lǐng)域問答算法設(shè)計與系統(tǒng)實現(xiàn)

發(fā)布時間:2017-05-15 19:08

  本文關(guān)鍵詞:基于中文知識圖譜的電商領(lǐng)域問答算法設(shè)計與系統(tǒng)實現(xiàn),,由筆耕文化傳播整理發(fā)布。


【摘要】:隨著互聯(lián)網(wǎng)語義數(shù)據(jù)的不斷產(chǎn)生和大規(guī)模積累,問答應(yīng)用因為可以提供給用戶智能的知識服務(wù)而受到青睞。典型地,基于知識圖譜的問答應(yīng)用不斷產(chǎn)生。然而,目前大多數(shù)問答系統(tǒng)和這些系統(tǒng)的研究都面向英文的,而中英文之間的語義表述區(qū)別很大,因此中文問答系統(tǒng)還存在很多新的挑戰(zhàn)。近年來,由于電子商務(wù)的快速發(fā)展和全面流行,直接推動了機器客服的龐大需求。本文從電子商務(wù)領(lǐng)域的角度出發(fā),針對用戶的多樣性和不確定性,對領(lǐng)域中文知識庫進行優(yōu)化,提出了一個基于中文知識圖譜的自動問答框架(CEQA),并嘗試提高用戶體驗和緩解人工客服的壓力。主要研究內(nèi)容如下:1.出于電子商務(wù)的特殊性考慮,提出了商品特征的條件隨機場實體識別算法,該算法能夠?qū)﹄娚汰h(huán)境下問句中品牌、型號和單品實體進行有效識別;2.針對用戶問句的多樣性和不確定性,本文引入依賴縮減算法,該算法利用語義依存分析和基于圖的縮減算法來降低用戶問句噪聲,從而提高語義解析的準確性;3.為了克服用戶表達的多樣性,即多詞一意現(xiàn)象,提出實體鏈接算法,該算法先對自然語言粗分類后混合word2vec相似特征排序,從而將問句解析結(jié)果以URL的形式鏈接到知識庫。實驗結(jié)果表明,在加入了實體識別,依賴縮減和鏈接后,提升了問答的準確性,并在開放的電商問答數(shù)據(jù)上得到了驗證。為驗證CEQA框架的可行性、運行效率和用戶友好等方面,本文設(shè)計并實現(xiàn)了一個問答系統(tǒng)(CEQA Live)。真實系統(tǒng)的良好運行,為框架的性能驗證提供了良好的環(huán)境,也證明本研究的應(yīng)用潛力。
【關(guān)鍵詞】:電子商務(wù) 知識圖譜 問答系統(tǒng) 問句多樣性 依賴縮減
【學(xué)位授予單位】:華東師范大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:TP311.52;TP391.1
【目錄】:
  • 摘要6-7
  • ABSTRACT7-12
  • 第一章 引言12-19
  • 1.1 研究背景與研究意義12-14
  • 1.2 國內(nèi)外研究現(xiàn)狀14-15
  • 1.3 現(xiàn)有研究的重點和難點15-17
  • 1.4 本文研究目標和內(nèi)容17-18
  • 1.5 本文的組織結(jié)構(gòu)18-19
  • 第二章 相關(guān)技術(shù)19-31
  • 2.1 實體識別技術(shù)19-21
  • 2.2 實體鏈接技術(shù)21-23
  • 2.3 語義提取技術(shù)23-26
  • 2.3.1 基于統(tǒng)計學(xué)習(xí)的語義提取技術(shù)23-24
  • 2.3.2 基于語法樹的語義提取技術(shù)24-25
  • 2.3.3 其它語義提取技術(shù)25
  • 2.3.4 各種語義提取技術(shù)對比分析25-26
  • 2.4 SPARQL技術(shù)26
  • 2.5 主流系統(tǒng)26-29
  • 2.5.1 IBM Watson26-28
  • 2.5.2 JIMI28-29
  • 2.6 CEQA框架與現(xiàn)有框架異同29-30
  • 2.7 本章小結(jié)30-31
  • 第三章 CEQA算法框架和基本模塊31-37
  • 3.1 CEQA算法框架結(jié)構(gòu)31-36
  • 3.1.1 問題分類器33-35
  • 3.1.2 SPARQL構(gòu)造35-36
  • 3.2 本章小結(jié)36-37
  • 第四章 CEQA識別、鏈接和依賴縮減算法37-52
  • 4.1 基于電商領(lǐng)域內(nèi)的實體識別算法37-40
  • 4.1.1 實體定義37-38
  • 4.1.2 模型與特征38-39
  • 4.1.3 算法與流程39-40
  • 4.2 基于Word2Vec的鏈接算法40-43
  • 4.2.1 Word2Vec訓(xùn)練41-42
  • 4.2.2 鏈接算法流程42-43
  • 4.3 基于語義依存分析的依賴縮減算法43-46
  • 4.4 實驗46-51
  • 4.4.1 實驗設(shè)計46-47
  • 4.4.2 實驗數(shù)據(jù)準備47-48
  • 4.4.3 實驗分析48-51
  • 4.5 本章小結(jié)51-52
  • 第五章 CEQA-Live系統(tǒng)實現(xiàn)52-60
  • 5.1 系統(tǒng)開發(fā)和部署環(huán)境52
  • 5.2 系統(tǒng)設(shè)計與實現(xiàn)52-56
  • 5.2.1 系統(tǒng)整體設(shè)計與方案52-53
  • 5.2.2 數(shù)據(jù)緩存的設(shè)計與實現(xiàn)53-54
  • 5.2.3 View層設(shè)計與實現(xiàn)54-55
  • 5.2.4 CEQA-Live-Service的設(shè)計與實現(xiàn)55-56
  • 5.3 系統(tǒng)性能分析56-57
  • 5.3.1 測試環(huán)境56
  • 5.3.2 性能指標56-57
  • 5.3.3 實驗及結(jié)果評價57
  • 5.4 系統(tǒng)結(jié)果展示57-59
  • 5.5 本章小結(jié)59-60
  • 第六章 總結(jié)和展望60-62
  • 6.1 本文工作總結(jié)60
  • 6.2 下一步工作和展望60-62
  • 參考文獻62-65
  • 附錄一65
  • 附錄二 作者攻讀碩士學(xué)位期間參與科研項目65-66
  • 后記66

【相似文獻】

中國期刊全文數(shù)據(jù)庫 前10條

1 毛先領(lǐng);李曉明;;問答系統(tǒng)研究綜述[J];計算機科學(xué)與探索;2012年03期

2 莫麗萍,王樹西,姜吉發(fā),雷雨霞;問答系統(tǒng)和淺層結(jié)構(gòu)模式推理[J];廣西師范大學(xué)學(xué)報(自然科學(xué)版);2004年01期

3 盧志堅,張冬茉;中文問答系統(tǒng)中的問句理解[J];計算機工程;2004年18期

4 王樹西;問答系統(tǒng):核心技術(shù)、發(fā)展趨勢[J];計算機工程與應(yīng)用;2005年18期

5 林曉慶;;問答系統(tǒng)中基于列表類問題的研究[J];電腦知識與技術(shù)(學(xué)術(shù)交流);2007年07期

6 張積賓;徐志明;王恒;潘啟樹;;面向大規(guī)模網(wǎng)絡(luò)數(shù)據(jù)的社會化問答系統(tǒng)[J];哈爾濱工業(yè)大學(xué)學(xué)報;2008年12期

7 賈君枝;毛海飛;;漢語框架網(wǎng)絡(luò)問答系統(tǒng)問句處理研究[J];圖書情報工作;2008年10期

8 胡小華;劉軒;劉丹;陸偉;;基于冗余的仿真問答系統(tǒng)的輕量級局部文本分析[J];圖書情報知識;2009年01期

9 張中峰;李秋丹;;社區(qū)問答系統(tǒng)研究綜述[J];計算機科學(xué);2010年11期

10 陳玉;;基于“為什么”問句的中文問答系統(tǒng)研究[J];農(nóng)業(yè)網(wǎng)絡(luò)信息;2010年11期

中國重要會議論文全文數(shù)據(jù)庫 前10條

1 何靖;陳

本文編號:368612


資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/368612.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶39d7c***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com