天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 搜索引擎論文 >

基于搜索引擎的問答系統(tǒng)的設計與實現(xiàn)

發(fā)布時間:2020-10-15 07:11
   隨著互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展和普及,網(wǎng)絡已經(jīng)成為大部分人獲取信息和進行溝通的工具,其在豐富互聯(lián)網(wǎng)內(nèi)容、引導我們走向知識時代的同時,也使用戶陷入了信息困境。盡管傳統(tǒng)搜索引擎和現(xiàn)有的問答系統(tǒng)緩解了用戶需求和信息供應的矛盾,但一方面由于搜索引擎返回的結(jié)果為相關(guān)長文本的集合,用戶仍需要手動從中檢索出答案;另一方面現(xiàn)有中文問答系統(tǒng)大都基于知識庫實現(xiàn),需單獨構(gòu)建并維護異常龐大的知識庫。為了解決上述問題,本文設計并實現(xiàn)了一套面向開放領域的基于搜索引擎的問答系統(tǒng)。本系統(tǒng)劃分為Web服務端、問題分析、信息檢索、答案抽取、答案合并和答案排序六個模塊,其通過分析用戶查詢意圖,從搜索引擎返回的相關(guān)文本挖掘出候選答案集,并在對集合元素進行合并、排序后,返回置信度最高的答案。另外,本文針對問題分析、答案排序問題分別提出了基于多粒度詞嵌入表示的中文問題分類算法(Multi-granularity Embedding for Chinese Question Classification,MGE-CQC)和基于注意力的多粒度問答匹配算法(Multi-granularity Question Answering Matching with Attention,MQAMA)。MGE-CQC 通過先后對問題進行分詞、詞性標注、句法結(jié)構(gòu)分析以獲取問題的主謂賓等關(guān)鍵詞,從中挖掘出各粒度的連續(xù)特征,再將問句細粒度的向量表示逐層傳遞給粗粒度得到問句特征向量,最后通過softmax激活函數(shù)輸出問題類別;區(qū)別于MGE-CQC,MQAMA在特征工程階段直接求得各粒度下原生問句特征,再引入注意力機制區(qū)分開問題中每個詞、單字、部首的貢獻程度,逐層傳遞得到問答匹配的關(guān)聯(lián)向量表示,最后輸入到sigmoid函數(shù)得問答匹配程度。根據(jù)算法評估、系統(tǒng)測試結(jié)果,本文提出的問題分類、問答匹配算法有效提高了問答準確率,且系統(tǒng)的可用性也得到了驗證。
【學位單位】:北京郵電大學
【學位級別】:碩士
【學位年份】:2018
【中圖分類】:TP391.3
【部分圖文】:

序列,中文分詞,架構(gòu)


語言技術(shù)平臺(LanguageTechnology?Platform,LTP)是哈工大開發(fā)的一整套??基于XML文件的面向中文的綜合語言處理系統(tǒng),包括中文分詞、詞性標注、命??名實體識別、語法解析、詞義消歧、語義角色標注六大功能模塊,如圖2-1,下??文將詳細介紹前四個功能模塊。?________??DLL?AP!?I?We昭戶i耑?可衩化畀面??U_?J?\??—??L?_?—???.■?商法分析?語法分析廣?語義分析?'??::?丨??獻-?II!??語料庠??圖2-丨L.TP架構(gòu)圖??2.1.1中文分詞??中文分詞是指將某漢字序列切分為若千個詞,再將分好的詞按一定規(guī)則重組??成對應的詞序列的過程。一般中文分詞歸結(jié)為詞位分類問題,通常詞位信息分為??詞首(常記作B)、詞中(常記作M)、詞尾(常記作E)和單字詞(常記作S),??得到詞位分類結(jié)果后將13和£之間的字以及S單字構(gòu)成分詞結(jié)果。例如:“北京??郵電大學是哪年建校的’’經(jīng)過CRF得到標注序列“北/B京/M郵/M電/M大/M??學/E是/S哪/B年/E建/B校/E的/S”,從而得到對應詞序列“北京郵電大學/w〇??是/w;!?哪年/w^建校/w3的/uV’。??LTP分詞模塊是基于線性鏈條件隨機場(Conditional?Random?Field,?CRF)??模型W實現(xiàn)。通過計算給定漢字序列后對應詞序列的聯(lián)合概率分布,更符合中文??上下文關(guān)聯(lián)密切的特點

句法結(jié)構(gòu)


其基于分詞和詞性標注結(jié)果判斷詞與詞之間的依存關(guān)系,從而揭露其句??法結(jié)構(gòu),即識別出句子的“主謂賓”或“定狀補”。??例如:“我們應該抵制學術(shù)造假,恪守道德底線!钡木浞ㄒ来骊P(guān)系如圖2-2:?????一^??R〇〇t?我們應該?■鉢造■?.?m?11?m?.??圖2-2句法結(jié)構(gòu)分析舉例??從分析結(jié)果可看出主語是“我們”,而“造假”、“底線”分別是謂語“抵制”和“恪??守”的賓語,“造假”的修飾語是“學術(shù)”,“底線”的修飾語是“道德”。有了圖2-2句??法分析的結(jié)果,就可以清晰地看出“主謂賓”的語法結(jié)構(gòu)。其中關(guān)于圖中HED、??SBV等語法成分表示,參考表2-3。??表2-3依存句法分析標注??關(guān)系類型?|語法成分|?成分描述?舉例?^??主謂關(guān)系?SBV?主語-動詞?我送他一本書(我<-送)??動賓關(guān)系?VOB?直接賓語

網(wǎng)絡結(jié)構(gòu)圖,網(wǎng)絡結(jié)構(gòu),語法成分,修飾語


其基于分詞和詞性標注結(jié)果判斷詞與詞之間的依存關(guān)系,從而揭露其句??法結(jié)構(gòu),即識別出句子的“主謂賓”或“定狀補”。??例如:“我們應該抵制學術(shù)造假,恪守道德底線!钡木浞ㄒ来骊P(guān)系如圖2-2:?????一^??R〇〇t?我們應該?■鉢造■?.?m?11?m?.??圖2-2句法結(jié)構(gòu)分析舉例??從分析結(jié)果可看出主語是“我們”,而“造假”、“底線”分別是謂語“抵制”和“恪??守”的賓語,“造假”的修飾語是“學術(shù)”,“底線”的修飾語是“道德”。有了圖2-2句??法分析的結(jié)果,就可以清晰地看出“主謂賓”的語法結(jié)構(gòu)。其中關(guān)于圖中HED、??SBV等語法成分表示,參考表2-3。??表2-3依存句法分析標注??關(guān)系類型?|語法成分|?成分描述?舉例?^??主謂關(guān)系?SBV?主語-動詞?我送他一本書(我<-送)??動賓關(guān)系?VOB?直接賓語
【相似文獻】

相關(guān)期刊論文 前10條

1 任夢婷;王娟;阮佩姍;劉振盼;;影響高質(zhì)量網(wǎng)絡問答系統(tǒng)建設的因素[J];物流科技;2016年12期

2 武振國;李艷翠;;植物病蟲害智能問答系統(tǒng)設計與實現(xiàn)[J];農(nóng)業(yè)網(wǎng)絡信息;2017年01期

3 費建軍;;智能問答系統(tǒng)中命名實體識別問題研究[J];數(shù)字技術(shù)與應用;2017年07期

4 何秀;;智能問答系統(tǒng)的研究與設計[J];南方農(nóng)機;2017年20期

5 毛先領;李曉明;;問答系統(tǒng)研究綜述[J];計算機科學與探索;2012年03期

6 張中峰;李秋丹;;社區(qū)問答系統(tǒng)研究綜述[J];計算機科學;2010年11期

7 劉文華;康海燕;;領域問答系統(tǒng)生成器的研究[J];北京信息科技大學學報(自然科學版);2009年03期

8 張積賓;徐志明;王恒;潘啟樹;;面向大規(guī)模網(wǎng)絡數(shù)據(jù)的社會化問答系統(tǒng)[J];哈爾濱工業(yè)大學學報;2008年12期

9 龍新征;歐陽榮彬;彭一明;;高校移動智能問答系統(tǒng)設計與實現(xiàn)[J];中國教育網(wǎng)絡;2016年Z1期

10 王芳;滕桂法;趙洋;任力生;張玉新;馬建斌;;基于本體的農(nóng)業(yè)問答系統(tǒng)研究[J];農(nóng)機化研究;2009年01期


相關(guān)博士學位論文 前10條

1 張亮;面向開放域的中文問答系統(tǒng)問句處理相關(guān)技術(shù)研究[D];南京理工大學;2006年

2 王樹西;基于文本模式推理的問答系統(tǒng)研究[D];中國科學院研究生院(計算技術(shù)研究所);2005年

3 路遙;用戶交互式問答系統(tǒng)中問題推薦機制的研究[D];中國科學技術(shù)大學;2012年

4 廉鑫;社區(qū)問答系統(tǒng)中若干關(guān)鍵問題研究[D];南開大學;2014年

5 相洋;問答系統(tǒng)的答案優(yōu)化方法研究[D];哈爾濱工業(yè)大學;2017年

6 魏楚元;開放域問答系統(tǒng)問題理解關(guān)鍵技術(shù)研究[D];北京理工大學;2016年

7 宋萬鵬;短文本相似度計算在用戶交互式問答系統(tǒng)中的應用[D];中國科學技術(shù)大學;2010年

8 劉朝濤;中文問答系統(tǒng)中的句型理論及其應用研究[D];重慶大學;2010年

9 邸書靈;Agent聯(lián)盟和流形學習在中文問答系統(tǒng)中的應用研究[D];天津大學;2010年

10 王柳;基于服務規(guī)劃和數(shù)據(jù)預測的智能問答技術(shù)研究[D];北京理工大學;2016年


相關(guān)碩士學位論文 前10條

1 江龍泉;基于Attentive LSTM網(wǎng)絡模型的答案匹配技術(shù)的研究[D];上海師范大學;2018年

2 李東潮;基于深度學習算法的中文文本與SPARQL的轉(zhuǎn)換方法研究[D];電子科技大學;2018年

3 徐成章;基于Word2vec的中文Web智能問答系統(tǒng)的研究與設計[D];電子科技大學;2018年

4 曹燕;基于微服務架構(gòu)的企業(yè)智能問答系統(tǒng)的設計與實現(xiàn)[D];南京大學;2018年

5 張帥帥;基于閱讀理解的知識問答系統(tǒng)設計與實現(xiàn)[D];電子科技大學;2018年

6 張為明;基于深度學習和知識表示的問答系統(tǒng)的研究與實現(xiàn)[D];北京郵電大學;2018年

7 江樂;基于搜索引擎的問答系統(tǒng)的設計與實現(xiàn)[D];北京郵電大學;2018年

8 王英濤;基于深度學習的中文論述類問題智能問答系統(tǒng)的研究與實現(xiàn)[D];北京郵電大學;2018年

9 蔣成偉;無人機信息領域智能問答系統(tǒng)的研究與實現(xiàn)[D];北京郵電大學;2018年

10 李婕;面向短信營業(yè)廳的智能問答系統(tǒng)設計與實現(xiàn)[D];湖南大學;2016年



本文編號:2841871

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2841871.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶b5f72***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com