天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

面向領域的智能搜索研究

發(fā)布時間:2021-09-29 09:20
  進入信息時代后各個領域的數據出現了爆炸性的增長,高效的知識搜索和發(fā)現成為日益迫切的需要。在許多面向領域的搜索場景中,由于數據保密性的原因通用的搜索引擎沒有幫助,實現的搜索功能往往只是基于數據庫查詢的條件匹配,只能捕獲有限的查詢語句的語義信息。因此如何做到語義理解查詢語句以實現面向領域的智能搜索具有非常重要的意義。針對智能搜索中核心的查詢語句實體鏈接,傳統(tǒng)的方法都是先識別出語句中的命名實體,然后再鏈接到知識圖譜的實體,這需要大量的數據處理(如實體指稱標注)和特征選擇工作,而且容易造成錯誤累積,降低鏈接效果。針對這種情況,本文提出基于注意力機制的查詢語句實體鏈接模型。該模型使用雙向的長短期記憶網絡對問句進行編碼,經過注意力機制解碼,生成對應的實體指稱和消歧信息輸出,最后再鏈接到知識圖譜中的實體。在有關汽車領域車系產品問句和實體的數據集上進行實驗,結果表明該模型僅利用很少的上下文信息便取得良好的效果,為實體鏈接提供了新的思路。結合自然語言處理的知識圖譜、文本分類、實體鏈接、表示學習等技術,經過實踐和總結,本文提出了一種面向限定領域的智能搜索框架,該框架由網絡層、查詢語句分類層、實體鏈接層、服... 

【文章來源】:西南交通大學四川省 211工程院校 教育部直屬院校

【文章頁數】:72 頁

【學位級別】:碩士

【圖文】:

面向領域的智能搜索研究


Google知識圖譜輔助搜索

函數圖像,函數圖像


要介紹論文涉及到的相關知識和技術。理論介紹后文使用到的相關理論知識做一個簡要介紹,主要是涉及到識。函數數是模擬神經細胞在網絡中設置的非線性函數,如果沒有激活就是輸入的各維度特征乘以不同權值后的線性組合,其擬合能的激活函數主要包括 sigmoid、tanh 和 softmax 函數,這里將id 函數 函數是一種提出較早、目前廣泛使用的激活函數,在本文中中間隱藏層細胞的激活。其計算公式為:( )11zf ze =+如圖 2-1 所示,可以看到 sigmoid 函數值域為(0,1)。

函數圖像,函數圖像


圖 2-2 tanh 函數圖像ax 函數神經網絡多分類時,通常輸出層的激活函數選擇為 softmax 函數( )1jkzjKzkee == z 經元激活前的輸出,K 為輸出層神經元的數量。出,softmax 函數將原來的 K 維輸出歸一化,并且它們之和為作分類為 i 的得分或概率。函數數是評估算法預測值與實際值之間差別大小的方法,后文涉及ftmax 函數對應的多分類對數損失函數(Categorical Cross Ent( ), ,logi i j i jjL = t p數據點,j 表示類別,p 表示預測結果的得分,t 表示實際的得

【參考文獻】:
期刊論文
[1]基于詞向量的實體鏈接方法[J]. 齊愛芹,徐蔚然.  數據采集與處理. 2017(03)
[2]基于詞向量的中文微博實體鏈接方法[J]. 毛二松,王波,唐永旺,梁丹.  計算機應用與軟件. 2017(04)
[3]基于詞向量語義分類的微博實體鏈接方法[J]. 馮沖,石戈,郭宇航,龔靜,黃河燕.  自動化學報. 2016(06)
[4]一種基于概率主題模型的命名實體鏈接方法[J]. 懷寶興,寶騰飛,祝恒書,劉淇.  軟件學報. 2014(09)
[5]自然語言處理在信息檢索中的應用綜述[J]. 王燦輝,張敏,馬少平.  中文信息學報. 2007(02)



本文編號:3413466

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3413466.html


Copyright(c)文論論文網All Rights Reserved | 網站地圖 |

版權申明:資料由用戶98452***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com