天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 搜索引擎論文 >

面向檢索信息的同義詞挖掘

發(fā)布時(shí)間:2021-01-20 09:19
  隨著計(jì)算機(jī)技術(shù)的飛速發(fā)展,搜索引擎的應(yīng)用深入到各行各業(yè),使用搜索引擎對(duì)信息進(jìn)行檢索已經(jīng)深入到人民群眾的日常生活當(dāng)中,信息的查找與獲取變得越來越頻繁的同時(shí),信息的精準(zhǔn)查找與獲取也越來越有挑戰(zhàn)性。如何從浩如煙海的信息資源庫中,更加準(zhǔn)確的理解用戶想要搜索的關(guān)鍵詞,使得關(guān)鍵詞搜索內(nèi)容能夠得到拓展和更加準(zhǔn)確的推薦,是信息檢索領(lǐng)域一直以來的重要研究課題。傳統(tǒng)的信息檢索服務(wù)已漸漸不能滿足用戶的檢索需求,智能的、基于概念的信息檢索系統(tǒng)成為未來的發(fā)展方向。識(shí)別用戶搜索關(guān)鍵詞的可替代同義詞是實(shí)現(xiàn)智能信息檢索的重要方法之一,而要實(shí)現(xiàn)高效的同義詞拓展,就需要一個(gè)強(qiáng)大的同義詞表。本文中定義的同義詞,是在相似的上下文語境中可以相互替代的詞。隨著時(shí)代的變化,語言的應(yīng)用日新月異,使用傳統(tǒng)的同義詞詞典查詢的方法對(duì)同義詞進(jìn)行判別或者發(fā)現(xiàn)已完全不適用。使用更加智能的方法進(jìn)行同義詞挖掘,找到新的同義詞表勢(shì)在必行。近年來,隨著自然語言處理技術(shù)的進(jìn)步,關(guān)于同義詞的研究越來越多,需要用到同義詞的領(lǐng)域涉及方方面面,研究者們提出了眾多先進(jìn)的配對(duì)同義詞辨析和基于語料庫的同義詞集提取方法。本文面向檢索信息進(jìn)行同義詞挖掘,與使用基于特定業(yè)務(wù)... 

【文章來源】:電子科技大學(xué)四川省 211工程院校 985工程院校 教育部直屬院校

【文章頁數(shù)】:78 頁

【學(xué)位級(jí)別】:碩士

【文章目錄】:
摘要
ABSTRACT
第一章 緒論
    1.1 研究工作的背景
    1.2 本文研究的目的與意義
    1.3 國內(nèi)外研究歷史與現(xiàn)狀
    1.4 本文章節(jié)編排
第二章 相關(guān)研究
    2.1 同義詞識(shí)別的概念
    2.2 同義詞識(shí)別的分類
    2.3 漢語同義詞識(shí)別算法研究
        2.3.1 基于字面的相似度算法
        2.3.2 基于Ontology(世界知識(shí))的相似度算法
        2.3.3 基于圖模型的同義詞集抽取算法
    2.4 詞向量
        2.4.1 詞向量的理解
    2.5 XGBoost模型
第三章 數(shù)據(jù)處理及對(duì)齊規(guī)則設(shè)計(jì)
    3.1 同義詞挖掘具體實(shí)現(xiàn)流程
    3.2 數(shù)據(jù)預(yù)處理
        3.2.1 數(shù)據(jù)提取
    3.3 對(duì)齊規(guī)則設(shè)計(jì)
        3.3.1 對(duì)齊的概念
        3.3.2 規(guī)則對(duì)齊
        3.3.3 統(tǒng)計(jì)對(duì)齊
        3.3.4 短語對(duì)抽取
第四章 特征工程及模型訓(xùn)練
    4.1 特征工程
        4.1.1 統(tǒng)計(jì)特征提取
        4.1.2 詞向量特征提取
        4.1.3 特征篩選
    4.2 模型訓(xùn)練及調(diào)參
    4.3 基于領(lǐng)域文章檢索數(shù)據(jù)的同義詞挖掘應(yīng)用拓展
        4.3.1 候選對(duì)提取
        4.3.2 詞對(duì)清洗
        4.3.3 特征工程
        4.3.4 模型訓(xùn)練
第五章 實(shí)驗(yàn)與分析
    5.1 實(shí)驗(yàn)結(jié)果
        5.1.1 對(duì)比實(shí)驗(yàn)一
        5.1.2 方法及調(diào)參實(shí)驗(yàn)
        5.1.3 對(duì)比實(shí)驗(yàn)二
        5.1.4 查詢小界面
        5.1.5 本章小節(jié)
第六章 總結(jié)與展望
致謝
參考文獻(xiàn)
攻讀碩士學(xué)位期間取得的成果


【參考文獻(xiàn)】:
期刊論文
[1]中文短文本聚合模型研究[J]. 劉震,陳晶,鄭建賓,華錦芝,肖淋峰.  軟件學(xué)報(bào). 2017(10)
[2]微博文本聚類中特征擴(kuò)展策略研究[J]. 段旭磊,張仰森,郭正斌.  計(jì)算機(jī)工程與應(yīng)用. 2017(13)
[3]基于路徑與深度的同義詞詞林詞語相似度計(jì)算[J]. 陳宏朝,李飛,朱新華,馬潤(rùn)聰.  中文信息學(xué)報(bào). 2016(05)
[4]詞匯相似度計(jì)算和相似詞挖掘研究進(jìn)展[J]. 韓普,王東波,王子敏.  情報(bào)科學(xué). 2016(09)
[5]基于知網(wǎng)與詞林的詞語語義相似度計(jì)算[J]. 朱新華,馬潤(rùn)聰,孫柳,陳宏朝.  中文信息學(xué)報(bào). 2016(04)
[6]產(chǎn)品評(píng)論挖掘中特征同義詞的識(shí)別[J]. 郗亞輝.  中文信息學(xué)報(bào). 2016(04)
[7]基于復(fù)雜網(wǎng)絡(luò)的漢語相似詞挖掘和相似度計(jì)算研究[J]. 韓普,王東波,朱恒民.  情報(bào)學(xué)報(bào). 2015 (08)
[8]基于詞向量距離的相關(guān)詞變遷研究——以《情報(bào)探索》雜志摘要為例[J]. 方延風(fēng),陳健.  情報(bào)探索. 2015(04)
[9]多策略同義詞獲取方法研究[J]. 宋文杰,顧彥慧,周俊生,孫玉杰,嚴(yán)杰,曲維光.  北京大學(xué)學(xué)報(bào)(自然科學(xué)版). 2015(02)
[10]基于維基語義圖的詞語語義相關(guān)度計(jì)算研究[J]. 劉曉亮.  情報(bào)學(xué)報(bào). 2014 (11)

碩士論文
[1]基于搜索日志和點(diǎn)擊日志的同義詞挖掘的研究和實(shí)現(xiàn)[D]. 宋宇軒.北京交通大學(xué) 2011
[2]基于百科詞典的知識(shí)獲取系統(tǒng)的研究與實(shí)現(xiàn)[D]. 許勇.北京工業(yè)大學(xué) 2001
[3]智能搜索引擎中的同義詞識(shí)別算法研究[D]. 朱毅華.南京農(nóng)業(yè)大學(xué) 2001



本文編號(hào):2988786

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2988786.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶a79f0***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com