天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 搜索引擎論文 >

基于詞義相似度的文本推薦系統(tǒng)的研究與實現(xiàn)

發(fā)布時間:2017-09-21 13:08

  本文關(guān)鍵詞:基于詞義相似度的文本推薦系統(tǒng)的研究與實現(xiàn)


  更多相關(guān)文章: 文本推薦 詞義相似度 同義詞網(wǎng)絡(luò) 鏈路預測 推薦系統(tǒng)


【摘要】:隨著信息技術(shù)的不斷發(fā)展,由海量文本信息造成的“信息過載”現(xiàn)象越發(fā)嚴重,如何在海量數(shù)據(jù)中高效的獲取目標文本成為了目前信息檢索領(lǐng)域的研究重點。基于內(nèi)容的文本推薦系統(tǒng)是指從用戶歷史閱讀文本信息中提取用戶興趣,然后以此為依據(jù)從文本庫中將用戶可能感興趣的文本推薦給用戶的一種個性化信息檢索系統(tǒng),相比于傳統(tǒng)搜索引擎,該系統(tǒng)能夠高效的滿足用戶對個性化信息的需求。但是目前常見的文本推薦算法僅考慮了特征詞詞形的嚴格匹配,未考慮語境對詞形的影響以及不同詞形之間的同義關(guān)系。針對該問題,本文研究并實現(xiàn)了基于詞義相似度的文本推薦系統(tǒng)。本文的主要工作為:1.一般在向文本推薦引入同義關(guān)系時,弱同義詞關(guān)系及多義詞關(guān)系會在計算用戶興趣和文檔特征相符程度過程中引入誤差,降低推薦效果,鑒于此,本文借鑒鏈路預測思想,從網(wǎng)絡(luò)結(jié)構(gòu)特征的角度優(yōu)化同義詞網(wǎng)絡(luò),提出了基于鏈路預測的強同義詞網(wǎng)絡(luò)獲取方法。2.在強同義詞網(wǎng)絡(luò)的基礎(chǔ)上,本文結(jié)合最短路徑、最優(yōu)匹配算法,在文本推薦中引入強同義詞關(guān)系,并應用詞干提取技術(shù)消除不同語境對詞形的影響,提出了基于強同義詞網(wǎng)絡(luò)的文本推薦算法。3.以基于強同義詞網(wǎng)絡(luò)的文本推薦算法為核心,應用IOCP通信模型、多客戶端多服務器C/S架構(gòu)、負載均衡等技術(shù)手段,本文設(shè)計并實現(xiàn)了基于詞義相似度的文本推薦系統(tǒng)。本文首先研究了信息檢索模型以及結(jié)構(gòu)化表示文本的方法,結(jié)合應用需求選擇了合適的信息檢索模型與文檔預處理技術(shù);實現(xiàn)了基本的基于內(nèi)容的推薦方法及系統(tǒng);在此基礎(chǔ)上探究了在文本推薦算法中引入同義詞關(guān)系的途徑,鑒于弱同義詞關(guān)系以及多義詞關(guān)系對推薦系統(tǒng)的影響,本文從網(wǎng)絡(luò)結(jié)構(gòu)特征的角度借鑒鏈路預測的思想提出了強同義詞網(wǎng)絡(luò)的獲取方法;隨后以基于內(nèi)容的推薦算法為基礎(chǔ),提出了基于強同義詞網(wǎng)絡(luò)的文本推薦算法,通過仿真驗證了其推薦效果的提升;最后以該算法為核心設(shè)計并實現(xiàn)了基于詞義相似度的文本推薦系統(tǒng)。
【關(guān)鍵詞】:文本推薦 詞義相似度 同義詞網(wǎng)絡(luò) 鏈路預測 推薦系統(tǒng)
【學位授予單位】:電子科技大學
【學位級別】:碩士
【學位授予年份】:2015
【分類號】:TP391.3
【目錄】:
  • 摘要5-6
  • ABSTRACT6-13
  • 第一章 緒論13-17
  • 1.1 研究工作的背景與意義13-14
  • 1.2 國內(nèi)外研究現(xiàn)狀14-15
  • 1.3 論文的主要工作與結(jié)構(gòu)安排15-17
  • 第二章 相關(guān)技術(shù)研究17-32
  • 2.1 信息檢索模型與文本的結(jié)構(gòu)化表示17-21
  • 2.1.1 信息檢索模型17-19
  • 2.1.2 文本特征提取方法19-21
  • 2.2 個性化推薦算法21-24
  • 2.3 詞語語義相似度算法24-27
  • 2.4 鏈路預測算法27-31
  • 2.5 小結(jié)31-32
  • 第三章 基于鏈路預測的強同義詞網(wǎng)絡(luò)獲取方法32-53
  • 3.1 基于內(nèi)容的文本推薦方法存在的問題32-33
  • 3.2 強同義詞網(wǎng)絡(luò)獲取方法33-44
  • 3.2.1 同義詞網(wǎng)絡(luò)構(gòu)建33-37
  • 3.2.2 基本的強同義詞網(wǎng)絡(luò)獲取方法37-41
  • 3.2.3 應用迭代刪邊策略的強同義詞網(wǎng)絡(luò)獲取方法41-44
  • 3.3 實驗分析44-52
  • 3.3.1 強同義詞網(wǎng)絡(luò)的評價指標45-46
  • 3.3.2 實驗論證46-52
  • 3.4 小結(jié)52-53
  • 第四章 基于強同義詞網(wǎng)絡(luò)的文本推薦算法53-69
  • 4.1 文本推薦系統(tǒng)方案53-55
  • 4.1.1 文本預處理模塊53-54
  • 4.1.2 用戶模型構(gòu)建模塊54-55
  • 4.2 文本推薦算法55-62
  • 4.2.1 詞干還原問題57
  • 4.2.2 基于強同義詞網(wǎng)絡(luò)的同義關(guān)系獲取方法57-59
  • 4.2.3 特征向量間的同義關(guān)系強度衡量方法59-61
  • 4.2.4 結(jié)合同義詞關(guān)系的向量相似度計算方法61-62
  • 4.3 仿真分析62-68
  • 4.3.1 推薦性能評價指標62-63
  • 4.3.2 仿真驗證63-68
  • 4.4 小結(jié)68-69
  • 第五章 基于詞義相似度的文本推薦系統(tǒng)的設(shè)計與實現(xiàn)69-79
  • 5.1 基于詞義相似度的文本推薦系統(tǒng)的總體設(shè)計69-71
  • 5.2 各模塊設(shè)計與實現(xiàn)71-77
  • 5.2.1 界面層設(shè)計與實現(xiàn)71-72
  • 5.2.2 通信層設(shè)計與實現(xiàn)72-75
  • 5.2.3 業(yè)務層設(shè)計與實現(xiàn)75
  • 5.2.4 數(shù)據(jù)層設(shè)計與實現(xiàn)75-76
  • 5.2.5 支撐單元設(shè)計與實現(xiàn)76-77
  • 5.3 系統(tǒng)展示77-78
  • 5.4 小結(jié)78-79
  • 第六章 總結(jié)與展望79-81
  • 6.1 論文工作總結(jié)79
  • 6.2 工作展望79-81
  • 致謝81-82
  • 參考文獻82-86
  • 攻讀碩士學位期間取得的成果86-87

【共引文獻】

中國期刊全文數(shù)據(jù)庫 前10條

1 馬寧;劉怡君;;基于超網(wǎng)絡(luò)中超邊排序算法的網(wǎng)絡(luò)輿論領(lǐng)袖識別[J];系統(tǒng)工程;2013年09期

2 馬寶君;張楠;孫濤;;智慧城市背景下公眾反饋大數(shù)據(jù)分析:概率主題建模的視角[J];電子政務;2013年12期

3 易軍凱;田立康;;基于類別區(qū)分度的文本特征選擇算法研究[J];北京化工大學學報(自然科學版);2013年S1期

4 代寬;趙輝;韓冬;宋天勇;;基于向量空間模型的中文網(wǎng)頁主題特征項抽取[J];吉林大學學報(信息科學版);2014年01期

5 吳瑞紅;呂學強;;基于互聯(lián)網(wǎng)的術(shù)語定義辨析[J];北京大學學報(自然科學版);2014年01期

6 羅琦;;一種最大分類間隔SVDD的多類文本分類算法[J];電訊技術(shù);2014年04期

7 方躍勝;姚宏亮;;基于電力公司的多格式文檔智能信息檢索系統(tǒng)的設(shè)計與實現(xiàn)[J];重慶科技學院學報(自然科學版);2014年04期

8 李超;李昂;朱耿良;;基于限制性玻爾茲曼機的微博主題分類[J];電信網(wǎng)技術(shù);2014年07期

9 黃永鋒;李奇;;基于特征項聚合的古典詩歌分類模型[J];東華大學學報(自然科學版);2014年05期

10 徐曉彤;胡松筠;;社交網(wǎng)站用戶興趣模型研究[J];科技和產(chǎn)業(yè);2014年11期

中國重要會議論文全文數(shù)據(jù)庫 前1條

1 劉權(quán);郭武;;基于核主成分分析的話題跟蹤系統(tǒng)[A];第十二屆全國人機語音通訊學術(shù)會議(NCMMSC'2013)論文集[C];2013年

中國博士學位論文全文數(shù)據(jù)庫 前10條

1 王寶勛;面向網(wǎng)絡(luò)社區(qū)問答對的語義挖掘研究[D];哈爾濱工業(yè)大學;2013年

2 張俊三;Web中相關(guān)實體發(fā)現(xiàn)研究[D];北京交通大學;2013年

3 張乃靜;基于林業(yè)科學數(shù)據(jù)的語義檢索研究[D];中國林業(yè)科學研究院;2013年

4 劉瀏;基于內(nèi)容的重排列視頻檢索技術(shù)研究[D];上海交通大學;2013年

5 呂英杰;網(wǎng)絡(luò)健康社區(qū)中的文本挖掘方法研究[D];上海交通大學;2013年

6 張琦;基于聚合場模型的數(shù)據(jù)競爭算法及其應用研究[D];哈爾濱工程大學;2013年

7 譚琦;面向跨領(lǐng)域文檔分類的異構(gòu)遷移學習算法研究[D];華南理工大學;2013年

8 張琳;基于引用聚類的多文檔自動文摘技術(shù)研究[D];大連海事大學;2013年

9 蕭箏;客戶需求信息處理理論和方法研究[D];武漢理工大學;2013年

10 張瑩;在線新聞評論的情感分析研究[D];南開大學;2013年

中國碩士學位論文全文數(shù)據(jù)庫 前10條

1 謝娜娜;基于不均衡數(shù)據(jù)集的文本分類算法研究[D];重慶大學;2013年

2 王強;非均衡文本分類的特征選擇研究[D];南京師范大學;2013年

3 項峻求;文本分類在電子政務平臺中的應用與研究[D];南昌大學;2013年

4 余峰;項目評審專家推薦方法研究[D];昆明理工大學;2013年

5 張睿;基于SVM的中文文本分類相關(guān)算法研究與實現(xiàn)[D];昆明理工大學;2013年

6 張健飛;子空間分類算法研究及應用[D];福建師范大學;2013年

7 杜娟娟;主題爬蟲算法的研究與實現(xiàn)[D];蘭州交通大學;2013年

8 許鈺;基于半監(jiān)督SVM主動學習的文本分類算法研究[D];蘭州交通大學;2013年

9 陳華城;基于本體的文檔敏感信息檢測關(guān)鍵技術(shù)研究[D];解放軍信息工程大學;2013年

10 陳永光;基于OPAC的高校圖書館個性化圖書推薦算法研究[D];南京理工大學;2013年

,

本文編號:894712

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/894712.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶21bfd***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com