基于詞義相似度的文本推薦系統(tǒng)的研究與實(shí)現(xiàn)
本文關(guān)鍵詞:基于詞義相似度的文本推薦系統(tǒng)的研究與實(shí)現(xiàn)
更多相關(guān)文章: 文本推薦 詞義相似度 同義詞網(wǎng)絡(luò) 鏈路預(yù)測(cè) 推薦系統(tǒng)
【摘要】:隨著信息技術(shù)的不斷發(fā)展,由海量文本信息造成的“信息過(guò)載”現(xiàn)象越發(fā)嚴(yán)重,如何在海量數(shù)據(jù)中高效的獲取目標(biāo)文本成為了目前信息檢索領(lǐng)域的研究重點(diǎn);趦(nèi)容的文本推薦系統(tǒng)是指從用戶歷史閱讀文本信息中提取用戶興趣,然后以此為依據(jù)從文本庫(kù)中將用戶可能感興趣的文本推薦給用戶的一種個(gè)性化信息檢索系統(tǒng),相比于傳統(tǒng)搜索引擎,該系統(tǒng)能夠高效的滿足用戶對(duì)個(gè)性化信息的需求。但是目前常見(jiàn)的文本推薦算法僅考慮了特征詞詞形的嚴(yán)格匹配,未考慮語(yǔ)境對(duì)詞形的影響以及不同詞形之間的同義關(guān)系。針對(duì)該問(wèn)題,本文研究并實(shí)現(xiàn)了基于詞義相似度的文本推薦系統(tǒng)。本文的主要工作為:1.一般在向文本推薦引入同義關(guān)系時(shí),弱同義詞關(guān)系及多義詞關(guān)系會(huì)在計(jì)算用戶興趣和文檔特征相符程度過(guò)程中引入誤差,降低推薦效果,鑒于此,本文借鑒鏈路預(yù)測(cè)思想,從網(wǎng)絡(luò)結(jié)構(gòu)特征的角度優(yōu)化同義詞網(wǎng)絡(luò),提出了基于鏈路預(yù)測(cè)的強(qiáng)同義詞網(wǎng)絡(luò)獲取方法。2.在強(qiáng)同義詞網(wǎng)絡(luò)的基礎(chǔ)上,本文結(jié)合最短路徑、最優(yōu)匹配算法,在文本推薦中引入強(qiáng)同義詞關(guān)系,并應(yīng)用詞干提取技術(shù)消除不同語(yǔ)境對(duì)詞形的影響,提出了基于強(qiáng)同義詞網(wǎng)絡(luò)的文本推薦算法。3.以基于強(qiáng)同義詞網(wǎng)絡(luò)的文本推薦算法為核心,應(yīng)用IOCP通信模型、多客戶端多服務(wù)器C/S架構(gòu)、負(fù)載均衡等技術(shù)手段,本文設(shè)計(jì)并實(shí)現(xiàn)了基于詞義相似度的文本推薦系統(tǒng)。本文首先研究了信息檢索模型以及結(jié)構(gòu)化表示文本的方法,結(jié)合應(yīng)用需求選擇了合適的信息檢索模型與文檔預(yù)處理技術(shù);實(shí)現(xiàn)了基本的基于內(nèi)容的推薦方法及系統(tǒng);在此基礎(chǔ)上探究了在文本推薦算法中引入同義詞關(guān)系的途徑,鑒于弱同義詞關(guān)系以及多義詞關(guān)系對(duì)推薦系統(tǒng)的影響,本文從網(wǎng)絡(luò)結(jié)構(gòu)特征的角度借鑒鏈路預(yù)測(cè)的思想提出了強(qiáng)同義詞網(wǎng)絡(luò)的獲取方法;隨后以基于內(nèi)容的推薦算法為基礎(chǔ),提出了基于強(qiáng)同義詞網(wǎng)絡(luò)的文本推薦算法,通過(guò)仿真驗(yàn)證了其推薦效果的提升;最后以該算法為核心設(shè)計(jì)并實(shí)現(xiàn)了基于詞義相似度的文本推薦系統(tǒng)。
【關(guān)鍵詞】:文本推薦 詞義相似度 同義詞網(wǎng)絡(luò) 鏈路預(yù)測(cè) 推薦系統(tǒng)
【學(xué)位授予單位】:電子科技大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類(lèi)號(hào)】:TP391.3
【目錄】:
- 摘要5-6
- ABSTRACT6-13
- 第一章 緒論13-17
- 1.1 研究工作的背景與意義13-14
- 1.2 國(guó)內(nèi)外研究現(xiàn)狀14-15
- 1.3 論文的主要工作與結(jié)構(gòu)安排15-17
- 第二章 相關(guān)技術(shù)研究17-32
- 2.1 信息檢索模型與文本的結(jié)構(gòu)化表示17-21
- 2.1.1 信息檢索模型17-19
- 2.1.2 文本特征提取方法19-21
- 2.2 個(gè)性化推薦算法21-24
- 2.3 詞語(yǔ)語(yǔ)義相似度算法24-27
- 2.4 鏈路預(yù)測(cè)算法27-31
- 2.5 小結(jié)31-32
- 第三章 基于鏈路預(yù)測(cè)的強(qiáng)同義詞網(wǎng)絡(luò)獲取方法32-53
- 3.1 基于內(nèi)容的文本推薦方法存在的問(wèn)題32-33
- 3.2 強(qiáng)同義詞網(wǎng)絡(luò)獲取方法33-44
- 3.2.1 同義詞網(wǎng)絡(luò)構(gòu)建33-37
- 3.2.2 基本的強(qiáng)同義詞網(wǎng)絡(luò)獲取方法37-41
- 3.2.3 應(yīng)用迭代刪邊策略的強(qiáng)同義詞網(wǎng)絡(luò)獲取方法41-44
- 3.3 實(shí)驗(yàn)分析44-52
- 3.3.1 強(qiáng)同義詞網(wǎng)絡(luò)的評(píng)價(jià)指標(biāo)45-46
- 3.3.2 實(shí)驗(yàn)論證46-52
- 3.4 小結(jié)52-53
- 第四章 基于強(qiáng)同義詞網(wǎng)絡(luò)的文本推薦算法53-69
- 4.1 文本推薦系統(tǒng)方案53-55
- 4.1.1 文本預(yù)處理模塊53-54
- 4.1.2 用戶模型構(gòu)建模塊54-55
- 4.2 文本推薦算法55-62
- 4.2.1 詞干還原問(wèn)題57
- 4.2.2 基于強(qiáng)同義詞網(wǎng)絡(luò)的同義關(guān)系獲取方法57-59
- 4.2.3 特征向量間的同義關(guān)系強(qiáng)度衡量方法59-61
- 4.2.4 結(jié)合同義詞關(guān)系的向量相似度計(jì)算方法61-62
- 4.3 仿真分析62-68
- 4.3.1 推薦性能評(píng)價(jià)指標(biāo)62-63
- 4.3.2 仿真驗(yàn)證63-68
- 4.4 小結(jié)68-69
- 第五章 基于詞義相似度的文本推薦系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)69-79
- 5.1 基于詞義相似度的文本推薦系統(tǒng)的總體設(shè)計(jì)69-71
- 5.2 各模塊設(shè)計(jì)與實(shí)現(xiàn)71-77
- 5.2.1 界面層設(shè)計(jì)與實(shí)現(xiàn)71-72
- 5.2.2 通信層設(shè)計(jì)與實(shí)現(xiàn)72-75
- 5.2.3 業(yè)務(wù)層設(shè)計(jì)與實(shí)現(xiàn)75
- 5.2.4 數(shù)據(jù)層設(shè)計(jì)與實(shí)現(xiàn)75-76
- 5.2.5 支撐單元設(shè)計(jì)與實(shí)現(xiàn)76-77
- 5.3 系統(tǒng)展示77-78
- 5.4 小結(jié)78-79
- 第六章 總結(jié)與展望79-81
- 6.1 論文工作總結(jié)79
- 6.2 工作展望79-81
- 致謝81-82
- 參考文獻(xiàn)82-86
- 攻讀碩士學(xué)位期間取得的成果86-87
【共引文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 馬寧;劉怡君;;基于超網(wǎng)絡(luò)中超邊排序算法的網(wǎng)絡(luò)輿論領(lǐng)袖識(shí)別[J];系統(tǒng)工程;2013年09期
2 馬寶君;張楠;孫濤;;智慧城市背景下公眾反饋大數(shù)據(jù)分析:概率主題建模的視角[J];電子政務(wù);2013年12期
3 易軍凱;田立康;;基于類(lèi)別區(qū)分度的文本特征選擇算法研究[J];北京化工大學(xué)學(xué)報(bào)(自然科學(xué)版);2013年S1期
4 代寬;趙輝;韓冬;宋天勇;;基于向量空間模型的中文網(wǎng)頁(yè)主題特征項(xiàng)抽取[J];吉林大學(xué)學(xué)報(bào)(信息科學(xué)版);2014年01期
5 吳瑞紅;呂學(xué)強(qiáng);;基于互聯(lián)網(wǎng)的術(shù)語(yǔ)定義辨析[J];北京大學(xué)學(xué)報(bào)(自然科學(xué)版);2014年01期
6 羅琦;;一種最大分類(lèi)間隔SVDD的多類(lèi)文本分類(lèi)算法[J];電訊技術(shù);2014年04期
7 方躍勝;姚宏亮;;基于電力公司的多格式文檔智能信息檢索系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J];重慶科技學(xué)院學(xué)報(bào)(自然科學(xué)版);2014年04期
8 李超;李昂;朱耿良;;基于限制性玻爾茲曼機(jī)的微博主題分類(lèi)[J];電信網(wǎng)技術(shù);2014年07期
9 黃永鋒;李奇;;基于特征項(xiàng)聚合的古典詩(shī)歌分類(lèi)模型[J];東華大學(xué)學(xué)報(bào)(自然科學(xué)版);2014年05期
10 徐曉彤;胡松筠;;社交網(wǎng)站用戶興趣模型研究[J];科技和產(chǎn)業(yè);2014年11期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前1條
1 劉權(quán);郭武;;基于核主成分分析的話題跟蹤系統(tǒng)[A];第十二屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議(NCMMSC'2013)論文集[C];2013年
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 王寶勛;面向網(wǎng)絡(luò)社區(qū)問(wèn)答對(duì)的語(yǔ)義挖掘研究[D];哈爾濱工業(yè)大學(xué);2013年
2 張俊三;Web中相關(guān)實(shí)體發(fā)現(xiàn)研究[D];北京交通大學(xué);2013年
3 張乃靜;基于林業(yè)科學(xué)數(shù)據(jù)的語(yǔ)義檢索研究[D];中國(guó)林業(yè)科學(xué)研究院;2013年
4 劉瀏;基于內(nèi)容的重排列視頻檢索技術(shù)研究[D];上海交通大學(xué);2013年
5 呂英杰;網(wǎng)絡(luò)健康社區(qū)中的文本挖掘方法研究[D];上海交通大學(xué);2013年
6 張琦;基于聚合場(chǎng)模型的數(shù)據(jù)競(jìng)爭(zhēng)算法及其應(yīng)用研究[D];哈爾濱工程大學(xué);2013年
7 譚琦;面向跨領(lǐng)域文檔分類(lèi)的異構(gòu)遷移學(xué)習(xí)算法研究[D];華南理工大學(xué);2013年
8 張琳;基于引用聚類(lèi)的多文檔自動(dòng)文摘技術(shù)研究[D];大連海事大學(xué);2013年
9 蕭箏;客戶需求信息處理理論和方法研究[D];武漢理工大學(xué);2013年
10 張瑩;在線新聞評(píng)論的情感分析研究[D];南開(kāi)大學(xué);2013年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 謝娜娜;基于不均衡數(shù)據(jù)集的文本分類(lèi)算法研究[D];重慶大學(xué);2013年
2 王強(qiáng);非均衡文本分類(lèi)的特征選擇研究[D];南京師范大學(xué);2013年
3 項(xiàng)峻求;文本分類(lèi)在電子政務(wù)平臺(tái)中的應(yīng)用與研究[D];南昌大學(xué);2013年
4 余峰;項(xiàng)目評(píng)審專(zhuān)家推薦方法研究[D];昆明理工大學(xué);2013年
5 張睿;基于SVM的中文文本分類(lèi)相關(guān)算法研究與實(shí)現(xiàn)[D];昆明理工大學(xué);2013年
6 張健飛;子空間分類(lèi)算法研究及應(yīng)用[D];福建師范大學(xué);2013年
7 杜娟娟;主題爬蟲(chóng)算法的研究與實(shí)現(xiàn)[D];蘭州交通大學(xué);2013年
8 許鈺;基于半監(jiān)督SVM主動(dòng)學(xué)習(xí)的文本分類(lèi)算法研究[D];蘭州交通大學(xué);2013年
9 陳華城;基于本體的文檔敏感信息檢測(cè)關(guān)鍵技術(shù)研究[D];解放軍信息工程大學(xué);2013年
10 陳永光;基于OPAC的高校圖書(shū)館個(gè)性化圖書(shū)推薦算法研究[D];南京理工大學(xué);2013年
,本文編號(hào):894712
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/894712.html