基于遺傳算法的語義特征提取研究
本文關鍵詞:基于遺傳算法的語義特征提取研究,由筆耕文化傳播整理發(fā)布。
【摘要】:互聯(lián)網上龐大的信息量使得人們很難從中找到所需的信息并進行有效的利用。目前基于關鍵字以及文本內容的搜索引擎已經成為了人們從互聯(lián)網獲取信息的一種十分重要的途徑,但是利用這種工具得到的搜索結果往往相關度較低,列出了很多無關的信息。對一個搜索引擎進行評價主要有搜索結果的精確度以及排序正確率兩個指標。其中搜索結果的準確率指的是搜索結果中與用戶的需求相符的信息的數(shù)量,這個數(shù)量越大則搜索結果的準確率越高,反之則較低。而搜索結果排序的正確率則指的是搜索結果的排序與用戶的需求程度是否呈正相關關系。為了使得搜索結果排序的正確率得到優(yōu)化,本文提出了一種基于遺傳算法的語義特征提取方法。本課題在介紹研究了語義搜索技術的基礎上,討論了傳統(tǒng)搜索技術的缺點和不足。從研究和設計的角度出發(fā),研究了一種基于遺傳算法的語義搜索算法。本文首先以二進制編碼作為本文的編碼方式生成種群的初始化特征值;然后采用降維作為語義特征分類的預處理方式,對種群里面的每個染色體適應度進行計算,本文的適應度函數(shù)采用分類準確率來評價單個個體值;最后對前面初始化種群采取種群中個體進行選擇算子、交叉算子、變異算子之后得到下一個優(yōu)化后的種群,終止判斷條件,輸出種群中適應度值最優(yōu)的染色體作為問題的滿意解或最優(yōu)解。通過對語義搜索的用戶行為模式研究,基于GA對SVM參數(shù)進行優(yōu)化的語義特征提取方法,構建出基于遺傳算法的語義搜索用戶交互模型,通過理論模型構建實驗方法來檢驗研究成果。
【關鍵詞】:遺傳算法 語義特征 特征提取 語義關聯(lián) 語義分析
【學位授予單位】:河北科技大學
【學位級別】:碩士
【學位授予年份】:2014
【分類號】:TP391.3;TP18
【目錄】:
- 摘要4-5
- Abstract5-8
- 第1章 緒論8-10
- 1.1 研究的目的及意義8
- 1.2 國內外現(xiàn)狀8-9
- 1.3 本文研究的主要內容9
- 1.4 論文組織結構9-10
- 第2章 數(shù)據挖掘技術10-22
- 2.1 數(shù)據挖掘技術的產生10-11
- 2.2 數(shù)據挖掘的概念11-12
- 2.3 相關理論與算法簡介12-20
- 2.3.1 SVM12-17
- 2.3.2 遺傳算法17-18
- 2.3.3 其他算法18-20
- 2.4 本章小結20-22
- 第3章 語義特征提取研究22-28
- 3.1 語義特征分析相關介紹22-23
- 3.2 語義特征提取23-25
- 3.3 語義特征提取相關算法分析25-27
- 3.4 本章小結27-28
- 第4章 基于遺傳算法的語義特征提取方法28-33
- 4.1 算法的主要問題28-29
- 4.2 算法過程29-32
- 4.3 本章小結32-33
- 第5章 基于遺傳算法的語義特征提取設計與實現(xiàn)33-55
- 5.1 設計思想33-37
- 5.1.1 開發(fā)工具33-35
- 5.1.2 特征提取與表達方法的設計35-37
- 5.2 實現(xiàn)過程37-54
- 5.2.1 文本分類語料庫的采集39-40
- 5.2.2 數(shù)據預處理40-42
- 5.2.3 特征提取和表達42-47
- 5.2.4 訓練過程47-48
- 5.2.5 測試過程48-49
- 5.2.6 實驗結果和性能評估49-54
- 5.3 本章小結54-55
- 結論55-57
- 附錄57-58
- 參考文獻58-61
- 致謝61-62
- 個人簡歷62
【參考文獻】
中國期刊全文數(shù)據庫 前9條
1 宋濤;施水才;房祥;呂學強;;基于改進的潛在語義分析的文本聚類[J];北京信息科技大學學報(自然科學版);2012年03期
2 牛東曉;劉達;陳廣娟;馮義;;基于遺傳優(yōu)化的支持向量機小時負荷滾動預測[J];電工技術學報;2007年06期
3 柳佳佳;葛文;;基于本體語義的地理信息服務發(fā)現(xiàn)[J];測繪工程;2013年06期
4 王立霞;淮曉永;;基于語義的中文文本關鍵詞提取算法[J];計算機工程;2012年01期
5 馬元良;裴生雷;;基于改進遺傳算法的SVM參數(shù)優(yōu)化研究[J];計算機仿真;2010年08期
6 趙文娟;劉忠寶;;基于語義理解的智能搜索引擎的研究[J];計算機與網絡;2012年01期
7 王亞輝;;基于遺傳算法的語義搜索結果排序算法[J];晉城職業(yè)技術學院學報;2013年01期
8 王晉;孫涌;王璁瑋;;基于領域本體的文本相似度算法[J];蘇州大學學報(工科版);2011年03期
9 何超;張玉峰;;融合領域本體的中文文本語義特征提取算法研究[J];情報理論與實踐;2013年09期
中國博士學位論文全文數(shù)據庫 前3條
1 梅翔;語義檢索中若干關鍵問題的研究[D];北京郵電大學;2007年
2 何嘉;基于遺傳算法優(yōu)化的中文分詞研究[D];電子科技大學;2012年
3 李朋杰;面向三維模型檢索的特征提取算法研究[D];北京郵電大學;2013年
中國碩士學位論文全文數(shù)據庫 前1條
1 曹道友;基于改進遺傳算法的應用研究[D];安徽大學;2010年
本文關鍵詞:基于遺傳算法的語義特征提取研究,,由筆耕文化傳播整理發(fā)布。
本文編號:299329
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/299329.html