搜索引擎設(shè)計(jì)分析與結(jié)果聚類改進(jìn).pdf 免費(fèi)在線閱讀前50頁(yè)
本文關(guān)鍵詞:搜索引擎設(shè)計(jì)分析與結(jié)果聚類改進(jìn),由筆耕文化傳播整理發(fā)布。
文檔介紹:
分類號(hào)uDc注!密級(jí)學(xué)位論文搜索引擎設(shè)計(jì)分析與結(jié)果聚類改進(jìn)(題名和副題名)董祥千(作者姓名)指導(dǎo)教師姓名左志宏苗啦數(shù)授電壬科撞太堂送鰲(職務(wù)、職稱、學(xué)位、單位名稱及地址)申請(qǐng)專業(yè)學(xué)位級(jí)別碩士專業(yè)名稱計(jì)算機(jī)軟件與理論論文提交日期 2006.12 論文答辯日期 2007.1學(xué)位授予單位和日期電壬抖技太堂答辯委員會(huì)主席要壅絲.評(píng)閱人碑熬 i尊芝品2006年,乒月驢日注1:注明《國(guó)際十進(jìn)分類法uDC》的類號(hào)。摘要摘要搜索引擎是獲取信息的有效工具,設(shè)計(jì)與實(shí)現(xiàn)搜索引擎是一項(xiàng)龐大的工程,要運(yùn)用較多專業(yè)技術(shù)知識(shí)。本文力圖通過(guò)實(shí)例分析,介紹搜索引擎的設(shè)計(jì)、實(shí)現(xiàn)、搜索結(jié)果聚類及其它與搜索引擎緊密相關(guān)的知識(shí)。文中指出了搜索引擎在提取摘要信息上存在的不足:僅選取關(guān)鍵詞臨近區(qū)域的語(yǔ)詞并不具語(yǔ)義特征,為此提出了以文本的語(yǔ)義特征詞來(lái)替換摘要信息。文中同時(shí)對(duì)語(yǔ)義特征詞的提取進(jìn)行了理論分析,并實(shí)現(xiàn)了部分功能。本文利用后綴數(shù)組來(lái)提取文檔的語(yǔ)義特征詞,因此對(duì)后綴數(shù)組的結(jié)構(gòu)作了詳細(xì)的闡述,提出以完全子串來(lái)表示文檔的語(yǔ)義特征。文中實(shí)現(xiàn)了后綴數(shù)組的構(gòu)造,左、右完全子串及完全子串的提取。本文還對(duì)搜索引擎的聚類過(guò)程、以及常用的聚類算法進(jìn)行了比較,并對(duì)基于奇異值分解的文本聚類算法一L...
內(nèi)容來(lái)自轉(zhuǎn)載請(qǐng)標(biāo)明出處.
本文關(guān)鍵詞:搜索引擎設(shè)計(jì)分析與結(jié)果聚類改進(jìn),,由筆耕文化傳播整理發(fā)布。
本文編號(hào):116334
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/116334.html