基于NLP技術(shù)和相似度計算的智能搜索引擎研究
[Abstract]:Aiming at the problems of traditional search engines in natural language understanding, a new model of intelligent search engine based on natural language processing technology and similarity calculation is studied in this paper. Its core technology is based on the natural language processing of Chinese word segmentation technology, semantic similarity and opposites and other theories, combining these concepts theory, from the perspective of user habits, Combined with DotLucene open source full-text search engine to establish an intelligent search engine. The results show that the model has an accuracy of 86.1% for the documents that have been included. The intelligent search engine has a good understanding of the query statements and can answer the user's questions correctly.
【作者單位】: 桂林理工大學信息科學與工程學院;太原科技大學機械電子工程學院;莫納什大學管理學院;利物浦大學計算機科學系;西交利物浦大學計算機科學與軟件工程系;
【基金】:廣西自然科學基金資助項目(桂科自0991254)
【分類號】:TP391.3
【參考文獻】
相關(guān)期刊論文 前1條
1 李占波;廖繼東;李華;;基于DotLucene的垂直搜索引擎的研究[J];微計算機信息;2007年24期
相關(guān)碩士學位論文 前1條
1 陳魁;智能搜索引擎系統(tǒng)的分析設(shè)計與開發(fā)[D];大連理工大學;2004年
【共引文獻】
相關(guān)碩士學位論文 前1條
1 申峰;元數(shù)據(jù)技術(shù)在數(shù)字圖書館建設(shè)中的探索及應(yīng)用[D];長春理工大學;2007年
【二級參考文獻】
相關(guān)期刊論文 前10條
1 尤f ,李涓子,王作英;基于《知網(wǎng)》的中文信息結(jié)構(gòu)抽取研究[J];計算機工程與應(yīng)用;2002年18期
2 杜阿寧,方濱興,胡銘曾,云曉春;中文交互式網(wǎng)絡(luò)搜索引擎及其自學習能力[J];計算機工程與應(yīng)用;2003年10期
3 周強,馮松巖;構(gòu)建知網(wǎng)關(guān)系的網(wǎng)狀表示[J];中文信息學報;2000年06期
4 胡俊峰 ,俞士汶;唐宋詩中詞匯語義相似度的統(tǒng)計分析及應(yīng)用[J];中文信息學報;2002年04期
5 閆翔,陳遠;中文智能搜索引擎現(xiàn)狀探析[J];情報科學;2002年12期
6 李瑋,李利;Web搜索引擎與全文檢索技術(shù)[J];情報科學;2003年05期
7 邱均平;余以勝;;基于知識庫系統(tǒng)的智能搜索引擎研究[J];情報科學;2006年03期
8 韓圣龍;網(wǎng)絡(luò)信息檢索工具評價指標[J];情報學報;2001年04期
9 曹素華;Internet搜索引擎漫談[J];山東圖書館季刊;2001年03期
10 李琳;搜索引擎信息檢索功能與檢索技巧[J];圖書館建設(shè);2000年06期
相關(guān)碩士學位論文 前2條
1 段恩澤;基于統(tǒng)計的漢語自動分詞系統(tǒng)[D];電子科技大學;2005年
2 南鉉國;基于語句相似度計算的主觀題自動評分技術(shù)研究[D];延邊大學;2007年
【相似文獻】
相關(guān)期刊論文 前10條
1 焦慶爭;蔚承建;;一種可靠信任推薦文本分類特征權(quán)重算法[J];計算機應(yīng)用研究;2010年02期
2 ;《中文信息學報》征稿簡則[J];中文信息學報;2010年02期
3 ;2010國際信息技術(shù)與應(yīng)用論壇征稿啟事[J];計算機研究與發(fā)展;2010年02期
4 趙敏涯;;結(jié)合語言模型的自動文本分類的應(yīng)用研究[J];計算機與現(xiàn)代化;2010年03期
5 彭煒明;宋繼華;;《資治通鑒》歷史領(lǐng)域本體構(gòu)建及其應(yīng)用研究[J];中文信息學報;2010年02期
6 鄭魁;疏學明;袁宏永;;網(wǎng)絡(luò)輿情熱點信息自動發(fā)現(xiàn)方法[J];計算機工程;2010年03期
7 馬連剛;夏克儉;;中醫(yī)方劑與圖集的轉(zhuǎn)換的設(shè)計與實現(xiàn)[J];網(wǎng)絡(luò)安全技術(shù)與應(yīng)用;2010年02期
8 諶志群;;文本趨勢挖掘綜述[J];情報科學;2010年02期
9 丁晟春;劉逶迤;熊霞;梅健;;基于領(lǐng)域本體和語塊分析的信息抽取的研究與實現(xiàn)[J];情報學報;2010年01期
10 王磊;周寬久;仇鵬;;領(lǐng)域本體自動構(gòu)建研究[J];情報學報;2010年01期
相關(guān)會議論文 前10條
1 李軍輝;周國棟;朱巧明;錢培德;;一種改進的中文層次句法分析模型研究[A];中國計算機語言學研究前沿進展(2007-2009)[C];2009年
2 彭洪保;李茹;段建勇;;基于漢語框架網(wǎng)的問句語義角色自動標注研究[A];中國計算機語言學研究前沿進展(2007-2009)[C];2009年
3 繆建明;張全;;HNC句群處理研究新進展[A];中國計算機語言學研究前沿進展(2007-2009)[C];2009年
4 王德亮;;語篇連貫性的量化測量——基于向心理論的研究[A];中國計算機語言學研究前沿進展(2007-2009)[C];2009年
5 羅琳;劉金鳳;郭嘉偉;亢世勇;姜嵐;;漢語文本蘊涵庫的設(shè)想與實現(xiàn)[A];中國計算機語言學研究前沿進展(2007-2009)[C];2009年
6 蒙新泛;王厚峰;;主客觀識別中的上下文因素的研究[A];中國計算機語言學研究前沿進展(2007-2009)[C];2009年
7 夏云慶;郝博一;徐睿峰;;意見目標網(wǎng)絡(luò)與意見目標抽取研究[A];中國計算機語言學研究前沿進展(2007-2009)[C];2009年
8 劉鴻宇;趙妍妍;秦兵;劉挺;;評價對象抽取及其傾向性分析[A];中國計算機語言學研究前沿進展(2007-2009)[C];2009年
9 何賽克;王小捷;董遠;張韜政;白雪;;歸一化的鄰接類別方法在基于條件隨機場的中文分詞中的應(yīng)用[A];中國計算機語言學研究前沿進展(2007-2009)[C];2009年
10 李月倫;常寶寶;;基于最大間隔馬爾可夫網(wǎng)模型的漢語分詞方法[A];中國計算機語言學研究前沿進展(2007-2009)[C];2009年
相關(guān)重要報紙文章 前10條
1 本報通訊員 周雨花 楊杰 本報記者 王握文;在線電子辭典,,網(wǎng)友也能當作者[N];解放軍報;2009年
2 記者 毛江華;新浪借微軟瞄準移動互聯(lián)網(wǎng)[N];計算機世界;2009年
3 小柯;張全:網(wǎng)絡(luò)環(huán)境“清潔師”[N];廣東科技報;2009年
4 焦敏 編譯;自動語音識別決定呼叫中心的未來[N];中國計算機報;2009年
5 沈建緣;洪小文:時尚科學家[N];經(jīng)濟觀察報;2009年
6 李薇薇邋張楠;社會實踐,順利就業(yè)的重要砝碼[N];中國教育報;2008年
7 劉潔;SAS分析產(chǎn)品鏈增添“新成員”[N];科技日報;2008年
8 本報記者 趙齊;網(wǎng)絡(luò)機器人提升政府公眾服務(wù)形象[N];國際商報;2008年
9 康琦;專家指出:中醫(yī)臨床科研一體化需實現(xiàn)技術(shù)突破[N];中國醫(yī)藥報;2008年
10 本報記者 曹霽陽;微軟與我高校合作漸入佳境[N];經(jīng)濟參考報;2008年
相關(guān)博士學位論文 前10條
1 袁彩霞;中文功能組塊分析及應(yīng)用研究[D];北京郵電大學;2009年
2 王紅玲;基于特征向量的中英文語義角色標注研究[D];蘇州大學;2009年
3 方寧;基于認知的文本語境生成和度量研究[D];上海大學;2009年
4 錢龍華;命名實體間語義關(guān)系抽取研究[D];蘇州大學;2009年
5 朱文浩;基于三維人臉特征的計算機輔助疾病診斷技術(shù)研究[D];浙江大學;2009年
6 楊志豪;面向生物醫(yī)學領(lǐng)域的文本挖掘技術(shù)研究[D];大連理工大學;2008年
7 趙林;面向查詢的多文檔自動文摘關(guān)鍵技術(shù)研究[D];復(fù)旦大學;2008年
8 李志國;面向分布式文本知識管理的中文分詞與文本分類研究[D];重慶大學;2008年
9 屈剛;英漢雙語短語對齊[D];上海交通大學;2007年
10 戴祖旭;文本載體信息隱藏研究[D];華中科技大學;2007年
相關(guān)碩士學位論文 前10條
1 張正永;面向自然語言的普適地圖服務(wù)研究和實現(xiàn)[D];華東師范大學;2010年
2 勵子閏;基于Lucene搜索引擎的中文全文信息檢索技術(shù)的研究[D];華東師范大學;2010年
3 周程遠;中文自動分詞系統(tǒng)的研究與實現(xiàn)[D];華東師范大學;2010年
4 高娟;基于K-means算法的文本聚類的研究與實現(xiàn)[D];江西理工大學;2010年
5 鄭照陽;英語形容詞認知研究[D];浙江大學;2010年
6 司紅娜;文本挖掘技術(shù)研究及其在CRM系統(tǒng)中的應(yīng)用[D];南昌大學;2010年
7 姜冶;對網(wǎng)頁目錄的分析以及相關(guān)算法的設(shè)計[D];吉林大學;2009年
8 顏軍;基于條件隨機場的中文分詞研究與應(yīng)用[D];武漢理工大學;2009年
9 王穎;中文局域網(wǎng)搜索引擎設(shè)計與實現(xiàn)[D];電子科技大學;2009年
10 劉延吉;基于詞典的中文分詞歧義算法研究[D];東北師范大學;2009年
本文編號:2341927
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2341927.html