天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 搜索引擎論文 >

基于NLP技術(shù)和相似度計算的智能搜索引擎研究

發(fā)布時間:2018-11-19 09:52
【摘要】:針對傳統(tǒng)的搜索引擎對于自然語言理解方面存在的問題,文章研究了一種新的基于自然語言處理技術(shù)和相似度計算的智能搜索引擎的模型.其核心技術(shù)是基于自然語言處理的中文分詞技術(shù)、語義相似度和對立度等理論,將這些概念理論結(jié)合起來,從用戶習(xí)慣的思考角度,結(jié)合DotLucene開源全文搜索引擎建立一個智能的搜索引擎.研究表明,該模型在對已經(jīng)收錄的文檔有著86.1%的查準(zhǔn)率.該智能搜索引擎較好的對查詢語句的實(shí)現(xiàn)了理解,能夠?qū)τ脩舻奶釂栕龀稣_的回答.
[Abstract]:Aiming at the problems of traditional search engines in natural language understanding, a new model of intelligent search engine based on natural language processing technology and similarity calculation is studied in this paper. Its core technology is based on the natural language processing of Chinese word segmentation technology, semantic similarity and opposites and other theories, combining these concepts theory, from the perspective of user habits, Combined with DotLucene open source full-text search engine to establish an intelligent search engine. The results show that the model has an accuracy of 86.1% for the documents that have been included. The intelligent search engine has a good understanding of the query statements and can answer the user's questions correctly.
【作者單位】: 桂林理工大學(xué)信息科學(xué)與工程學(xué)院;太原科技大學(xué)機(jī)械電子工程學(xué)院;莫納什大學(xué)管理學(xué)院;利物浦大學(xué)計算機(jī)科學(xué)系;西交利物浦大學(xué)計算機(jī)科學(xué)與軟件工程系;
【基金】:廣西自然科學(xué)基金資助項(xiàng)目(桂科自0991254)
【分類號】:TP391.3

【參考文獻(xiàn)】

相關(guān)期刊論文 前10條

1 楊倩晨;;淺析搜索引擎的運(yùn)行機(jī)制[J];大眾科技;2009年05期

2 吳晨;張全;繆建明;韋向峰;;語義理解下的自然語言處理及信息檢索模型[J];計算機(jī)科學(xué);2008年05期

3 陳林;楊丹;趙俊芹;;基于語義理解的智能搜索引擎研究[J];計算機(jī)科學(xué);2008年06期

4 李玉梅;陳曉;姜自霞;易江燕;靳光瑾;黃昌寧;;分詞規(guī)范亟需補(bǔ)充的三方面內(nèi)容[J];中文信息學(xué)報;2007年05期

5 麥范金;王挺;;語義對立度及其計算模型的研究[J];中文信息學(xué)報;2008年04期

6 嚴(yán)良達(dá);;基于Lucene搜索引擎的設(shè)計與實(shí)現(xiàn)[J];寧波職業(yè)技術(shù)學(xué)院學(xué)報;2009年02期

7 吳曉暉;宋萍萍;;中文智能搜索引擎分析和框架模型的設(shè)計[J];情報科學(xué);2008年12期

8 蔡雷;;語料庫技術(shù)在英語教學(xué)中的應(yīng)用與研究[J];宿州學(xué)院學(xué)報;2008年05期

9 李占波;廖繼東;李華;;基于DotLucene的垂直搜索引擎的研究[J];微計算機(jī)信息;2007年24期

10 麥范金;趙子強(qiáng);岳曉光;;基于語義相似度的主觀題閱卷系統(tǒng)模型設(shè)計[J];微計算機(jī)信息;2009年18期

相關(guān)碩士學(xué)位論文 前1條

1 陳魁;智能搜索引擎系統(tǒng)的分析設(shè)計與開發(fā)[D];大連理工大學(xué);2004年

【共引文獻(xiàn)】

相關(guān)期刊論文 前10條

1 田占霄;韓憲忠;王克儉;;一種改進(jìn)的長詞優(yōu)先逆向最大匹配分詞消歧策略[J];河北農(nóng)業(yè)大學(xué)學(xué)報;2009年04期

2 陳洪猛;;基于垂直搜索技術(shù)的搜索引擎解決方案[J];電腦應(yīng)用技術(shù);2008年01期

3 陳文君;於文雪;;漢英跨語言檢索系統(tǒng)中關(guān)鍵詞提取方法的研究[J];電腦知識與技術(shù);2009年28期

4 韋永軍;覃秋密;;基于AJAX智能題庫訓(xùn)練系統(tǒng)的設(shè)計與實(shí)現(xiàn)[J];電腦知識與技術(shù);2011年23期

5 張?zhí)m芳;;一種基于本體的自然語言語義相似度算法[J];桂林理工大學(xué)學(xué)報;2012年02期

6 楊文剛;;基于Lucene.net的檔案垂直搜索引擎的實(shí)現(xiàn)[J];北京檔案;2012年10期

7 陸秋琴;黃光球;周嬌;;基于生物記憶原理的個性化搜索引擎模型[J];計算機(jī)工程與應(yīng)用;2012年12期

8 秦學(xué)勇;張潤梅;;兩級相似度計算在主觀題機(jī)器閱卷中的應(yīng)用[J];計算機(jī)工程;2012年11期

9 龔磊;武友新;;Lucene全文檢索系統(tǒng)的研究與實(shí)現(xiàn)[J];計算機(jī)與數(shù)字工程;2010年05期

10 康大偉;;語料庫在行業(yè)英語教學(xué)中的應(yīng)用——以畜牧獸醫(yī)專業(yè)為例[J];科教文匯(下旬刊);2009年12期

相關(guān)會議論文 前1條

1 李玉梅;靳光瑾;黃昌寧;;中文分詞規(guī)范中的歧義字段消解細(xì)則[A];第五屆全國語言文字應(yīng)用學(xué)術(shù)研討會論文集[C];2007年

相關(guān)博士學(xué)位論文 前2條

1 李濱;自然空間查詢語言解譯機(jī)制研究[D];解放軍信息工程大學(xué);2009年

2 陳圣兵;基于商空間理論的海量信息檢索模型的研究[D];安徽大學(xué);2010年

相關(guān)碩士學(xué)位論文 前10條

1 雷斌;基于Java技術(shù)的智能化搜索引擎的研究與設(shè)計[D];哈爾濱工程大學(xué);2010年

2 么士宇;基于分布式計算的網(wǎng)絡(luò)爬蟲技術(shù)研究[D];大連海事大學(xué);2011年

3 陸曉丹;基于.NET多層架構(gòu)的內(nèi)容管理系統(tǒng)的研究[D];太原科技大學(xué);2011年

4 陳淑華;企業(yè)短信互動系統(tǒng)設(shè)計及實(shí)現(xiàn)關(guān)鍵技術(shù)研究[D];中南大學(xué);2011年

5 陳杰;基于Web檢索的查詢意圖分類研究[D];華南理工大學(xué);2011年

6 陳建偉;基于語義的訪問控制技術(shù)在信息整合中的研究[D];華北電力大學(xué);2011年

7 曾微;基于網(wǎng)絡(luò)語料庫的大學(xué)生英語作文自我糾錯研究[D];廣西師范大學(xué);2011年

8 張贏;個性化多媒體資源垂直搜索引擎技術(shù)研究[D];華東交通大學(xué);2009年

9 余坦;個性化技術(shù)資料支持幫助系統(tǒng)的研究與實(shí)現(xiàn)[D];湖南大學(xué);2009年

10 陰曉昱;基于Lucene多核并行索引方法的設(shè)計與實(shí)現(xiàn)[D];上海交通大學(xué);2011年

【二級參考文獻(xiàn)】

相關(guān)期刊論文 前10條

1 何安平;;語料庫與外語教學(xué)[J];國外外語教學(xué);2001年03期

2 劉春辰;劉大有;王生生;趙靜濱;王兆丹;;改進(jìn)的語義相似度計算模型及應(yīng)用[J];吉林大學(xué)學(xué)報(工學(xué)版);2009年01期

3 尤f ,李涓子,王作英;基于《知網(wǎng)》的中文信息結(jié)構(gòu)抽取研究[J];計算機(jī)工程與應(yīng)用;2002年18期

4 杜阿寧,方濱興,胡銘曾,云曉春;中文交互式網(wǎng)絡(luò)搜索引擎及其自學(xué)習(xí)能力[J];計算機(jī)工程與應(yīng)用;2003年10期

5 周強(qiáng),馮松巖;構(gòu)建知網(wǎng)關(guān)系的網(wǎng)狀表示[J];中文信息學(xué)報;2000年06期

6 胡俊峰 ,俞士汶;唐宋詩中詞匯語義相似度的統(tǒng)計分析及應(yīng)用[J];中文信息學(xué)報;2002年04期

7 俞士汶,段慧明,朱學(xué)鋒,孫斌;北京大學(xué)現(xiàn)代漢語語料庫基本加工規(guī)范[J];中文信息學(xué)報;2002年05期

8 閆翔,陳遠(yuǎn);中文智能搜索引擎現(xiàn)狀探析[J];情報科學(xué);2002年12期

9 李瑋,李利;Web搜索引擎與全文檢索技術(shù)[J];情報科學(xué);2003年05期

10 邱均平;余以勝;;基于知識庫系統(tǒng)的智能搜索引擎研究[J];情報科學(xué);2006年03期

相關(guān)碩士學(xué)位論文 前2條

1 段恩澤;基于統(tǒng)計的漢語自動分詞系統(tǒng)[D];電子科技大學(xué);2005年

2 南鉉國;基于語句相似度計算的主觀題自動評分技術(shù)研究[D];延邊大學(xué);2007年

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 梁曉誠;岳曉光;麥范金;趙子強(qiáng);路英;王挺;;基于自然語言處理的主觀題評分算法研究[J];昆明理工大學(xué)學(xué)報(理工版);2010年02期

2 田甜;張振國;;主觀題自動閱卷技術(shù)研究[J];計算機(jī)工程與設(shè)計;2010年16期

3 麥范金;岳曉光;趙子強(qiáng);路英;王挺;岳砥柱;;基于自然語言處理的智能評分系統(tǒng)[J];桂林理工大學(xué)學(xué)報;2010年03期

4 佘莉,符紅光,方海光;幾何命題處理中的中文分詞技術(shù)[J];計算機(jī)工程;2005年18期

5 石正喜;張捍東;趙黎明;陳玉燕;;一種改進(jìn)的MM中文分詞算法[J];計算機(jī)與網(wǎng)絡(luò);2009年02期

6 吉勝軍;;基于Levenshtein distance算法的句子相似度計算[J];電腦知識與技術(shù);2009年09期

7 仲兆滿;劉宗田;周文;付劍鋒;;基于事件的文本相似度計算[J];廣西師范大學(xué)學(xué)報(自然科學(xué)版);2009年01期

8 周法國;楊炳儒;;句子相似度計算新方法及在問答系統(tǒng)中的應(yīng)用[J];計算機(jī)工程與應(yīng)用;2008年01期

9 南鉉國;崔榮一;;基于多層次融合的語句相似度計算模型[J];延邊大學(xué)學(xué)報(自然科學(xué)版);2007年03期

10 楊思春;;一種改進(jìn)的句子相似度計算模型[J];電子科技大學(xué)學(xué)報;2006年06期

相關(guān)會議論文 前10條

1 朱嫣嵐;閔錦;周雅倩;黃萱菁;吳立德;;基于HowNet的詞匯語義傾向計算[A];全國第八屆計算語言學(xué)聯(lián)合學(xué)術(shù)會議(JSCL-2005)論文集[C];2005年

2 劉寶艷;林鴻飛;楊志豪;;基于改進(jìn)編輯距離和依存結(jié)構(gòu)的句子相似度計算[A];第三屆學(xué)生計算語言學(xué)研討會論文集[C];2006年

3 支流;段慧明;朱學(xué)鋒;俞士汶;;中文縮略語知識庫建設(shè)[A];第三屆學(xué)生計算語言學(xué)研討會論文集[C];2006年

4 白剛;張錚;丁宗堯;朱毅;;中文文本聚類在互聯(lián)網(wǎng)搜索的研究與應(yīng)用[A];第三屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集[C];2007年

5 劉群;張浩;白碩;;中文信息處理開放平臺的設(shè)計[A];第一屆學(xué)生計算語言學(xué)研討會論文集[C];2002年

6 支流;朱學(xué)鋒;段慧明;俞士汶;;中文縮略語還原技術(shù)初探[A];全國第八屆計算語言學(xué)聯(lián)合學(xué)術(shù)會議(JSCL-2005)論文集[C];2005年

7 劉開瑛;由麗萍;;漢語框架語義知識庫構(gòu)建工程[A];中文信息處理前沿進(jìn)展——中國中文信息學(xué)會二十五周年學(xué)術(shù)會議論文集[C];2006年

8 鄭家恒;譚紅葉;王興義;;基于模式匹配的中文專有名詞識別[A];民族語言文字信息技術(shù)研究——第十一屆全國民族語言文字信息學(xué)術(shù)研討會論文集[C];2007年

9 葛詩利;陳瀟瀟;;中國EFL學(xué)習(xí)者自動作文評分探索[A];第三屆學(xué)生計算語言學(xué)研討會論文集[C];2006年

10 宋柔;;自然語言處理中語言知識的基礎(chǔ)性地位[A];民族語言文字信息技術(shù)研究——第十一屆全國民族語言文字信息學(xué)術(shù)研討會論文集[C];2007年

相關(guān)重要報紙文章 前10條

1 本報記者 姜靖;張全:給網(wǎng)絡(luò)裝上“電子眼”[N];科技日報;2009年

2 本報記者 祝蕾 見習(xí)記者 許凱;李曉戈:努力縮小國內(nèi)外數(shù)字“鴻溝”[N];濟(jì)南日報;2010年

3 李瀛寰;雅虎中文搜索從分詞開始[N];中國計算機(jī)報;2006年

4 金利;東北大學(xué)自然語言處理實(shí)驗(yàn)室形成特色[N];科技日報;2007年

5 小柯;張全:網(wǎng)絡(luò)環(huán)境“清潔師”[N];廣東科技報;2009年

6 何清 史忠植 王偉;搜索引擎的前沿技術(shù)[N];計算機(jī)世界;2006年

7 鄧健;智能計算:變數(shù)據(jù)為情報[N];計算機(jī)世界;2007年

8 沈建緣;洪小文:時尚科學(xué)家[N];經(jīng)濟(jì)觀察報;2009年

9 記者 劉傳書;微軟在深圳設(shè)實(shí)驗(yàn)室[N];科技日報;2006年

10 張利;下一代搜索輪廓初現(xiàn)Autonomy力挺中文搜[N];中國企業(yè)報;2006年

相關(guān)博士學(xué)位論文 前10條

1 盧延鑫;基于自然語言處理技術(shù)的循證醫(yī)學(xué)信息提取研究[D];復(fù)旦大學(xué);2011年

2 宋萬鵬;短文本相似度計算在用戶交互式問答系統(tǒng)中的應(yīng)用[D];中國科學(xué)技術(shù)大學(xué);2010年

3 計峰;自然語言處理中序列標(biāo)注模型的研究[D];復(fù)旦大學(xué);2012年

4 王秀紅;文本相似度計算核函數(shù)的構(gòu)造及其在分布式信息檢索中的應(yīng)用研究[D];江蘇大學(xué);2012年

5 趙林;面向查詢的多文檔自動文摘關(guān)鍵技術(shù)研究[D];復(fù)旦大學(xué);2008年

6 李良炎;基于詞聯(lián)接的自然語言處理技術(shù)及其應(yīng)用研究[D];重慶大學(xué);2004年

7 代印唐;基于語義網(wǎng)絡(luò)的知識協(xié)作關(guān)鍵技術(shù)研究[D];復(fù)旦大學(xué);2009年

8 王立欣;翻譯標(biāo)準(zhǔn)自動量化方法研究[D];上海外國語大學(xué);2007年

9 李莎莎;面向搜索引擎的自然語言處理關(guān)鍵技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2011年

10 張榕;術(shù)語定義抽取、聚類與術(shù)語識別研究[D];北京語言大學(xué);2006年

相關(guān)碩士學(xué)位論文 前10條

1 劉巖;基于概念圖的中文語義分析系統(tǒng)的研究與實(shí)現(xiàn)[D];西北大學(xué);2008年

2 王利局;基于語義分析樹核的句子相似度計算[D];大連理工大學(xué);2008年

3 唐琦;基于語義分析的句子相似度計算研究[D];華北電力大學(xué)(北京);2009年

4 周舫;漢語句子相似度計算方法及其應(yīng)用的研究[D];河南大學(xué);2005年

5 楊國基;漢語中基于短語結(jié)構(gòu)的語義提取[D];天津大學(xué);2007年

6 柴曉麗;自動文摘技術(shù)的研究與應(yīng)用[D];長春理工大學(xué);2007年

7 王德剛;智能答疑系統(tǒng)的設(shè)計[D];內(nèi)蒙古大學(xué);2008年

8 陳銳;基于概念圖的信息檢索查詢擴(kuò)展模型研究與實(shí)現(xiàn)[D];西北大學(xué);2009年

9 楊聰;基于口語對話的電話自動轉(zhuǎn)接與信息查詢技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2004年

10 南鉉國;基于語句相似度計算的主觀題自動評分技術(shù)研究[D];延邊大學(xué);2007年

,

本文編號:2341926

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2341926.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶0c40e***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com