基于語(yǔ)法結(jié)構(gòu)的源代碼搜索的研究
本文關(guān)鍵詞:基于語(yǔ)法結(jié)構(gòu)的源代碼搜索的研究
更多相關(guān)文章: 源代碼搜索 Lucene 抽象語(yǔ)法樹(shù) 語(yǔ)法分析 代碼爬蟲(chóng) Heritrix
【摘要】:現(xiàn)有的源代碼搜索引擎大都是基于文本的搜索,沒(méi)有利用代碼在語(yǔ)法上的特性,因此在搜索準(zhǔn)確性方面受到極大的限制。本文從語(yǔ)法結(jié)構(gòu)角度,提出一種源代碼的過(guò)濾方法,構(gòu)造基于語(yǔ)法結(jié)構(gòu)的代碼過(guò)濾器,從而抽取對(duì)搜索有用的信息。通過(guò)該方法實(shí)現(xiàn)了一個(gè)基于語(yǔ)法結(jié)構(gòu)的源代碼搜索引擎。實(shí)驗(yàn)表明本文所建立的源代碼搜索在搜索準(zhǔn)確度、搜索結(jié)果展示的友好性方面都有改進(jìn)。
【作者單位】: 湖南科技學(xué)院;
【關(guān)鍵詞】: 源代碼搜索 Lucene 抽象語(yǔ)法樹(shù) 語(yǔ)法分析 代碼爬蟲(chóng) Heritrix
【基金】:湖南科技學(xué)院科學(xué)研究項(xiàng)目,項(xiàng)目編號(hào):12XKYTB004
【分類號(hào)】:TP311.5
【正文快照】: 1.背景和意義在軟件行業(yè)中,開(kāi)源運(yùn)動(dòng)蓬勃發(fā)展,網(wǎng)絡(luò)上出現(xiàn)了越來(lái)越多的開(kāi)源代碼。全球最大的開(kāi)源軟件開(kāi)發(fā)平臺(tái)和倉(cāng)庫(kù)SourceForge.net已經(jīng)收集了448,706個(gè)開(kāi)源項(xiàng)目。在搜索領(lǐng)域,大量的開(kāi)源代碼為源代碼的搜索提供了原始的數(shù)據(jù)集。源代碼搜索引擎自通用的搜索技術(shù)發(fā)展而來(lái),它是
【參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前1條
1 劉石;李合;王嘯吟;張路;謝冰;;基于語(yǔ)法與語(yǔ)義分析的代碼搜索結(jié)果優(yōu)化[J];計(jì)算機(jī)科學(xué);2009年08期
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前1條
1 羅玫;基于LUCENE2.0的源代碼搜索引擎架構(gòu)的實(shí)現(xiàn)[D];西北工業(yè)大學(xué);2007年
【共引文獻(xiàn)】
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前1條
1 李怡康;趙婷;孫歆;顏立;;基于貝葉斯網(wǎng)絡(luò)的靜態(tài)源代碼安全缺陷評(píng)價(jià)方法[A];2012年電力通信管理暨智能電網(wǎng)通信技術(shù)論壇論文集[C];2013年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前3條
1 趙旭;搜索引擎關(guān)鍵技術(shù)研究及性能優(yōu)化[D];江南大學(xué);2008年
2 張金磊;Web2.0環(huán)境下內(nèi)容提取與信息發(fā)布系統(tǒng)研究與實(shí)現(xiàn)[D];新疆大學(xué);2010年
3 劉大伸;垂直搜索引擎技術(shù)的研究及實(shí)現(xiàn)[D];東北大學(xué);2008年
【二級(jí)參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前6條
1 劉遷;賈惠波;;中文信息處理中自動(dòng)分詞技術(shù)的研究與展望[J];計(jì)算機(jī)工程與應(yīng)用;2006年03期
2 丁承,邵志清;基于字表的中文搜索引擎分詞系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J];計(jì)算機(jī)工程;2001年02期
3 印鑒,陳憶群,張鋼;搜索引擎技術(shù)研究與發(fā)展[J];計(jì)算機(jī)工程;2005年14期
4 陳慶偉,劉軍;基于Lucene的網(wǎng)站全文搜索的設(shè)計(jì)與實(shí)現(xiàn)[J];科技情報(bào)開(kāi)發(fā)與經(jīng)濟(jì);2005年15期
5 張校乾,金玉玲,侯麗波;一種基于Lucene檢索引擎的全文數(shù)據(jù)庫(kù)的研究與實(shí)現(xiàn)[J];現(xiàn)代圖書(shū)情報(bào)技術(shù);2005年02期
6 黃昌寧;中文信息處理中的分詞問(wèn)題[J];語(yǔ)言文字應(yīng)用;1997年01期
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 王學(xué)輝;金丹;;Lucene與關(guān)系型數(shù)據(jù)庫(kù)對(duì)比[J];電腦知識(shí)與技術(shù)(學(xué)術(shù)交流);2007年03期
2 李武裝;;基于語(yǔ)義的企業(yè)搜索引擎的研究與實(shí)現(xiàn)[J];電腦知識(shí)與技術(shù)(學(xué)術(shù)交流);2007年08期
3 朱海豐;秦杰;;基于Lucene與JSF的搜索引擎[J];福建電腦;2008年10期
4 申劍;鮑春燕;;基于Lucene的搜索策略研究[J];現(xiàn)代計(jì)算機(jī)(專業(yè)版);2008年12期
5 李永春;丁華福;;Lucene的全文檢索的研究與應(yīng)用[J];計(jì)算機(jī)技術(shù)與發(fā)展;2010年02期
6 任惠靜;;基于Lucene的面向主題搜索引擎的索引技術(shù)的研究[J];電腦知識(shí)與技術(shù);2010年04期
7 侯云;;構(gòu)建基于Lucene的網(wǎng)站站內(nèi)搜索[J];信息與電腦(理論版);2010年02期
8 劉建湘;楊文濤;;基于Lucene的搜索引擎在Struts中的應(yīng)用[J];軟件導(dǎo)刊;2007年03期
9 溫艷鴻;;基于lucene的文件搜索引擎的設(shè)計(jì)與擴(kuò)展[J];福建電腦;2007年08期
10 葉分波;韓堅(jiān)華;;基于Lucene的Web站點(diǎn)全文檢索研究與實(shí)現(xiàn)[J];現(xiàn)代計(jì)算機(jī)(專業(yè)版);2009年01期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前10條
1 李明宙;羅艷;王宗義;;Lucene全文檢索引擎的研究及應(yīng)用[A];廣西計(jì)算機(jī)學(xué)會(huì)2010年學(xué)術(shù)年會(huì)論文集[C];2010年
2 申兵一;鞏青歌;;基于Lucene桌面搜索引擎系統(tǒng)的設(shè)計(jì)和實(shí)現(xiàn)[A];江蘇省電子學(xué)會(huì)2010年學(xué)術(shù)年會(huì)論文集[C];2010年
3 李應(yīng)興;付婷;李勇;;基于LUCENE的藏文信息檢索的研究與應(yīng)用[A];民族語(yǔ)言文字信息技術(shù)研究——第十一屆全國(guó)民族語(yǔ)言文字信息學(xué)術(shù)研討會(huì)論文集[C];2007年
4 戴莉;周明全;武仲科;王永恒;王燕妮;周曼;;Lucene在智能答疑系統(tǒng)中的應(yīng)用研究[A];圖像圖形技術(shù)與應(yīng)用進(jìn)展——第三屆圖像圖形技術(shù)與應(yīng)用學(xué)術(shù)會(huì)議論文集[C];2008年
5 劉壽強(qiáng);;基于Lucene的分級(jí)鑒權(quán)企業(yè)搜索引擎研究與設(shè)計(jì)[A];第二十一次全國(guó)計(jì)算機(jī)安全學(xué)術(shù)交流會(huì)論文集[C];2006年
6 董文莉;孟洛明;;XML網(wǎng)管接口一致性測(cè)試中XML解析器的開(kāi)發(fā)[A];第六屆全國(guó)計(jì)算機(jī)應(yīng)用聯(lián)合學(xué)術(shù)會(huì)議論文集[C];2002年
7 張威;李輝;畢學(xué)軍;宮云戰(zhàn);;內(nèi)存泄漏故障靜態(tài)測(cè)試方法研究[A];第四屆中國(guó)測(cè)試學(xué)術(shù)會(huì)議論文集[C];2006年
8 王富強(qiáng);馬德濤;張立朝;王建明;;地方志數(shù)據(jù)庫(kù)全文信息檢索研究[A];中國(guó)地理信息系統(tǒng)協(xié)會(huì)第四次會(huì)員代表大會(huì)暨第十一屆年會(huì)論文集[C];2007年
9 蘇毅;王文力;閻姍;鄧峰;;基于Ajax技術(shù)信息動(dòng)態(tài)查詢的設(shè)計(jì)與實(shí)現(xiàn)[A];2008通信理論與技術(shù)新進(jìn)展——第十三屆全國(guó)青年通信學(xué)術(shù)會(huì)議論文集(上)[C];2008年
10 劉源;詹舒波;;基于Solr的行業(yè)垂直搜索平臺(tái)的研究[A];2008通信理論與技術(shù)新進(jìn)展——第十三屆全國(guó)青年通信學(xué)術(shù)會(huì)議論文集(上)[C];2008年
中國(guó)重要報(bào)紙全文數(shù)據(jù)庫(kù) 前3條
1 中國(guó)聯(lián)通大連分公司通信工程師 高紅;Oracle數(shù)據(jù)庫(kù)參數(shù)優(yōu)化[N];計(jì)算機(jī)世界;2006年
2 ;IBM優(yōu)化技術(shù)提升DB2性能[N];網(wǎng)絡(luò)世界;2001年
3 ;1988年世界上第一個(gè)英漢機(jī)器翻譯產(chǎn)品商品化[N];中國(guó)計(jì)算機(jī)報(bào);2009年
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前6條
1 王勝軍;ATLAS語(yǔ)言編譯系統(tǒng)[D];吉林大學(xué);2006年
2 張立勇;軟件源代碼安全分析研究[D];西安電子科技大學(xué);2011年
3 徐建國(guó);網(wǎng)絡(luò)化制造系統(tǒng)中虛擬加工若干關(guān)鍵技術(shù)研究[D];南京理工大學(xué);2007年
4 李虎;基于本體和規(guī)則的受控自然語(yǔ)言系統(tǒng)模型研究[D];華中科技大學(xué);2010年
5 李素建;漢語(yǔ)組塊計(jì)算的若干研究[D];中國(guó)科學(xué)院研究生院(計(jì)算技術(shù)研究所);2002年
6 劉西洋;演化測(cè)試中面向分支到達(dá)的適應(yīng)度函數(shù)設(shè)計(jì)研究[D];西安電子科技大學(xué);2007年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 王冬坡;基于Lucene的主題搜索引擎的研究與實(shí)現(xiàn)[D];河北科技大學(xué);2010年
2 張彬;基于lucene的搜索引擎[D];上海師范大學(xué);2010年
3 高欣;基于Lucene的全文檢索系統(tǒng)的研究與實(shí)現(xiàn)[D];天津師范大學(xué);2010年
4 聞崢;基于Lucene的搜索引擎優(yōu)化[D];北京交通大學(xué);2011年
5 杜先撰;基于Lucene全文索引系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D];南京大學(xué);2011年
6 周月紅;基于Lucene的站內(nèi)搜索引擎的設(shè)計(jì)與開(kāi)發(fā)[D];華東理工大學(xué);2011年
7 徐財(cái)應(yīng);基于Lucene的搜索引擎技術(shù)的研究與改進(jìn)[D];長(zhǎng)春理工大學(xué);2010年
8 陳航哲;基于Lucene的垂直搜索引擎的研究與應(yīng)用[D];暨南大學(xué);2010年
9 岳莉;基于Lucene的全文檢索系統(tǒng)的研究與應(yīng)用[D];西安電子科技大學(xué);2010年
10 蘇景春;基于Lucene的全文檢索系統(tǒng)的研究與應(yīng)用[D];北京交通大學(xué);2010年
,本文編號(hào):736242
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/736242.html