基于Lucene的畢業(yè)論文相似性檢測
本文關鍵詞:基于Lucene的畢業(yè)論文相似性檢測,由筆耕文化傳播整理發(fā)布。
【摘要】:提出了基于Lucene的論文相似性檢測系統(tǒng),采用隨機特征碼算法構(gòu)造特征向量。實驗表明該算法與傳統(tǒng)的文本聚類算法在查全率、查準率及時間消耗上具有優(yōu)越性,呈線性結(jié)構(gòu)的算法適合大規(guī)模論文的抄襲檢測。
【作者單位】: 長春工業(yè)大學人文信息學院;
【關鍵詞】: Lucene畢業(yè)論文 抄襲檢測 隨機特征碼
【基金】:吉林省教育廳“十二五”科研課題(吉教科合字2011第353號)
【分類號】:TP391.1
【正文快照】: 0引言畢業(yè)論文是本科人才培養(yǎng)的重要實踐性教學環(huán)節(jié),也是學士學位評定的重要依據(jù)。但是隨著互聯(lián)網(wǎng)的普及,網(wǎng)絡資源方便易得,畢業(yè)論文成段復制也給學生的抄襲帶來了極大的方便。本文研究和分析了開源的搜索引擎工具Lucene的原理,將Lucene技術應用于畢業(yè)論文選題系統(tǒng)中,對上傳論
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前5條
1 馮汝偉;謝強;丁秋林;;基于文本聚類與分布式Lucene的知識檢索[J];計算機應用;2013年01期
2 管建和;甘劍峰;;基于Lucene全文檢索引擎的應用研究與實現(xiàn)[J];計算機工程與設計;2007年02期
3 李永春;丁華福;;Lucene的全文檢索的研究與應用[J];計算機技術與發(fā)展;2010年02期
4 周鳳麗;林曉麗;;基于Lucene的Web搜索引擎的研究和實現(xiàn)[J];計算機技術與發(fā)展;2012年01期
5 秦穎;文秋芳;梁茂成;;應用隨機特征碼檢測雷同譯文[J];外語電化教學;2009年06期
【共引文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 朱學芳;馮曦曦;;面向農(nóng)業(yè)主題搜索引擎設計與實現(xiàn)[J];安徽農(nóng)業(yè)科學;2011年35期
2 李敏;黃凱;;一個多線程全文檢索系統(tǒng)的構(gòu)建[J];長江大學學報(自然科學版)理工卷;2010年03期
3 王軍;張興忠;;XML與全文檢索在CMS數(shù)據(jù)歸檔中的應用[J];電腦開發(fā)與應用;2012年01期
4 劉敏娜;葛萌;陳娟;;基于Lucene的全文搜索引擎設計與實現(xiàn)[J];福建電腦;2009年05期
5 周文勤;;使用Heritrix和Lucence的全文檢索解決方案[J];甘肅聯(lián)合大學學報(自然科學版);2012年04期
6 李明宙;羅艷;王宗義;;Lucene全文檢索引擎的結(jié)構(gòu)機制與應用方式[J];廣西科學院學報;2010年04期
7 陳曉麗;楊欣蓉;王作釗;周航;趙益;沈玲玲;;面向制造業(yè)的知識搜索引擎設計[J];電腦知識與技術;2013年16期
8 汪濤;;論基于Java的全文檢索實現(xiàn)和索引性能提高[J];湖北民族學院學報(自然科學版);2009年01期
9 孫海東;張力;;基于Lucennee.t的醫(yī)學教育視頻垂直檢索的設計與實現(xiàn)[J];開放教育研究;2011年02期
10 宋佳;諸云強;劉潤達;;一種基于Lucene改進的全文檢索工具包[J];計算機工程與應用;2008年04期
中國重要會議論文全文數(shù)據(jù)庫 前1條
1 李明宙;羅艷;王宗義;;Lucene全文檢索引擎的研究及應用[A];廣西計算機學會2010年學術年會論文集[C];2010年
中國博士學位論文全文數(shù)據(jù)庫 前1條
1 陳旭毅;基于索引云的企業(yè)搜索引擎實現(xiàn)研究[D];武漢大學;2011年
中國碩士學位論文全文數(shù)據(jù)庫 前10條
1 雷斌;基于Java技術的智能化搜索引擎的研究與設計[D];哈爾濱工程大學;2010年
2 樊春雷;基于語義分析的糖尿病健康教育系統(tǒng)研究與實現(xiàn)[D];華東理工大學;2011年
3 王兆宇;個性化站內(nèi)搜索引擎的設計與應用[D];東華大學;2011年
4 馬靜;基于web的數(shù)字化資源全文檢索系統(tǒng)的設計與實現(xiàn)[D];西安電子科技大學;2010年
5 吳代文;基于Lucene的二次全文檢索系統(tǒng)設計與實現(xiàn)[D];西安電子科技大學;2009年
6 丁士敏;基于Ajax/Lucene的站內(nèi)搜索技術研究與實現(xiàn)[D];西安電子科技大學;2008年
7 孫華昱;Lucene在醫(yī)學影像資源檢索平臺中的應用[D];沈陽工業(yè)大學;2011年
8 聞崢;基于Lucene的搜索引擎優(yōu)化[D];北京交通大學;2011年
9 陳剛;基于行為分析智能推薦購物搜索引擎的設計與實現(xiàn)[D];北京交通大學;2011年
10 遲名;煙草專賣網(wǎng)平臺的設計與實現(xiàn)[D];吉林大學;2011年
【二級參考文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 孫健,王偉,鐘義信;基于K-最近距離的自動文本分類的研究[J];北京郵電大學學報;2001年01期
2 蔣明原;孔令德;寧靜靜;;一種海量數(shù)據(jù)下的Lucene全文檢索解決方案[J];電腦開發(fā)與應用;2011年04期
3 曹宇;尹剛;李翔;程榮斌;王懷民;;聚類搜索引擎研究進展淺析[J];電腦知識與技術;2011年22期
4 李振龍;;Web信息檢索的技術分析與發(fā)展策略研究[J];計算機科學;2006年04期
5 印鑒,陳憶群,張鋼;搜索引擎技術研究與發(fā)展[J];計算機工程;2005年14期
6 郎小偉;王申康;;基于Lucene的全文檢索系統(tǒng)研究與開發(fā)[J];計算機工程;2006年04期
7 張汛淶;搜索引擎的設計剖析[J];計算機工程與科學;2002年04期
8 趙恒永;沈堅;山嵐;;基于專業(yè)信息深度挖掘的搜索引擎Spider的設計與實現(xiàn)[J];計算機工程與科學;2009年06期
9 王浩;姚長利;郭琳;艾國慶;;基于中文搜索引擎網(wǎng)絡信息用戶行為研究[J];計算機應用研究;2009年12期
10 朱學昊;王儒敬;余鋒林;唐昱;;基于Lucene的站內(nèi)搜索設計與實現(xiàn)[J];計算機應用與軟件;2008年10期
中國碩士學位論文全文數(shù)據(jù)庫 前1條
1 郭琰;元搜索引擎的關鍵技術研究及系統(tǒng)實現(xiàn)[D];南京理工大學;2002年
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 謝維信,劉健莊;視覺圖形符號的頻譜分析[J];航天醫(yī)學與醫(yī)學工程;1990年04期
2 董建萍;一般系統(tǒng)相似性討論[J];桂林電子工業(yè)學院學報;1996年01期
3 陳兵,井元偉,張嗣瀛;經(jīng)狀態(tài)反饋確保非線性不確定相似組合系統(tǒng)終極一致有界[J];控制與決策;1998年05期
4 劉紅冰;淺析計算機技術與社會現(xiàn)象的相似性[J];湖南財經(jīng)高等?茖W校學報;2000年06期
5 王秀平;劉家勇;李治柱;;個性化學習推薦系統(tǒng)的設計與實現(xiàn)[J];微型電腦應用;2005年11期
6 王小玲;胡平;;基于個人興趣和反饋技術的Page Rank算法研究[J];合肥工業(yè)大學學報(自然科學版);2006年03期
7 朱俊武;王建東;李斌;;基于語義相似性的web服務選擇(英文)[J];東南大學學報(英文版);2006年03期
8 喬園園;吳夏;楊玲;張明濤;;化學信息學開源軟件的集成與復用[J];計算機與應用化學;2007年01期
9 吳春輝;鐘寶榮;;基于內(nèi)容的音頻檢索技術研究[J];科技情報開發(fā)與經(jīng)濟;2007年06期
10 張亞;王元慶;;一種有效的數(shù)字圖像傳感器彩色插值算法[J];計算機測量與控制;2008年04期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 張恒超;陰國恩;;關系類別及其學習機制[A];第十二屆全國心理學學術大會論文摘要集[C];2009年
2 趙春江;施文康;鄧勇;;基于Wasserstein距離的目標識別中的研究[A];NCIRCS2004第一屆全國信息檢索與內(nèi)容安全學術會議論文集[C];2004年
3 秦軍剛;韓世輝;;不應效應和波形相異交迭——知覺組織神經(jīng)基礎的可能解釋?[A];2005年中國神經(jīng)心理學學術會議論文集[C];2005年
4 葉知新;莫雷;;基于相似性歸類中的外顯策略和內(nèi)隱策略[A];第十一屆全國心理學學術會議論文摘要集[C];2007年
5 范萬春;邱宏茂;孫煜;施仁;李真富;;基于自相關函數(shù)的地震信號自適應端點檢測[A];第十屆全國核電子學與核探測技術學術年會論文集[C];2000年
6 彭豐平;鮑蘇蘇;;基于CT序列圖像肝臟及其管道的分割[A];2008'中國信息技術與應用學術論壇論文集(一)[C];2008年
7 張元中;楚澤涵;;不同頻率聲衰減之間的相似性問題[A];1999年中國地球物理學會年刊——中國地球物理學會第十五屆年會論文集[C];1999年
8 彭建武;;連通主義和認知語言學的對比研究[A];2008'中國信息技術與應用學術論壇論文集(一)[C];2008年
9 黎堅;張厚粲;;心理學常用計數(shù)數(shù)據(jù)相似性檢驗法[A];全國教育與心理統(tǒng)計測量學術年會論文摘要集[C];2006年
10 劉夢然;;材料力學學科特性與內(nèi)在邏輯的分析[A];海峽兩岸力學教學—教學經(jīng)驗與教學改革交流會論文集[C];2002年
中國重要報紙全文數(shù)據(jù)庫 前10條
1 趙軍;相似性影響電影與觀眾的互動[N];中國電影報;2008年
2 本報記者 黃婉媛;探尋文化相似性有利化解紛爭[N];中山日報;2010年
3 中國傳媒大學計算機學院 朱立谷;重復數(shù)據(jù)刪除技術解析[N];中國計算機報;2007年
4 趙曉;中國經(jīng)濟到了一個新十字路口[N];上海證券報;2008年
5 張?zhí)锟?最新破譯狗的起源和進化[N];北京日報;2005年
6 沈曉強;倫銅合理底部在6400—6500美元[N];期貨日報;2007年
7 康潛;前車后轍 安步當歌[N];證券日報;2007年
8 吳國平;縮量雙星暗藏玄機?[N];上海證券報;2006年
9 路平;企業(yè)的責任意識需提升[N];中國勞動保障報;2009年
10 侯燕俐;伍德威:一路旅行一路收藏[N];中國鄉(xiāng)鎮(zhèn)企業(yè)報;2005年
中國博士學位論文全文數(shù)據(jù)庫 前10條
1 曾海泉;時間序列挖掘與相似性查找技術研究[D];復旦大學;2003年
2 王曉曄;時間序列數(shù)據(jù)挖掘中相似性和趨勢預測的研究[D];天津大學;2003年
3 黃樟燦;演化計算的搜索策略研究[D];武漢大學;2004年
4 李桂杰;固體“類流態(tài)”機理及其與地震孕震的相似性研究[D];天津大學;2004年
5 李俊奎;時間序列相似性問題研究[D];華中科技大學;2008年
6 黎榮;概念工藝規(guī)劃原型系統(tǒng)關鍵技術研究[D];西南交通大學;2006年
7 翁延玲;RTL到門級設計的等價性驗證的研究[D];浙江大學;2008年
8 曹順良;生物學數(shù)據(jù)集成若干關鍵問題研究[D];復旦大學;2005年
9 黃章峰;超音速平板邊界層從層流到湍流的轉(zhuǎn)捩機理及湍流特性[D];天津大學;2006年
10 阮文善;類型學視野中的同一、差異與相似[D];華東師范大學;2007年
中國碩士學位論文全文數(shù)據(jù)庫 前10條
1 魯華;中西當代廣告作品比較研究[D];武漢大學;2005年
2 許瑞珍;結(jié)構(gòu)對稱蛋白質(zhì)的序列分析[D];華中科技大學;2005年
3 別晨霞;基于中介語語料庫的形容詞產(chǎn)出偏誤分析[D];上海師范大學;2009年
4 陸蘇靜;從相似性角度看中介語中的程度副詞偏誤現(xiàn)象[D];上海師范大學;2009年
5 鐘亮;基于視頻流的數(shù)字隱藏技術[D];華南師范大學;2005年
6 朱賢芳;生物序列的比對算法比較研究[D];南京理工大學;2005年
7 孫傳波;認知風格、加工方式與漢語相似詞學習的關系研究[D];曲阜師范大學;2006年
8 焉炳艷;一種新的基于相似性的多目標演化算法[D];武漢理工大學;2006年
9 張婷婷;歸納推理中的屬性中心性效應及其心理過程初探[D];西南大學;2007年
10 萬小梅;江西贛語詞匯變音探究[D];華南師范大學;2007年
本文關鍵詞:基于Lucene的畢業(yè)論文相似性檢測,由筆耕文化傳播整理發(fā)布。
,本文編號:357143
本文鏈接:http://sikaile.net/wenshubaike/caipu/357143.html