基于文本結(jié)構(gòu)樹的論文復(fù)制檢測(cè)算法
本文關(guān)鍵詞:基于文本結(jié)構(gòu)樹的論文復(fù)制檢測(cè)算法,由筆耕文化傳播整理發(fā)布。
【摘要】:針對(duì)目前學(xué)術(shù)界抄襲現(xiàn)象日趨嚴(yán)重的問題,提出基于文本結(jié)構(gòu)樹的論文復(fù)制檢測(cè)算法。將一篇論文分為三層的結(jié)構(gòu)樹:最上層的根節(jié)點(diǎn)表示整篇論文,分支節(jié)點(diǎn)表示句子包,葉節(jié)點(diǎn)表示句子。根據(jù)一個(gè)函數(shù)和句子的綜合相似度計(jì)算句子相似度,以最大句子相似度計(jì)算葉節(jié)點(diǎn)相似度,上層節(jié)點(diǎn)的相似度由相鄰的下層節(jié)點(diǎn)相似度計(jì)算得到。選用中國(guó)期刊全文數(shù)據(jù)庫(kù)中的論文進(jìn)行測(cè)試,實(shí)驗(yàn)結(jié)果證明該算法是可行的、高效的。
【作者單位】: 大連理工大學(xué)管理學(xué)院;
【關(guān)鍵詞】: 復(fù)制檢測(cè) 句子相似度 句子包 結(jié)構(gòu)樹
【分類號(hào)】:TP391.1
【正文快照】: 1引言進(jìn)入21世紀(jì),知識(shí)已經(jīng)成為主要的經(jīng)濟(jì)資源和占支配地位的、甚至可能是唯一的競(jìng)爭(zhēng)優(yōu)勢(shì)的源泉。計(jì)算機(jī)、網(wǎng)絡(luò)和通信技術(shù)的高速發(fā)展,給人們提供了大量的文檔、圖像、音頻、視頻等數(shù)字化信息。人們很容易訪問這些資源,尤其是學(xué)生和學(xué)術(shù)研究人員能夠輕松地找到課題研究的相關(guān)
【參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前3條
1 呂學(xué)強(qiáng),任飛亮,黃志丹,姚天順;句子相似模型和最相似句子查找算法[J];東北大學(xué)學(xué)報(bào)(自然科學(xué)版);2003年06期
2 史彥軍,滕弘飛,金博;抄襲論文識(shí)別研究與進(jìn)展[J];大連理工大學(xué)學(xué)報(bào);2005年01期
3 鮑軍鵬,沈鈞毅,劉曉東,宋擒豹;自然語(yǔ)言文檔復(fù)制檢測(cè)研究綜述[J];軟件學(xué)報(bào);2003年10期
【共引文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 林鴻飛,戰(zhàn)學(xué)剛,姚天順;中文文本挖掘的特征導(dǎo)航機(jī)制[J];東北大學(xué)學(xué)報(bào)(自然科學(xué)版);2000年03期
2 楊思春;;一種改進(jìn)的句子相似度計(jì)算模型[J];電子科技大學(xué)學(xué)報(bào);2006年06期
3 林鴻飛;丁洪文;楊志豪;趙晶;;基于概念和統(tǒng)計(jì)的問答系統(tǒng)實(shí)現(xiàn)機(jī)制[J];大連理工大學(xué)學(xué)報(bào);2006年02期
4 金博;史彥軍;滕弘飛;;基于篇章結(jié)構(gòu)相似度的復(fù)制檢測(cè)算法[J];大連理工大學(xué)學(xué)報(bào);2007年01期
5 譚建龍,莊超,白碩;一種實(shí)用Internet內(nèi)容版權(quán)保護(hù)系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J];計(jì)算機(jī)研究與發(fā)展;2001年10期
6 王劍,周之英,肖慧勇;應(yīng)用于結(jié)構(gòu)化文本的檢索系統(tǒng)的設(shè)計(jì)和實(shí)現(xiàn)[J];計(jì)算機(jī)工程與應(yīng)用;2003年19期
7 王萌,何婷婷,張偉;基于概念向量空間模型的中文自動(dòng)文摘系統(tǒng)[J];計(jì)算機(jī)工程與應(yīng)用;2005年01期
8 馬兆豐,馮博琴,宋擒豹,劉丹瑩;面向認(rèn)證的傳統(tǒng)商品數(shù)字化防偽機(jī)制研究[J];計(jì)算機(jī)工程;2003年01期
9 李軍懷,張景,呂林濤,張志強(qiáng);基于Internet的傳統(tǒng)商品防偽系統(tǒng)[J];計(jì)算機(jī)工程;2004年19期
10 金博,史彥軍,滕弘飛;中文文檔復(fù)制檢測(cè)系統(tǒng)研究[J];計(jì)算機(jī)工程;2005年19期
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前5條
1 彭強(qiáng);復(fù)雜系統(tǒng)遠(yuǎn)程智能故障診斷技術(shù)研究[D];南京理工大學(xué);2004年
2 劉清堂;標(biāo)準(zhǔn)化教育資源版權(quán)保護(hù)機(jī)制研究[D];華中科技大學(xué);2005年
3 楊雨圖;支持雙語(yǔ)的協(xié)同CAPP系統(tǒng)若干關(guān)鍵技術(shù)研究[D];南京航空航天大學(xué);2006年
4 周四清;數(shù)字水印理論及應(yīng)用研究[D];華南理工大學(xué);2002年
5 于寶琴;成套電器企業(yè)異構(gòu)數(shù)據(jù)整合及其物流系統(tǒng)的研究[D];天津大學(xué);2006年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 章成志;基于文本層次模型的Web概念挖掘研究[D];南京農(nóng)業(yè)大學(xué);2002年
2 姜楠;可行的完備數(shù)字水印系統(tǒng)研究[D];山東師范大學(xué);2003年
3 武瓊;基于元數(shù)據(jù)的web信息提取方法研究[D];山西大學(xué);2003年
4 趙倩;數(shù)字水印版權(quán)保護(hù)系統(tǒng)[D];首都經(jīng)濟(jì)貿(mào)易大學(xué);2004年
5 蔣超;軌道交通自動(dòng)門遠(yuǎn)程監(jiān)控系統(tǒng)中的智能故障診斷技術(shù)研究[D];南京理工大學(xué);2004年
6 楊聰;基于口語(yǔ)對(duì)話的電話自動(dòng)轉(zhuǎn)接與信息查詢技術(shù)研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2004年
7 李劍;英漢機(jī)器翻譯中的句型轉(zhuǎn)換和譯文生成[D];中國(guó)人民解放軍信息工程大學(xué);2005年
8 李旭;基于串匹配方法的文檔復(fù)制檢測(cè)系統(tǒng)研究[D];燕山大學(xué);2006年
9 張艷;面向高校師生的應(yīng)用文機(jī)輔寫作關(guān)鍵技術(shù)研究[D];大連理工大學(xué);2006年
10 連浩;基于布爾模型的網(wǎng)頁(yè)查重算法研究[D];中國(guó)科學(xué)院研究生院(計(jì)算技術(shù)研究所);2006年
【二級(jí)參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 呂學(xué)強(qiáng),任飛亮,黃志丹,姚天順;句子相似模型和最相似句子查找算法[J];東北大學(xué)學(xué)報(bào)(自然科學(xué)版);2003年06期
2 朱靖波,王寶庫(kù),姚天順;一種規(guī)則描述語(yǔ)言NPRDL語(yǔ)言[J];東北大學(xué)學(xué)報(bào)(自然科學(xué)版);1996年06期
3 史彥軍,滕弘飛,金博;抄襲論文識(shí)別研究與進(jìn)展[J];大連理工大學(xué)學(xué)報(bào);2005年01期
4 金博,史彥軍,滕弘飛;基于語(yǔ)義理解的文本相似度算法[J];大連理工大學(xué)學(xué)報(bào);2005年02期
5 鄭逢斌,陳志國(guó),姜保慶,喬保軍;語(yǔ)義校對(duì)系統(tǒng)中的句子語(yǔ)義骨架模糊匹配算法[J];電子學(xué)報(bào);2003年08期
6 何明;胡彩霞;;一種文本相似性的度量方法和計(jì)算方法[J];黃山學(xué)院學(xué)報(bào);2005年06期
7 馬穎華,王永成,蘇貴洋,張宇萌;一種基于字同現(xiàn)頻率的漢語(yǔ)文本主題抽取方法[J];計(jì)算機(jī)研究與發(fā)展;2003年06期
8 林賢明,李堂秋,陳毅東;句子相似度的動(dòng)態(tài)規(guī)劃求解及改進(jìn)[J];計(jì)算機(jī)工程與應(yīng)用;2004年35期
9 王榮波,池哲儒,常寶寶,柏曉靜;基于詞串粒度及權(quán)值的漢語(yǔ)句子相似度衡量[J];計(jì)算機(jī)工程;2005年13期
10 宋擒豹,楊向榮,沈鈞毅,齊勇;數(shù)字商品非法復(fù)制的檢測(cè)算法[J];計(jì)算機(jī)學(xué)報(bào);2002年11期
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 秦元巧;孫國(guó)強(qiáng);;改進(jìn)的句子相似度計(jì)算在問答系統(tǒng)中的應(yīng)用[J];微計(jì)算機(jī)信息;2011年08期
2 安見才讓;;藏語(yǔ)句子相似度算法的研究[J];中文信息學(xué)報(bào);2011年04期
3 王宏生;張敏;;一種基于語(yǔ)義網(wǎng)的相似度計(jì)算模型[J];微計(jì)算機(jī)信息;2011年07期
4 郭扉扉;尹文生;;改進(jìn)型單向貼近度主觀題自動(dòng)評(píng)分算法的研究[J];計(jì)算機(jī)工程與科學(xué);2011年07期
5 王晉;孫涌;王璁瑋;;基于領(lǐng)域本體的文本相似度算法[J];蘇州大學(xué)學(xué)報(bào)(工科版);2011年03期
6 趙文娟;閆紅梅;王蔚林;;基于漢語(yǔ)框架網(wǎng)的語(yǔ)義角色標(biāo)注算法[J];圖書情報(bào)工作;2011年06期
7 ;[J];;年期
8 ;[J];;年期
9 ;[J];;年期
10 ;[J];;年期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前3條
1 宋彥;張桂平;蔡?hào)|風(fēng);;基于N-gram的句子相似度計(jì)算技術(shù)[A];內(nèi)容計(jì)算的研究與應(yīng)用前沿——第九屆全國(guó)計(jì)算語(yǔ)言學(xué)學(xué)術(shù)會(huì)議論文集[C];2007年
2 張宇;劉挺;高立琦;車萬翔;朱傳靖;;基于常問問題集的在線客服實(shí)驗(yàn)研究[A];全國(guó)第八屆計(jì)算語(yǔ)言學(xué)聯(lián)合學(xué)術(shù)會(huì)議(JSCL-2005)論文集[C];2005年
3 菅小艷;鄭家恒;;一種改進(jìn)的句子相似度計(jì)算方法[A];第二屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議(NCIRCS-2005)論文集[C];2005年
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前3條
1 李旭;基于指紋和語(yǔ)義知識(shí)表示的中文文檔復(fù)制檢測(cè)方法[D];燕山大學(xué);2010年
2 侯鋒;中文報(bào)業(yè)出版的文字質(zhì)量智能輔助控制技術(shù)研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2010年
3 宋玲;語(yǔ)義相似度計(jì)算及其應(yīng)用研究[D];山東大學(xué);2009年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 孫偉;基于文檔復(fù)制檢測(cè)技術(shù)的研究與實(shí)現(xiàn)[D];遼寧工程技術(shù)大學(xué);2010年
2 李婷婷;基于語(yǔ)義結(jié)構(gòu)的學(xué)術(shù)論文復(fù)制檢測(cè)技術(shù)研究與實(shí)現(xiàn)[D];北京郵電大學(xué);2010年
3 劉雙明;文檔復(fù)制檢測(cè)的應(yīng)用研究[D];太原理工大學(xué);2010年
4 王森;基于主題樹的自上而下文本復(fù)制檢測(cè)研究[D];大連理工大學(xué);2010年
5 盧小康;中文文本復(fù)制檢測(cè)技術(shù)研究[D];杭州電子科技大學(xué);2009年
6 薛慧芳;句子相似度計(jì)算理論及應(yīng)用研究[D];西北大學(xué);2011年
7 楊茂;基于句子相似度的文本比對(duì)算法研究[D];電子科技大學(xué);2010年
8 張振幸;基于知網(wǎng)的模塊化的中文句子相似度計(jì)算研究[D];安徽工業(yè)大學(xué);2010年
9 劉青磊;漢語(yǔ)詞語(yǔ)及句子相似度算法研究與應(yīng)用[D];電子科技大學(xué);2011年
10 黃妮;網(wǎng)絡(luò)學(xué)習(xí)平臺(tái)中的分詞與句子相似度算法研究[D];陜西師范大學(xué);2012年
本文關(guān)鍵詞:基于文本結(jié)構(gòu)樹的論文復(fù)制檢測(cè)算法,由筆耕文化傳播整理發(fā)布。
,本文編號(hào):403757
本文鏈接:http://sikaile.net/wenshubaike/gzzj/403757.html