基于篇章結(jié)構(gòu)相似度的中文學術(shù)論文復制檢測技術(shù)研究
本文關(guān)鍵詞:基于篇章結(jié)構(gòu)相似度的中文學術(shù)論文復制檢測技術(shù)研究
更多相關(guān)文章: 復制檢測 向量空間模型 特征提取 篇章結(jié)構(gòu) 文本相似度
【摘要】:文檔復制檢測技術(shù)能夠自動檢測出數(shù)字文檔間的重疊信息,它是保護知識產(chǎn)權(quán)和提高信息檢索效率的一種有力手段。為解決中文學術(shù)論文復制檢測難題,給出一種基于篇章結(jié)構(gòu)相似度的中文學術(shù)論文復制檢測算法及其問題的數(shù)學模型。在分析論文篇章結(jié)構(gòu)的基礎(chǔ)上,利用數(shù)字指紋和詞頻統(tǒng)計等技術(shù),經(jīng)編程實現(xiàn),用于中文論文復制的初步檢測。
【作者單位】: 海軍航空工程學院;
【關(guān)鍵詞】: 復制檢測 向量空間模型 特征提取 篇章結(jié)構(gòu) 文本相似度
【分類號】:TP391.1
【正文快照】: 0引言隨著網(wǎng)上數(shù)字學術(shù)資源的不斷豐富,為廣大科研工作者提供便捷的學術(shù)交流機會的同時,也給剽竊提供了機會。文檔復制檢測技術(shù)是為了防止數(shù)字文檔的非法復制和擴散而提出的,在知識產(chǎn)權(quán)保護和信息檢索中有著重要應用,是近年來數(shù)據(jù)安全領(lǐng)域研究的熱點。文檔復制檢測就是判斷一
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前5條
1 金博,史彥軍,滕弘飛;基于語義理解的文本相似度算法[J];大連理工大學學報;2005年02期
2 鮑軍鵬,沈鈞毅,劉曉東,宋擒豹;自然語言文檔復制檢測研究綜述[J];軟件學報;2003年10期
3 宋擒豹,楊向榮,沈鈞毅,齊勇;數(shù)字商品非法復制的檢測算法[J];計算機學報;2002年11期
4 金博;史彥軍;滕弘飛;;基于篇章結(jié)構(gòu)相似度的復制檢測算法[J];大連理工大學學報;2007年01期
5 鮑軍鵬,沈鈞毅,劉曉東;一個基于網(wǎng)格的文本復制檢測系統(tǒng)[J];微電子學與計算機;2004年09期
【共引文獻】
中國期刊全文數(shù)據(jù)庫 前6條
1 王凌峰;;學術(shù)規(guī)范中反剽竊的信息技術(shù)視角[J];圖書與情報;2006年04期
2 史彥軍,滕弘飛,金博;抄襲論文識別研究與進展[J];大連理工大學學報;2005年01期
3 金博;史彥軍;滕弘飛;;基于篇章結(jié)構(gòu)相似度的復制檢測算法[J];大連理工大學學報;2007年01期
4 金博,史彥軍,滕弘飛;中文文檔復制檢測系統(tǒng)研究[J];計算機工程;2005年19期
5 王生發(fā);顧新建;郭劍鋒;馬軍;戰(zhàn)洪飛;;面向產(chǎn)品設計的知識主動推送研究[J];計算機集成制造系統(tǒng);2007年02期
6 白廣慧,連浩,劉悅,程學旗;網(wǎng)頁查重技術(shù)在企業(yè)數(shù)據(jù)倉庫中的應用[J];計算機應用;2005年07期
中國重要會議論文全文數(shù)據(jù)庫 前1條
1 連浩;劉悅;許洪波;王斌;程學旗;;一種改進的基于內(nèi)容的快速網(wǎng)頁查重算法[A];全國第八屆計算語言學聯(lián)合學術(shù)會議(JSCL-2005)論文集[C];2005年
中國博士學位論文全文數(shù)據(jù)庫 前1條
1 于寶琴;成套電器企業(yè)異構(gòu)數(shù)據(jù)整合及其物流系統(tǒng)的研究[D];天津大學;2006年
中國碩士學位論文全文數(shù)據(jù)庫 前10條
1 王金寶;基于增量學習和閥值優(yōu)化的自適應信息過濾[D];大連理工大學;2006年
2 張艷;面向高校師生的應用文機輔寫作關(guān)鍵技術(shù)研究[D];大連理工大學;2006年
3 沈斌;基于分詞的中文文本相似度計算研究[D];天津財經(jīng)大學;2006年
4 連浩;基于布爾模型的網(wǎng)頁查重算法研究[D];中國科學院研究生院(計算技術(shù)研究所);2006年
5 李志輝;基于專業(yè)知網(wǎng)的中文智能答疑系統(tǒng)模型研究[D];西南大學;2006年
6 熊志勇;數(shù)據(jù)挖掘在反垃圾郵件領(lǐng)域中的應用與研究[D];南昌大學;2006年
7 于海英;程序代碼相似度識別的研究[D];內(nèi)蒙古師范大學;2006年
8 楊俊;網(wǎng)格環(huán)境下數(shù)據(jù)存儲方法的研究[D];黑龍江大學;2005年
9 黃永光;基于網(wǎng)頁挖掘的搜索引擎若干技術(shù)的研究[D];哈爾濱工業(yè)大學;2006年
10 張玉娟;基于《知網(wǎng)》的句子相似度計算的研究[D];中國地質(zhì)大學(北京);2006年
【二級參考文獻】
中國期刊全文數(shù)據(jù)庫 前9條
1 史彥軍,滕弘飛,金博;抄襲論文識別研究與進展[J];大連理工大學學報;2005年01期
2 金博,史彥軍,滕弘飛;基于語義理解的文本相似度算法[J];大連理工大學學報;2005年02期
3 金博;史彥軍;滕弘飛;;基于篇章結(jié)構(gòu)相似度的復制檢測算法[J];大連理工大學學報;2007年01期
4 王繼成 ,武港山 ,周源遠 ,張福炎;一種篇章結(jié)構(gòu)指導的中文Web文檔自動摘要方法[J];計算機研究與發(fā)展;2003年03期
5 李素建;基于語義計算的語句相關(guān)度研究[J];計算機工程與應用;2002年07期
6 盧漢清,孔維新,廖明,馬頌德;基于內(nèi)容的視頻信號與圖像庫檢索中的圖像技術(shù)[J];自動化學報;2001年01期
7 張益民,陸汝占,沈李斌;一種混合型的漢語篇章結(jié)構(gòu)自動分析方法[J];軟件學報;2000年11期
8 鮑軍鵬,沈鈞毅,劉曉東,宋擒豹;自然語言文檔復制檢測研究綜述[J];軟件學報;2003年10期
9 余剛;裴仰軍;朱征宇;陳華月;;基于詞匯語義計算的文本相似度研究[J];計算機工程與設計;2006年02期
中國重要會議論文全文數(shù)據(jù)庫 前2條
1 郝長伶;董強;;知網(wǎng)知識庫描述語言[A];語言計算與基于內(nèi)容的文本處理——全國第七屆計算語言學聯(lián)合學術(shù)會議論文集[C];2003年
2 車萬翔;劉挺;秦兵;李生;;面向雙語句對檢索的漢語句子相似度計算[A];語言計算與基于內(nèi)容的文本處理——全國第七屆計算語言學聯(lián)合學術(shù)會議論文集[C];2003年
中國碩士學位論文全文數(shù)據(jù)庫 前1條
1 程克敏;基于文本結(jié)構(gòu)和內(nèi)容的中文論文復制檢測系統(tǒng)研究[D];合肥工業(yè)大學;2007年
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 王愛軍;;數(shù)字電視的信息過濾技術(shù)分析與應用[J];科技資訊;2010年03期
2 汪忠國;吳敏;;基于向量空間模型的題庫相似度檢查算法[J];計算機系統(tǒng)應用;2010年03期
3 劉聲田;盧守東;劉忠強;;基于用戶關(guān)聯(lián)行為的個性化搜索系統(tǒng)設計[J];計算機系統(tǒng)應用;2010年03期
4 邢長征;孫偉;;一種改進的基于句子相似度的檢測算法[J];計算機系統(tǒng)應用;2010年02期
5 索紅光;孫珊珊;王玉偉;梁玉環(huán);;基于主題短語的搜索引擎結(jié)果聚類[J];計算機系統(tǒng)應用;2010年03期
6 吉家友;;學術(shù)不端文獻檢測系統(tǒng)數(shù)據(jù)分析[J];中國出版;2010年04期
7 陸偉;劉杰;秦喜艷;;基于專長詞表的圖情領(lǐng)域?qū)<覚z索與評價[J];中國圖書館學報;2010年02期
8 胡曉翠;陳建勛;;對數(shù)碼產(chǎn)品主題爬蟲的設計與實現(xiàn)[J];計算機應用與軟件;2010年02期
9 宋宣辰;劉貴全;;基于主題概念抽取的多文檔文摘方法[J];計算機工程;2010年04期
10 趙敏涯;;結(jié)合語言模型的自動文本分類的應用研究[J];計算機與現(xiàn)代化;2010年03期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 侯松;周斌;賈焰;;分詞結(jié)果的再搭配對文本分類效果的增強[A];全國計算機安全學術(shù)交流會論文集(第二十四卷)[C];2009年
2 柏桂榮;章勇;;基于RSS的用戶興趣模型研究[A];2009通信理論與技術(shù)新發(fā)展——第十四屆全國青年通信學術(shù)會議論文集[C];2009年
3 杜魯燕;苗振江;;基于語言模型的中文文本分類系統(tǒng)[A];第十屆全國人機語音通訊學術(shù)會議暨國際語音語言處理研討會論文摘要集[C];2009年
4 陳慶軒;鄭德權(quán);趙鐵軍;;多分類器融合的文本分類技術(shù)研究[A];2008'中國信息技術(shù)與應用學術(shù)論壇論文集(二)[C];2008年
5 劉國剛;;人工智能客戶服務體系的研究與實現(xiàn)[A];2008年中國通信學會無線及移動通信委員會學術(shù)年會論文集[C];2008年
6 林臻彪;陳性元;汪永偉;;基于數(shù)據(jù)流分析的內(nèi)網(wǎng)防泄密系統(tǒng)[A];2008通信理論與技術(shù)新進展——第十三屆全國青年通信學術(shù)會議論文集(上)[C];2008年
7 郭鴻志;陳清才;康永燕;王曉龍;;一種基于網(wǎng)站特征識別的搜索引擎排序算法[A];第四屆全國信息檢索與內(nèi)容安全學術(shù)會議論文集(上)[C];2008年
8 鄒博偉;張宇;范基禮;鄭偉;劉挺;;基于改進的TextTiling方法的用戶新興趣發(fā)現(xiàn)的研究[A];第四屆全國信息檢索與內(nèi)容安全學術(shù)會議論文集(上)[C];2008年
9 李軍;李涓子;;新聞專題內(nèi)子話題劃分[A];第四屆全國信息檢索與內(nèi)容安全學術(shù)會議論文集(上)[C];2008年
10 黃國斌;王明文;葉浩;;一種新的基于中間語義的跨語言信息檢索模型[A];第四屆全國信息檢索與內(nèi)容安全學術(shù)會議論文集(上)[C];2008年
中國重要報紙全文數(shù)據(jù)庫 前2條
1 中國科學院計算技術(shù)研究所 王 斌;內(nèi)容為王[N];計算機世界;2004年
2 清華大學計算機系智能技術(shù)與系統(tǒng)國家重點實驗室 張敏 金奕江;尋“寶”有術(shù)[N];計算機世界;2003年
中國博士學位論文全文數(shù)據(jù)庫 前10條
1 王小芳;文本主題域劃分與無監(jiān)督特征提取[D];吉林大學;2009年
2 孫道軍;文本挖掘預處理相關(guān)基礎(chǔ)技術(shù)分析與應用研究[D];北京郵電大學;2008年
3 王菁;P2P系統(tǒng)中資源管理機制的研究[D];中國科學技術(shù)大學;2007年
4 劉濤;現(xiàn)代信息檢索中的文本分類及圖像恢復研究[D];北京郵電大學;2006年
5 熊文新;信息檢索Query語言分析[D];北京語言大學;2006年
6 張榕;術(shù)語定義抽取、聚類與術(shù)語識別研究[D];北京語言大學;2006年
7 王修力;基于描述復雜性的信息檢索理論與若干模型研究[D];北京語言大學;2006年
8 王進;基于本體的語義信息檢索研究[D];中國科學技術(shù)大學;2006年
9 喬林;基于多關(guān)鍵詞檢索的企業(yè)競爭情報搜集方法研究[D];中國科學技術(shù)大學;2006年
10 杜衛(wèi)鋒;粗糙集理論在中文文本分類中的應用[D];西南交通大學;2006年
中國碩士學位論文全文數(shù)據(jù)庫 前10條
1 邱萌;基于內(nèi)容的多源新聞聚合關(guān)鍵技術(shù)研究與實現(xiàn)[D];華東師范大學;2010年
2 高娟;基于K-means算法的文本聚類的研究與實現(xiàn)[D];江西理工大學;2010年
3 李s,
本文編號:1046564
本文鏈接:http://sikaile.net/wenshubaike/lwzy/1046564.html