論文抄襲檢測中特征選擇
本文關(guān)鍵詞:論文抄襲檢測中特征選擇,,由筆耕文化傳播整理發(fā)布。
【摘要】:選取多少個最佳特征以及采用什么評估函數(shù),針對不同的問題選取策略也有所不同。針對論文抄襲檢測問題,如何確定特征選擇數(shù)量和選擇評估函數(shù)是文章研究的目的。在分析論文抄襲的主要形式和手段基礎(chǔ)上,針對文本內(nèi)容抄襲,闡述了文本特征表示的主要方法和特征選擇常用策略,最后對實驗結(jié)果進行分析,得出基本結(jié)論。
【作者單位】: 安徽財經(jīng)大學(xué)成人教育學(xué)院;
【關(guān)鍵詞】: 抄襲檢測 特征選擇 文本表示 向量空間模型
【基金】:教育部社科研究基金青年項目(07JC870006) 安徽財經(jīng)大學(xué)教研重點項目(ACJYZD200914)
【分類號】:TP391.43
【正文快照】: 1引言論文抄襲的形式和手段多種多樣,具體包括抄襲觀點、文字、圖像、表格、數(shù)據(jù)、模型與公式等。在所曝光的案例中,文本抄襲的情況占大多數(shù),因此本文主要研究論文抄襲中文本內(nèi)容抄襲的檢測問題。從一篇文檔的語法層次來看,它是由詞、短語、句子和段落所構(gòu)成的。所以,這
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前2條
1 程澤凱,陸小藝;文本分類中的特征選擇方法[J];安徽工業(yè)大學(xué)學(xué)報(自然科學(xué)版);2004年03期
2 劉麗珍,宋瀚濤;文本分類中的特征選取[J];計算機工程;2004年04期
【共引文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 谷峰;吳揚揚;;文本分類關(guān)鍵技術(shù)[J];福建電腦;2006年09期
2 張脂平,林世平;Web文本挖掘中特征提取算法的分析及改進[J];福州大學(xué)學(xué)報(自然科學(xué)版);2004年S1期
3 謝科;張輝;陳鵬;龐斌;;文本分類系統(tǒng)關(guān)鍵技術(shù)[J];廣西師范大學(xué)學(xué)報(自然科學(xué)版);2007年02期
4 鐘茂生;WEB頁面的模糊聚類[J];華東交通大學(xué)學(xué)報;2004年05期
5 程澤凱,陸小藝;文本分類中的特征選擇方法[J];安徽工業(yè)大學(xué)學(xué)報(自然科學(xué)版);2004年03期
6 張玉葉;李連;劉海見;王春歆;;文本過濾中的特征抽取應(yīng)用研究[J];海軍航空工程學(xué)院學(xué)報;2005年01期
7 石敏;康耀紅;;一種聯(lián)合的文本分類特征抽取函數(shù)[J];海南大學(xué)學(xué)報(自然科學(xué)版);2005年04期
8 萬樂;劉萬春;;類別特征詞權(quán)重加權(quán)文本分類方法[J];軍民兩用技術(shù)與產(chǎn)品;2006年03期
9 陸玉昌,魯明羽,李凡,周立柱;向量空間法中單詞權(quán)重函數(shù)的分析和構(gòu)造[J];計算機研究與發(fā)展;2002年10期
10 唐煥玲,孫建濤,陸玉昌;文本分類中結(jié)合評估函數(shù)的TEF-WA權(quán)值調(diào)整技術(shù)[J];計算機研究與發(fā)展;2005年01期
中國重要會議論文全文數(shù)據(jù)庫 前1條
1 魯明羽;孫建濤;陸玉昌;;一種基于聯(lián)想的網(wǎng)頁推薦方法[A];第五屆全球智能控制與自動化大會會議論文集(4)[C];2004年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前4條
1 徐建鎖;知識管理和文本挖掘的若干問題研究[D];天津大學(xué);2004年
2 張友華;面向智能服務(wù)的Web內(nèi)容計算研究與應(yīng)用[D];中國科學(xué)技術(shù)大學(xué);2006年
3 王秀娟;文本檢索中若干問題研究[D];北京郵電大學(xué);2006年
4 謝學(xué)敏;基于動態(tài)流通語料庫(DCC)的流行語釋義信息自動提取研究[D];北京語言大學(xué);2006年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 何堯;基于半監(jiān)督學(xué)習(xí)的中文文檔分類技術(shù)研究[D];中南大學(xué);2005年
2 范彥彬;基礎(chǔ)教育資源搜索引擎中自動文摘技術(shù)研究[D];南京師范大學(xué);2006年
3 廖海波;基于投影尋蹤回歸的文本分類研究[D];江西師范大學(xué);2005年
4 付雪峰;基于模糊—粗糙集的文本分類模型[D];江西師范大學(xué);2005年
5 朱瑋;IRT和規(guī)則空間在文本分類中的應(yīng)用研究[D];江西師范大學(xué);2005年
6 劉建波;基于Agent的用戶興趣模型的研究[D];沈陽工業(yè)大學(xué);2005年
7 王曉慶;基于RBF網(wǎng)絡(luò)的文本自動分類的研究[D];江西師范大學(xué);2003年
8 鐘茂生;基于智能Agent的個性化Web瀏覽器研究與實現(xiàn)[D];江西師范大學(xué);2003年
9 王漢萍;粗糙集理論在文本挖掘的分類算法中的應(yīng)用研究[D];中國海洋大學(xué);2003年
10 劉鋼;基于神經(jīng)網(wǎng)絡(luò)的文本分類系統(tǒng)NNTCS的設(shè)計和實現(xiàn)[D];中國科學(xué)院研究生院(軟件研究所);2003年
【二級參考文獻】
中國期刊全文數(shù)據(jù)庫 前4條
1 范勁松,方廷健;特征選擇和提取要素的分析及其評價[J];計算機工程與應(yīng)用;2001年13期
2 張寧,賈自艷,史忠植;使用KNN算法的文本分類[J];計算機工程;2005年08期
3 秦進,陳笑蓉,汪維家,陸汝占;文本分類中的特征抽取[J];計算機應(yīng)用;2003年02期
4 龐劍鋒,卜東波,白碩;基于向量空間模型的文本自動分類系統(tǒng)的研究與實現(xiàn)[J];計算機應(yīng)用研究;2001年09期
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 李正;倪遠平;劉迪;王海鵬;;實蠅圖像識別中的形態(tài)特征提取研究[J];機械與電子;2010年S1期
2 馮霞;劉志輝;田繼存;;基于假設(shè)檢驗的文本分類特征選擇[J];信息與控制;2011年03期
3 張國梁;肖超鋒;;基于SVM新聞文本分類的研究[J];電子技術(shù);2011年08期
4 鄭婭峰;張巧榮;肖會敏;;自動特征選擇和加權(quán)的圖像顯著區(qū)域檢測[J];計算機工程與應(yīng)用;2011年24期
5 冷強奎;秦玉平;王春立;;基于句子相似度的論文抄襲檢測模型研究[J];計算機工程與應(yīng)用;2011年24期
6 王桂娟;印鑒;詹衛(wèi)許;;基于類別信息的特征子圖選擇策略[J];計算機科學(xué);2011年08期
7 楊經(jīng);林世平;;基于SVM的文本詞句情感分析[J];計算機應(yīng)用與軟件;2011年09期
8 奉國和;鄭偉;;文本分類特征降維研究綜述[J];圖書情報工作;2011年09期
9 孟佳娜;林鴻飛;李彥鵬;;基于特征貢獻度的特征選擇方法在文本分類中應(yīng)用[J];大連理工大學(xué)學(xué)報;2011年04期
10 計智偉;胡珉;;一種雙重過濾式特征選擇算法[J];計算機工程與應(yīng)用;2011年19期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 李娜;曾向陽;;目標識別中的樣本選擇和特征選擇聯(lián)合算法研究[A];2009年西安-上海聲學(xué)學(xué)術(shù)會議論文集[C];2009年
2 張永;陳思睿;楊志勇;;一種改進的文本分類方法的研究[A];第二屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議(NCIRCS-2005)論文集[C];2005年
3 徐燕;孫春明;王斌;李錦濤;;基于詞條頻率的特征選擇算法研究[A];中文信息處理前沿進展——中國中文信息學(xué)會二十五周年學(xué)術(shù)會議論文集[C];2006年
4 靖紅芳;王斌;楊雅輝;;基于類別分布的特征選擇框架[A];第四屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集(上)[C];2008年
5 劉怡;高s
本文編號:440803
本文鏈接:http://sikaile.net/wenshubaike/gzzj/440803.html