一種基于語義向量空間模型的作業(yè)查重算法
發(fā)布時間:2017-08-13 01:23
本文關鍵詞:一種基于語義向量空間模型的作業(yè)查重算法
【摘要】:甄別作業(yè)重復和減少學術抄襲是教學實踐中的難點之一,近年來出現了許多基于文本相似度計算的作業(yè)查重算法,而文本相似度計算的精確性是此類算法的核心。傳統(tǒng)的基于向量空間模型的文本相似度算法只考慮文本中出現的詞項,而沒有利用詞項的語義信息,針對上述不足,本文采用"刪除去除詞"、"合并近義詞"、"以語義主題作為向量空間的維度"3種策略對該算法進行了改進。通過設計中文文本相似度計算組件將算法運用到作業(yè)查重中,并在真實數據中進行測試。測試結果表明,本文提出的算法相比傳統(tǒng)的向量空間模型算法,其精確性有了進一步的提高。
【作者單位】: 南通科技職業(yè)學院;
【關鍵詞】: 向量空間模型 文本相似度 語義分析
【基金】:江蘇省大學生創(chuàng)新創(chuàng)業(yè)訓練計劃項目“微課移動學習平臺的設計與實現”(201612684012Y)
【分類號】:TP391.1
【正文快照】: 引言 信息化時代各類學習網站、作業(yè)平臺的大量涌現,在給教學帶來方便的同時,也出現了一些問題。部分學生在提交電子作業(yè)時存在僥幸心理,抄襲或只對同學作業(yè)稍做修改,甚至出現抄襲往屆學生作業(yè)的現象時有發(fā)生,完全靠教師人工檢測難度較大。如何甄別作業(yè)重復和減少學術抄襲是,
本文編號:664681
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/664681.html