檔案系統(tǒng)中半結(jié)構(gòu)化數(shù)據(jù)重復(fù)錄入偵測(cè)技術(shù)研究
發(fā)布時(shí)間:2021-10-08 14:45
隨著計(jì)算機(jī)的日益普及以及互聯(lián)網(wǎng)技術(shù)的不斷更新,電子檔案的應(yīng)用優(yōu)勢(shì)逐漸突出,越來越多的企業(yè)選擇使用計(jì)算機(jī)實(shí)現(xiàn)對(duì)檔案信息的錄入和儲(chǔ)存,這樣不僅可以避免數(shù)據(jù)丟失,而且還能實(shí)現(xiàn)對(duì)數(shù)據(jù)的高效化管理。但是,隨著數(shù)據(jù)信息復(fù)雜度的逐漸增加,在對(duì)數(shù)據(jù)進(jìn)行錄入存儲(chǔ)時(shí),就給數(shù)據(jù)的重復(fù)錄入埋下了相應(yīng)的安全隱患。倘若不做好數(shù)據(jù)錄入之前的偵測(cè)工作,就會(huì)給數(shù)據(jù)庫的運(yùn)行造成負(fù)擔(dān)。本文在研究過程中,運(yùn)用vue.js框架設(shè)計(jì)與開發(fā)了檔案錄入管理系統(tǒng),該系統(tǒng)具備數(shù)據(jù)信息規(guī)范化錄入、查看、多條件搜索等多種功能,并對(duì)不同的人員設(shè)置了不同的使用權(quán)限,保障了數(shù)據(jù)存儲(chǔ)的安全性。但是當(dāng)錄入數(shù)據(jù)時(shí),為了避免重復(fù)性數(shù)據(jù)的錄入,只對(duì)檔案名稱進(jìn)行了唯一性限制,即:只要與檔案同名的都不準(zhǔn)予錄入,這樣就增大了惡意性重復(fù)數(shù)據(jù)的錄入。而數(shù)據(jù)在錄入之前,為了避免出現(xiàn)錯(cuò)錄、漏錄以及重錄的情況,需要對(duì)半結(jié)構(gòu)化數(shù)據(jù)進(jìn)行解析與判重,故就將問題歸結(jié)為半結(jié)構(gòu)化數(shù)據(jù)重復(fù)錄入問題的研究。在解決問題時(shí),運(yùn)用案例分析法、文獻(xiàn)分析法以及比較歸納法,對(duì)檔案錄入管理系統(tǒng)的錄入方式進(jìn)行了創(chuàng)新,構(gòu)建了一種基于權(quán)重分析法的相似度判定模型,提出了半結(jié)構(gòu)化數(shù)據(jù)重復(fù)錄入偵測(cè)技術(shù)。該種方法不...
【文章來源】:華中師范大學(xué)湖北省 211工程院校 教育部直屬院校
【文章頁數(shù)】:64 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖2.1結(jié)構(gòu)2.1.2非結(jié)構(gòu)化數(shù)據(jù)??
?碩士學(xué)位論文??MASTF.R'STIIF.SIS??;!?11?//javascript??12-?var?person={??13?"name..:?"Nicholas",??14?Hagen:29??IS?};??::16??17-?{??18?"name":?"Nicholas1',??19?“age":29??20?}??21?.?■?,>i苧周??22-{??23?"name":?"Nicholas",??24?"age":29,??2S?"school":{??26?"name":?"Merrimack?College",??27?"location":?"North?Andover^MA"??28?}??29?}??30??圖2.3?JSON數(shù)據(jù)格式表示對(duì)象??運(yùn)用jSON表示數(shù)組時(shí),通常與JavaScript語言表示方法炎:似,采用字而量??的形式實(shí)現(xiàn)對(duì)數(shù)組的表示,但是JSON數(shù)據(jù)表示形式一般不具備變量和分號(hào)。如??圖2.4所示。??.31/7??32?var?values=[25,hi”,tnje];??:33?//—VNA式_?域??34?E25,"hi",true]??35??圖2.4?JSON數(shù)據(jù)格式表示數(shù)m??JSON數(shù)則格式還可表示史為雜的數(shù)據(jù)類型,即將數(shù)纟丨I與對(duì)象結(jié)合起來,??既可以在一個(gè)數(shù)組中表示多個(gè)對(duì)象,又可以在一個(gè)對(duì)象中表示一個(gè)數(shù)組。如圖2.5??所示。??8??
?碩士學(xué)位論文??MASTF.R'STIIF.SIS??;!?11?//javascript??12-?var?person={??13?"name..:?"Nicholas",??14?Hagen:29??IS?};??::16??17-?{??18?"name":?"Nicholas1',??19?“age":29??20?}??21?.?■?,>i苧周??22-{??23?"name":?"Nicholas",??24?"age":29,??2S?"school":{??26?"name":?"Merrimack?College",??27?"location":?"North?Andover^MA"??28?}??29?}??30??圖2.3?JSON數(shù)據(jù)格式表示對(duì)象??運(yùn)用jSON表示數(shù)組時(shí),通常與JavaScript語言表示方法炎:似,采用字而量??的形式實(shí)現(xiàn)對(duì)數(shù)組的表示,但是JSON數(shù)據(jù)表示形式一般不具備變量和分號(hào)。如??圖2.4所示。??.31/7??32?var?values=[25,hi”,tnje];??:33?//—VNA式_。坑??34?E25,"hi",true]??35??圖2.4?JSON數(shù)據(jù)格式表示數(shù)m??JSON數(shù)則格式還可表示史為雜的數(shù)據(jù)類型,即將數(shù)纟丨I與對(duì)象結(jié)合起來,??既可以在一個(gè)數(shù)組中表示多個(gè)對(duì)象,又可以在一個(gè)對(duì)象中表示一個(gè)數(shù)組。如圖2.5??所示。??8??
【參考文獻(xiàn)】:
期刊論文
[1]結(jié)構(gòu)化數(shù)據(jù)清洗技術(shù)綜述[J]. 郝爽,李國良,馮建華,王寧. 清華大學(xué)學(xué)報(bào)(自然科學(xué)版). 2018(12)
[2]輕量級(jí)響應(yīng)式框架Vue.js應(yīng)用分析[J]. 陳巖. 中國管理信息化. 2018(03)
[3]基于VueJs的WEB前端開發(fā)研究[J]. 徐頔,朱廣華,賈瑤. 科技風(fēng). 2017(14)
[4]基于WEB開發(fā)中的XML與JSON數(shù)據(jù)傳輸格式研究[J]. 仇小花,秦栓栓,邱果. 信息技術(shù)與信息化. 2017(04)
[5]面向論文相似性檢測(cè)的數(shù)據(jù)預(yù)處理研究[J]. 劉伙玉,王東波. 現(xiàn)代圖書情報(bào)技術(shù). 2015(05)
[6]Node.js:一種新的Web應(yīng)用構(gòu)建技術(shù)[J]. 王金龍,宋斌,丁銳. 現(xiàn)代電子技術(shù). 2015(06)
[7]基于Simhash算法的大規(guī)模文檔去重技術(shù)研究[J]. 余意,張玉柱,胡自健. 信息通信. 2015(02)
[8]中文短文本去重方法研究[J]. 高翔,李兵. 計(jì)算機(jī)工程與應(yīng)用. 2014(16)
[9]JSON格式數(shù)據(jù)在Web開發(fā)中的應(yīng)用[J]. 龔建華. 辦公自動(dòng)化. 2013(20)
[10]不確定數(shù)據(jù)的重復(fù)記錄檢測(cè)[J]. 鄧慧挺,毛宇光. 計(jì)算機(jī)技術(shù)與發(fā)展. 2012(08)
碩士論文
[1]基于simhash的文本相似檢測(cè)算法研究[D]. 姜雪.中國工程物理研究院 2017
[2]非結(jié)構(gòu)化到結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)換的研究與實(shí)現(xiàn)[D]. 萬里鵬.西南交通大學(xué) 2013
[3]數(shù)據(jù)預(yù)處理系統(tǒng)的幾個(gè)關(guān)鍵技術(shù)研究與實(shí)現(xiàn)[D]. 白鳳偉.北京交通大學(xué) 2012
[4]基于Web的企業(yè)文件檔案管理信息系統(tǒng)軟件開發(fā)與研究[D]. 高劍坤.重慶大學(xué) 2004
本文編號(hào):3424373
【文章來源】:華中師范大學(xué)湖北省 211工程院校 教育部直屬院校
【文章頁數(shù)】:64 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖2.1結(jié)構(gòu)2.1.2非結(jié)構(gòu)化數(shù)據(jù)??
?碩士學(xué)位論文??MASTF.R'STIIF.SIS??;!?11?//javascript??12-?var?person={??13?"name..:?"Nicholas",??14?Hagen:29??IS?};??::16??17-?{??18?"name":?"Nicholas1',??19?“age":29??20?}??21?.?■?,>i苧周??22-{??23?"name":?"Nicholas",??24?"age":29,??2S?"school":{??26?"name":?"Merrimack?College",??27?"location":?"North?Andover^MA"??28?}??29?}??30??圖2.3?JSON數(shù)據(jù)格式表示對(duì)象??運(yùn)用jSON表示數(shù)組時(shí),通常與JavaScript語言表示方法炎:似,采用字而量??的形式實(shí)現(xiàn)對(duì)數(shù)組的表示,但是JSON數(shù)據(jù)表示形式一般不具備變量和分號(hào)。如??圖2.4所示。??.31/7??32?var?values=[25,hi”,tnje];??:33?//—VNA式_?域??34?E25,"hi",true]??35??圖2.4?JSON數(shù)據(jù)格式表示數(shù)m??JSON數(shù)則格式還可表示史為雜的數(shù)據(jù)類型,即將數(shù)纟丨I與對(duì)象結(jié)合起來,??既可以在一個(gè)數(shù)組中表示多個(gè)對(duì)象,又可以在一個(gè)對(duì)象中表示一個(gè)數(shù)組。如圖2.5??所示。??8??
?碩士學(xué)位論文??MASTF.R'STIIF.SIS??;!?11?//javascript??12-?var?person={??13?"name..:?"Nicholas",??14?Hagen:29??IS?};??::16??17-?{??18?"name":?"Nicholas1',??19?“age":29??20?}??21?.?■?,>i苧周??22-{??23?"name":?"Nicholas",??24?"age":29,??2S?"school":{??26?"name":?"Merrimack?College",??27?"location":?"North?Andover^MA"??28?}??29?}??30??圖2.3?JSON數(shù)據(jù)格式表示對(duì)象??運(yùn)用jSON表示數(shù)組時(shí),通常與JavaScript語言表示方法炎:似,采用字而量??的形式實(shí)現(xiàn)對(duì)數(shù)組的表示,但是JSON數(shù)據(jù)表示形式一般不具備變量和分號(hào)。如??圖2.4所示。??.31/7??32?var?values=[25,hi”,tnje];??:33?//—VNA式_。坑??34?E25,"hi",true]??35??圖2.4?JSON數(shù)據(jù)格式表示數(shù)m??JSON數(shù)則格式還可表示史為雜的數(shù)據(jù)類型,即將數(shù)纟丨I與對(duì)象結(jié)合起來,??既可以在一個(gè)數(shù)組中表示多個(gè)對(duì)象,又可以在一個(gè)對(duì)象中表示一個(gè)數(shù)組。如圖2.5??所示。??8??
【參考文獻(xiàn)】:
期刊論文
[1]結(jié)構(gòu)化數(shù)據(jù)清洗技術(shù)綜述[J]. 郝爽,李國良,馮建華,王寧. 清華大學(xué)學(xué)報(bào)(自然科學(xué)版). 2018(12)
[2]輕量級(jí)響應(yīng)式框架Vue.js應(yīng)用分析[J]. 陳巖. 中國管理信息化. 2018(03)
[3]基于VueJs的WEB前端開發(fā)研究[J]. 徐頔,朱廣華,賈瑤. 科技風(fēng). 2017(14)
[4]基于WEB開發(fā)中的XML與JSON數(shù)據(jù)傳輸格式研究[J]. 仇小花,秦栓栓,邱果. 信息技術(shù)與信息化. 2017(04)
[5]面向論文相似性檢測(cè)的數(shù)據(jù)預(yù)處理研究[J]. 劉伙玉,王東波. 現(xiàn)代圖書情報(bào)技術(shù). 2015(05)
[6]Node.js:一種新的Web應(yīng)用構(gòu)建技術(shù)[J]. 王金龍,宋斌,丁銳. 現(xiàn)代電子技術(shù). 2015(06)
[7]基于Simhash算法的大規(guī)模文檔去重技術(shù)研究[J]. 余意,張玉柱,胡自健. 信息通信. 2015(02)
[8]中文短文本去重方法研究[J]. 高翔,李兵. 計(jì)算機(jī)工程與應(yīng)用. 2014(16)
[9]JSON格式數(shù)據(jù)在Web開發(fā)中的應(yīng)用[J]. 龔建華. 辦公自動(dòng)化. 2013(20)
[10]不確定數(shù)據(jù)的重復(fù)記錄檢測(cè)[J]. 鄧慧挺,毛宇光. 計(jì)算機(jī)技術(shù)與發(fā)展. 2012(08)
碩士論文
[1]基于simhash的文本相似檢測(cè)算法研究[D]. 姜雪.中國工程物理研究院 2017
[2]非結(jié)構(gòu)化到結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)換的研究與實(shí)現(xiàn)[D]. 萬里鵬.西南交通大學(xué) 2013
[3]數(shù)據(jù)預(yù)處理系統(tǒng)的幾個(gè)關(guān)鍵技術(shù)研究與實(shí)現(xiàn)[D]. 白鳳偉.北京交通大學(xué) 2012
[4]基于Web的企業(yè)文件檔案管理信息系統(tǒng)軟件開發(fā)與研究[D]. 高劍坤.重慶大學(xué) 2004
本文編號(hào):3424373
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3424373.html
最近更新
教材專著