天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 軟件論文 >

數(shù)據(jù)挖掘技術(shù)在檔案信息管理中的應(yīng)用研究

發(fā)布時(shí)間:2018-06-18 08:19

  本文選題:檔案管理 + 數(shù)據(jù)倉(cāng)庫(kù)。 參考:《天津大學(xué)》2016年碩士論文


【摘要】:數(shù)據(jù)挖掘是指從大量數(shù)據(jù)中通過(guò)算法搜索隱藏于其中知識(shí)的過(guò)程,作為一種知識(shí)發(fā)現(xiàn)技術(shù)它已經(jīng)在很多數(shù)據(jù)密集型行業(yè)得到廣泛應(yīng)用。檔案是指人們?cè)诟黜?xiàng)社會(huì)活動(dòng)中直接形成的各種形式的具有保存價(jià)值的原始記錄,在我國(guó)檔案界多年的計(jì)算機(jī)管理中形成了大量的電子數(shù)據(jù),但這些數(shù)據(jù)的利用還比較初級(jí),只是基于數(shù)據(jù)庫(kù)層面的查詢、統(tǒng)計(jì)、分析等。針對(duì)這種局面,本文嘗試將數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)挖掘技術(shù)應(yīng)用于檔案信息管理工作,通過(guò)分析檔案利用數(shù)據(jù)庫(kù)和檔案歸檔數(shù)據(jù)庫(kù),揭示檔案與利用者之間、檔案與各歸檔單位之間以及檔案之間的關(guān)系,從而在更深層次上發(fā)揮檔案數(shù)據(jù)在新時(shí)代的信息價(jià)值。文章主要從檔案數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì)、數(shù)據(jù)ETL、多維數(shù)據(jù)模型的建立、數(shù)據(jù)挖掘算法選擇、數(shù)據(jù)挖掘模型應(yīng)用等方面論述了將數(shù)據(jù)挖掘技術(shù)與檔案工作相結(jié)合的具體實(shí)踐,實(shí)現(xiàn)了檔案數(shù)據(jù)挖掘的基本過(guò)程。首先對(duì)構(gòu)建數(shù)據(jù)倉(cāng)庫(kù)進(jìn)行詳細(xì)的需求分析,確定主題和用戶,根據(jù)已有的檔案業(yè)務(wù)數(shù)據(jù)庫(kù)確定數(shù)據(jù)倉(cāng)庫(kù)的維度表和事實(shí)表,并最終采用星型模式創(chuàng)建檔案數(shù)據(jù)倉(cāng)庫(kù);然后通過(guò)數(shù)據(jù)ETL將檔案原始數(shù)據(jù)源經(jīng)過(guò)抽取、轉(zhuǎn)換,加載進(jìn)入數(shù)據(jù)倉(cāng)庫(kù),這個(gè)過(guò)程主要是對(duì)檔案數(shù)據(jù)進(jìn)行預(yù)處理和清理工作;接著再利用OLAP工具對(duì)檔案多維數(shù)據(jù)集進(jìn)行多角度和多視圖的查詢,以更好的理解檔案數(shù)據(jù);最后在檔案數(shù)據(jù)倉(cāng)庫(kù)的基礎(chǔ)上,根據(jù)數(shù)據(jù)挖掘的需求分析,利用SQL Server Analysis Services工具并選取合適的數(shù)據(jù)挖掘算法對(duì)檔案數(shù)據(jù)進(jìn)行分析處理,并對(duì)結(jié)果進(jìn)行分析。全文的核心為研究數(shù)據(jù)挖掘技術(shù)在檔案信息管理中的應(yīng)用實(shí)踐。
[Abstract]:Data mining refers to the process of searching hidden knowledge from a large amount of data by algorithm. As a knowledge discovery technology, it has been widely used in many data-intensive industries. Archives refer to various forms of original records with preservation value which are directly formed by people in various social activities. A large number of electronic data have been formed in the computer management of archival circles in China for many years, but the utilization of these data is still relatively primary. Only based on database level query, statistics, analysis and so on. In view of this situation, this paper tries to apply data warehouse and data mining technology to archives information management, through analyzing archives use database and archival archiving database, reveals the relationship between archives and users. The relationship between archives and archival units and between archives, thus exerting the information value of archival data in the new era on a deeper level. This paper mainly discusses the concrete practice of combining data mining technology with archival work from the aspects of file data warehouse design, data ETL, multidimensional data model establishment, data mining algorithm selection, data mining model application and so on. The basic process of file data mining is realized. Firstly, the requirement of constructing data warehouse is analyzed in detail, the subject and user are determined, the dimension table and fact table of data warehouse are determined according to the existing archival business database, and finally the file data warehouse is created by star pattern. Then the original data source is extracted, converted and loaded into the data warehouse by ETL. The process is mainly to preprocess and clean the file data. Then we use the OLAP tool to query the multi-angle and multi-view of the archive cube in order to better understand the archival data. Finally, on the basis of the archival data warehouse, according to the needs of data mining analysis, Using SQL Server Analysis Services tools and selecting appropriate data mining algorithm to analyze and process the file data, and analyze the results. The core of this paper is to study the application of data mining technology in archives information management.
【學(xué)位授予單位】:天津大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類(lèi)號(hào)】:G270.7;TP311.13

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 吳少敏,馮建生;數(shù)據(jù)挖掘技術(shù)及其應(yīng)用[J];冶金自動(dòng)化;2001年06期

2 黎洪生,卓禎雨;數(shù)據(jù)挖掘技術(shù)及其在過(guò)程監(jiān)控中的應(yīng)用[J];廣東自動(dòng)化與信息工程;2002年03期

3 黎洪生,卓禎雨;數(shù)據(jù)挖掘技術(shù)及其在過(guò)程監(jiān)控中的應(yīng)用[J];計(jì)算技術(shù)與自動(dòng)化;2002年04期

4 何志國(guó),曹玉東;數(shù)據(jù)挖掘技術(shù)[J];攀枝花學(xué)院學(xué)報(bào);2002年06期

5 賀玉珍;淺析數(shù)據(jù)挖掘技術(shù)[J];運(yùn)城高等專科學(xué)校學(xué)報(bào);2002年03期

6 龐先偉;基于數(shù)據(jù)挖掘技術(shù)的資源型學(xué)習(xí)[J];現(xiàn)代遠(yuǎn)程教育研究;2002年03期

7 盧輝斌,王擁軍;數(shù)據(jù)挖掘技術(shù)在入侵檢測(cè)中的應(yīng)用[J];燕山大學(xué)學(xué)報(bào);2003年02期

8 張麗麗;數(shù)據(jù)挖掘技術(shù)的應(yīng)用分析[J];山西經(jīng)濟(jì)管理干部學(xué)院學(xué)報(bào);2003年04期

9 張紅軍;談?wù)剶?shù)據(jù)挖掘技術(shù)及其應(yīng)用[J];廣西梧州師范高等?茖W(xué)校學(xué)報(bào);2003年03期

10 田小霞,劉曉霞;數(shù)據(jù)挖掘技術(shù)在客戶保持中的應(yīng)用研究[J];微計(jì)算機(jī)應(yīng)用;2003年03期

相關(guān)會(huì)議論文 前10條

1 孫義明;曾繼東;;數(shù)據(jù)挖掘技術(shù)及其應(yīng)用[A];全國(guó)計(jì)算機(jī)安全學(xué)術(shù)交流會(huì)論文集(第二十二卷)[C];2007年

2 馬洪杰;曲曉飛;;數(shù)據(jù)挖掘技術(shù)和過(guò)程的特點(diǎn)[A];面向21世紀(jì)的科技進(jìn)步與社會(huì)經(jīng)濟(jì)發(fā)展(上冊(cè))[C];1999年

3 寧紅梅;安志興;葛亞明;李敬璽;趙坤;鐘華;陳俊杰;崔艷紅;;數(shù)據(jù)挖掘技術(shù)在獸醫(yī)學(xué)中的應(yīng)用[A];Proceedings of 2010 National Vocational Education of Communications and Information Technology Conference (2010 NVCIC)[C];2010年

4 王桂芹;黃道;;數(shù)據(jù)挖掘技術(shù)綜述[A];計(jì)算機(jī)技術(shù)與應(yīng)用進(jìn)展·2007——全國(guó)第18屆計(jì)算機(jī)技術(shù)與應(yīng)用(CACIS)學(xué)術(shù)會(huì)議論文集[C];2007年

5 徐寶蓮;李曉奇;;數(shù)據(jù)挖掘技術(shù)在網(wǎng)絡(luò)游戲中的應(yīng)用[A];第十一屆中國(guó)不確定系統(tǒng)年會(huì)、第十五屆中國(guó)青年信息與管理學(xué)者大會(huì)論文集[C];2013年

6 胡廣芹;陸小左;;數(shù)據(jù)挖掘技術(shù)在中醫(yī)診斷中的應(yīng)用[A];中國(guó)中西醫(yī)結(jié)合學(xué)會(huì)診斷專業(yè)委員會(huì)2009’年會(huì)論文集[C];2009年

7 戈欣;吳曉芬;許建榮;;數(shù)據(jù)挖掘技術(shù)在放射科醫(yī)療管理中的潛在作用[A];2009中華醫(yī)學(xué)會(huì)影像技術(shù)分會(huì)第十七次全國(guó)學(xué)術(shù)大會(huì)論文集[C];2009年

8 鐵軍;吳智明;;數(shù)據(jù)挖掘技術(shù)在工業(yè)鋁電解生產(chǎn)中的應(yīng)用[A];第十九屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2002年

9 王建華;王菲;黃國(guó)建;;數(shù)據(jù)挖掘技術(shù)研究的現(xiàn)狀及展望[A];中國(guó)運(yùn)籌學(xué)會(huì)第六屆學(xué)術(shù)交流會(huì)論文集(上卷)[C];2000年

10 肖健華;吳今培;;數(shù)據(jù)挖掘技術(shù)及其應(yīng)用實(shí)例[A];2001年中國(guó)智能自動(dòng)化會(huì)議論文集(下冊(cè))[C];2001年

相關(guān)重要報(bào)紙文章 前10條

1 記者 呂賢如;大力加強(qiáng)數(shù)據(jù)挖掘技術(shù)研究應(yīng)用[N];光明日?qǐng)?bào);2006年

2 主持人 李禾;數(shù)據(jù)挖掘技術(shù)如何驅(qū)動(dòng)經(jīng)濟(jì)車(chē)輪[N];科技日?qǐng)?bào);2007年

3 梅靜彥;數(shù)據(jù)挖掘技術(shù)在美國(guó)銀行的應(yīng)用[N];金融時(shí)報(bào);2006年

4 鄒廣普;數(shù)據(jù)挖掘技術(shù)在保險(xiǎn)業(yè)中的應(yīng)用[N];中國(guó)保險(xiǎn)報(bào);2010年

5 陳曉 山西財(cái)經(jīng)大學(xué)教師;數(shù)據(jù)挖掘技術(shù)在高校教學(xué)管理中的應(yīng)用[N];山西經(jīng)濟(jì)日?qǐng)?bào);2010年

6 張崇峰;挖掘,,再挖掘[N];中國(guó)計(jì)算機(jī)報(bào);2003年

7 劉紅巖、何軍;利用數(shù)據(jù)挖掘技術(shù)獲得商業(yè)智能[N];中國(guó)計(jì)算機(jī)報(bào);2003年

8 ;IBM公司推出新型數(shù)據(jù)挖掘技術(shù)[N];中國(guó)高新技術(shù)產(chǎn)業(yè)導(dǎo)報(bào);2001年

9 劉軍 蘭小紅 龔富強(qiáng);新技術(shù)為老裝備“保駕護(hù)航”[N];大眾科技報(bào);2006年

10 本報(bào)記者  于 岫;建設(shè)數(shù)據(jù)倉(cāng)庫(kù) 打造信息時(shí)代的“航母”[N];中國(guó)國(guó)門(mén)時(shí)報(bào);2005年

相關(guān)博士學(xué)位論文 前10條

1 沈忱;基于貝葉斯網(wǎng)絡(luò)數(shù)據(jù)挖掘技術(shù)研究《本草綱目》活血化瘀類(lèi)中藥性—效—用關(guān)系[D];南京中醫(yī)藥大學(xué);2015年

2 錢(qián)力維;胡國(guó)俊祛邪助運(yùn)治療老年病學(xué)術(shù)思想和經(jīng)驗(yàn)總結(jié)[D];南京中醫(yī)藥大學(xué);2016年

3 姚山;基于數(shù)據(jù)挖掘技術(shù)的造林決策研究[D];北京林業(yè)大學(xué);2008年

4 曹秀英;基于粗集的數(shù)據(jù)挖掘技術(shù)及其應(yīng)用研究[D];哈爾濱工程大學(xué);2003年

5 伍平陽(yáng);基于數(shù)據(jù)挖掘技術(shù)的醫(yī)療設(shè)備績(jī)效預(yù)測(cè)方法的應(yīng)用研究[D];南方醫(yī)科大學(xué);2008年

6 劉剛;數(shù)據(jù)挖掘技術(shù)與分類(lèi)算法研究[D];中國(guó)人民解放軍信息工程大學(xué);2004年

7 王勇;時(shí)序數(shù)據(jù)挖掘技術(shù)及其在水質(zhì)預(yù)測(cè)中的應(yīng)用研究[D];廣東工業(yè)大學(xué);2005年

8 熊忠陽(yáng);面向商業(yè)智能的并行數(shù)據(jù)挖掘技術(shù)及應(yīng)用研究[D];重慶大學(xué);2004年

9 朱恒民;領(lǐng)域知識(shí)制導(dǎo)的數(shù)據(jù)挖掘技術(shù)及其在中藥提取中的應(yīng)用[D];南京航空航天大學(xué);2006年

10 毛國(guó)君;數(shù)據(jù)挖掘技術(shù)與關(guān)聯(lián)規(guī)則挖掘算法研究[D];北京工業(yè)大學(xué);2003年

相關(guān)碩士學(xué)位論文 前10條

1 劉洋;數(shù)據(jù)挖掘技術(shù)在檔案信息管理中的應(yīng)用研究[D];天津大學(xué);2016年

2 肖建國(guó);數(shù)據(jù)挖掘技術(shù)在就業(yè)指導(dǎo)與本科教學(xué)改革工作中的應(yīng)用研究[D];吉林大學(xué);2008年

3 錢(qián)和平;基于改進(jìn)的灰色理論數(shù)據(jù)挖掘技術(shù)的研究[D];內(nèi)蒙古農(nóng)業(yè)大學(xué);2010年

4 安冬冬;基于數(shù)據(jù)挖掘技術(shù)的常規(guī)公交服務(wù)水平評(píng)價(jià)體系研究[D];西南交通大學(xué);2015年

5 陳萍;數(shù)據(jù)挖掘技術(shù)在網(wǎng)絡(luò)教學(xué)中的應(yīng)用研究[D];廣東技術(shù)師范學(xué)院;2015年

6 鄧博;基于數(shù)據(jù)挖掘技術(shù)構(gòu)建電信4G客戶預(yù)測(cè)模型的研究[D];蘭州大學(xué);2015年

7 趙明芳;數(shù)據(jù)挖掘技術(shù)在教學(xué)評(píng)教中的應(yīng)用與研究[D];寧夏大學(xué);2015年

8 苗家銘;基于數(shù)據(jù)挖掘技術(shù)的商業(yè)銀行個(gè)人信用風(fēng)險(xiǎn)評(píng)估模型及其應(yīng)用[D];南京財(cái)經(jīng)大學(xué);2015年

9 鮑素貞;數(shù)據(jù)挖掘技術(shù)在個(gè)性化網(wǎng)絡(luò)教學(xué)平臺(tái)中的應(yīng)用研究[D];聊城大學(xué);2015年

10 李文棟;基于Spark的大數(shù)據(jù)挖掘技術(shù)的研究與實(shí)現(xiàn)[D];山東大學(xué);2015年



本文編號(hào):2034809

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2034809.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶ae81c***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com
国内九一激情白浆发布| 丝袜人妻夜夜爽一区二区三区| 暴力性生活在线免费视频| 人妻少妇系列中文字幕| 国产女性精品一区二区三区 | 99精品国产自在现线观看| 伊人色综合久久伊人婷婷| 欧美日韩亚洲国产精品| 国产一区二区不卡在线视频 | 国产精品午夜福利在线观看| 日韩精品综合免费视频| 男人把女人操得嗷嗷叫| 国产女性精品一区二区三区| 中文字字幕在线中文乱码二区| 久热这里只有精品九九| 亚洲三级视频在线观看免费| 亚洲国产色婷婷久久精品| 国产午夜福利不卡片在线观看| 国产精品流白浆无遮挡| 国产精品自拍杆香蕉视频| 欧美尤物在线观看西比尔| 精品视频一区二区不卡| 黄片免费在线观看日韩| 日本高清一区免费不卡| 国产偷拍盗摄一区二区| 国产黄色高清内射熟女视频| 欧美亚洲三级视频在线观看| 殴美女美女大码性淫生活在线播放 | 国产精品一区二区三区欧美| 久久亚洲国产视频三级黄| av在线免费观看在线免费观看| 偷自拍亚洲欧美一区二页| 日韩亚洲精品国产第二页| 亚洲中文字幕视频在线播放| 亚洲黄香蕉视频免费看| 国产成人高清精品尤物| 国产亚洲午夜高清国产拍精品| 性感少妇无套内射在线视频| 激情国产白嫩美女在线观看| 国产亚洲精品久久99| 亚洲精品黄色片中文字幕|