數(shù)據(jù)挖掘技術(shù)在軟件工程中的應(yīng)用研究
本文關(guān)鍵詞:數(shù)據(jù)挖掘技術(shù)在軟件工程中的應(yīng)用研究,由筆耕文化傳播整理發(fā)布。
數(shù)據(jù)挖掘技術(shù)在軟件工程中的應(yīng)用研究 作者:陳建樺
來源:《硅谷》2014年第01期
摘 要 隨著信息技術(shù)的不斷發(fā)展,日常生活中人們所接觸的信息量越來越多,如何在眾多信息量中找到自己有用的信息,成為影響人們工作效率和工作質(zhì)量的關(guān)鍵因素,而數(shù)據(jù)挖掘技術(shù)的應(yīng)用則能很好的解決這個(gè)問題。本文將通過介紹數(shù)據(jù)挖掘技術(shù)在軟件工程中的應(yīng)用,詳細(xì)分析數(shù)據(jù)挖掘技術(shù)的作用和影響。
關(guān)鍵詞 數(shù)據(jù)挖掘;軟件工程;開源軟件
中圖分類號:TP311 文獻(xiàn)標(biāo)識碼:A 文章編號:1671-7597(2014)01-0073-01
所謂數(shù)據(jù)挖掘是指在大量、無序、模糊的數(shù)據(jù)中挖掘出其中有用的信息的過程,它能實(shí)現(xiàn)信息的分類、聚類并進(jìn)行偏差分析。在這個(gè)信息爆炸的時(shí)代里,人們獲取的信息量是非常驚人的。在軟件工程中,軟件的開發(fā)及管理過程中都會出現(xiàn)大量信息和數(shù)據(jù),如何更好地在眾多信息中快速找出有用信息成為困擾軟件工程的一大問題,因此,對信息數(shù)據(jù)的挖掘在軟件工程中顯得更為重要。
1 數(shù)據(jù)挖掘的過程及技術(shù)
一般的數(shù)據(jù)挖掘過程包括4個(gè)步驟,即對軟件庫里的數(shù)據(jù)進(jìn)行選擇、對被選擇的數(shù)據(jù)進(jìn)行預(yù)處理形成格式化數(shù)據(jù)、再對格式化的信息進(jìn)行挖掘,最終吸收其中有用的知識。
在軟件工程中數(shù)據(jù)挖掘的工作一般可以分為3個(gè)層次,即交互式可視數(shù)據(jù)探查、自動模式提取及模型建構(gòu),這3個(gè)層面相互關(guān)聯(lián),其中可視數(shù)據(jù)探查為提取模式及模型的建構(gòu)提供基礎(chǔ),,模型的建構(gòu)又為數(shù)據(jù)探查和模式提取提供了指導(dǎo)。
軟件工程中常用的數(shù)據(jù)挖掘技術(shù)主要是通過分析、聚類、預(yù)測及統(tǒng)計(jì)分析等技術(shù)從眾多資源中找出潛在的、對人們有用的信息并反饋給軟件系統(tǒng)。
2 數(shù)據(jù)挖掘技術(shù)在軟件工程中的應(yīng)用
數(shù)據(jù)挖掘技術(shù)被應(yīng)用到軟件工程中已經(jīng)有20多年的歷史,隨著科學(xué)技術(shù)的不斷進(jìn)步,數(shù)據(jù)挖掘技術(shù)的應(yīng)用也越來越廣泛,如,在銀行、保險(xiǎn)、交通及零售等行業(yè)都在應(yīng)用數(shù)據(jù)挖掘技術(shù)。而在軟件工程中使用數(shù)據(jù)挖掘則可以提高軟件系統(tǒng)的維護(hù)效率并增加系統(tǒng)的穩(wěn)定性和安全性。軟件工程中的程序代碼分析、軟件項(xiàng)目管理、軟件故障檢測及開源軟件開發(fā)等方面都應(yīng)用了數(shù)據(jù)挖掘技術(shù)。
2.1 開源軟件開發(fā)中的數(shù)據(jù)挖掘
本文關(guān)鍵詞:數(shù)據(jù)挖掘技術(shù)在軟件工程中的應(yīng)用研究,由筆耕文化傳播整理發(fā)布。
本文編號:71357
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/71357.html