基于數(shù)據(jù)挖掘的電力信息分類及搜索技術(shù)的研究
發(fā)布時間:2017-07-16 10:04
本文關(guān)鍵詞:基于數(shù)據(jù)挖掘的電力信息分類及搜索技術(shù)的研究
更多相關(guān)文章: 電力 分詞 關(guān)聯(lián)規(guī)則 相似度 文本聚類 搜索
【摘要】:目前電力網(wǎng)絡(luò)日益復(fù)雜,電力資源日益龐大,信息資源量爆炸性增長,傳統(tǒng)的信息獲取方法已經(jīng)無法完成信息獲取任務(wù),從事電力工作或者需求相關(guān)電力知識的人員已經(jīng)體會到很困難從海量多元的信息世界中獲取到自己最需要的信息,所以他們越來越需要一種可以有較高滿意度的快速高效搜索方案。現(xiàn)在比較成熟的大型通用搜索引擎有時不能滿足電力工作者只針對電力信息的搜索,所以一種針對特定電力領(lǐng)域、特定電力人群或特定電力用戶需求的基于電力信息單一領(lǐng)域的搜索引擎應(yīng)運而生,它可以將相關(guān)服務(wù)和有一定價值的信息提供給人們。本文闡述了基于電力信息的快速搜索方案的研究與實現(xiàn)。本文分析了中文文本聚類的步驟,包括分詞,分詞采用從左到右的最大匹配算法;權(quán)重計算采用tfc算法;電力信息庫中的文檔和文檔之間的相似程度由相似度算法實現(xiàn);關(guān)聯(lián)規(guī)則挖掘采用改進后的Apriori算法:文本聚類采用K-均值聚類算法。綜上,論文中的電力搜索方案是單單針對電力信息領(lǐng)域、以數(shù)據(jù)挖掘算法為基礎(chǔ)的,通過這個方案可以提高對電力信息網(wǎng)絡(luò)資源的利用,通過方案自動理解電力用戶的中文語言描述,利用一系列數(shù)據(jù)挖掘算法,來快速返回相關(guān)信息,從而方便用戶搜索,電力用戶對專業(yè)知識需求的滿意度將隨著查詢效率的提高而大大提升。
【關(guān)鍵詞】:電力 分詞 關(guān)聯(lián)規(guī)則 相似度 文本聚類 搜索
【學(xué)位授予單位】:華北電力大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2015
【分類號】:TP311.13;TM769
【目錄】:
- 摘要5-6
- Abstract6-10
- 第1章 緒論10-15
- 1.1 論文背景、目的和意義10-11
- 1.2 國內(nèi)外研究動態(tài)11-13
- 1.3 論文的組織結(jié)構(gòu)13-14
- 1.4 論文取得的主要成績14-15
- 第2章 數(shù)據(jù)倉庫與數(shù)據(jù)挖掘技術(shù)15-22
- 2.1 數(shù)據(jù)倉庫15-17
- 2.1.1 數(shù)據(jù)倉庫的方案結(jié)構(gòu)15-16
- 2.1.2 數(shù)據(jù)倉庫數(shù)據(jù)分析16
- 2.1.3 數(shù)據(jù)倉庫中的索引16-17
- 2.2 數(shù)據(jù)挖掘17-20
- 2.2.1 數(shù)據(jù)挖掘技術(shù)17-18
- 2.2.2 數(shù)據(jù)挖掘算法18
- 2.2.3 數(shù)據(jù)挖掘的應(yīng)用18-20
- 2.3 數(shù)據(jù)倉庫與數(shù)據(jù)挖掘的結(jié)合20-22
- 2.3.1 數(shù)據(jù)倉庫與數(shù)據(jù)挖掘兩者的區(qū)別20
- 2.3.2 數(shù)據(jù)倉庫與數(shù)據(jù)挖掘之間的聯(lián)系20
- 2.3.3 數(shù)據(jù)倉庫中數(shù)據(jù)存儲的特點20-21
- 2.3.4 數(shù)據(jù)倉庫中數(shù)據(jù)挖掘的特點21-22
- 第3章 文本挖掘概述22-25
- 3.1 文本挖掘概念22
- 3.2 文本挖掘的過程22-23
- 3.3 文本挖掘功能23-24
- 3.4 論文中文本挖掘的應(yīng)用24-25
- 第4章 相關(guān)算法研究、改進及應(yīng)用25-37
- 4.1 關(guān)聯(lián)規(guī)則算法及其應(yīng)用25-29
- 4.1.1 關(guān)聯(lián)規(guī)則的定義和過程25-26
- 4.1.2 關(guān)聯(lián)規(guī)則典型算法26-27
- 4.1.3 經(jīng)典頻繁項目集方法27-28
- 4.1.4 APRIORI算法的應(yīng)用和實現(xiàn)28-29
- 4.2 文本聚類算法的改進和實現(xiàn)29-37
- 4.2.1 文本聚類算法的過程和功能29-31
- 4.2.2 中文切詞算法及演示31-33
- 4.2.3 特征向量表示和權(quán)重的計算33-34
- 4.2.4 關(guān)鍵詞關(guān)聯(lián)度與文擋相似度算法的研究34-36
- 4.2.5 K-MEANS聚類算法及應(yīng)用36-37
- 第5章 搜索方案詳細(xì)設(shè)計及實現(xiàn)37-45
- 5.1 開發(fā)工具簡介37-42
- 5.1.1 JAVA發(fā)展歷程37-38
- 5.1.2 ACCESS主要功能介紹38-39
- 5.1.3 創(chuàng)建電力信息數(shù)據(jù)倉庫39-42
- 5.2 搜索方案的設(shè)計與實現(xiàn)42-45
- 5.2.1 搜索方案功能介紹42
- 5.2.2 方案總體設(shè)計42-43
- 5.2.3 搜索算法設(shè)計圖43-45
- 第6章 方案測試結(jié)果分析45-47
- 6.1 文本聚類實驗結(jié)果分析45-46
- 6.2 方案搜索實驗結(jié)果及分析46-47
- 第7章 結(jié)束語47-49
- 7.1 論文總結(jié)47
- 7.2 前景展望47-48
- 7.3 收獲與感想48-49
- 參考文獻49-53
- 致謝53-54
- 作者簡介54
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前2條
1 張朝暉,陸玉昌,張鈸;發(fā)掘多值屬性的關(guān)聯(lián)規(guī)則[J];軟件學(xué)報;1998年11期
2 唐崇忻;;基于華文教育主題的專業(yè)搜索引擎的結(jié)構(gòu)分析與程序設(shè)計[J];現(xiàn)代情報;2007年07期
,本文編號:548121
本文鏈接:http://sikaile.net/kejilunwen/dianlilw/548121.html
最近更新
教材專著