面向三類應(yīng)用數(shù)據(jù)的智能分析與優(yōu)化研究
本文關(guān)鍵詞: 大數(shù)據(jù) 發(fā)電調(diào)度 用戶特征預(yù)測 輸入系統(tǒng) 軌跡識別 出處:《中國科學(xué)技術(shù)大學(xué)》2016年博士論文 論文類型:學(xué)位論文
【摘要】:大數(shù)據(jù)時(shí)代已經(jīng)到來。數(shù)據(jù)已經(jīng)滲透到當(dāng)今每一個(gè)行業(yè)和業(yè)務(wù)職能領(lǐng)域,成為重要的生產(chǎn)因素。人們對于海量數(shù)據(jù)的分析、優(yōu)化及運(yùn)用,預(yù)示著新一波生產(chǎn)率增長和消費(fèi)者盈余浪潮的到來。手機(jī)、平板電腦、PC機(jī)、移動(dòng)互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、云計(jì)算、車聯(lián)網(wǎng)以及遍布地球各個(gè)角落的各種各樣的傳感器,無一不是數(shù)據(jù)來源。基于大數(shù)據(jù)的應(yīng)用如雨后春筍般出現(xiàn),例如個(gè)性化商品推薦、足球勝負(fù)預(yù)測、電力大數(shù)據(jù)相關(guān)應(yīng)用等。怎樣分析出數(shù)據(jù)中的價(jià)值,怎樣優(yōu)化關(guān)鍵技術(shù)以提高現(xiàn)有應(yīng)用的體驗(yàn)是近年大數(shù)據(jù)研究的發(fā)展趨勢。然而面對不同類型的數(shù)據(jù)和日漸復(fù)雜的應(yīng)用場景,數(shù)據(jù)分析與優(yōu)化工作會(huì)面臨很多不同的挑戰(zhàn)。例如數(shù)據(jù)采集、數(shù)據(jù)整理和存儲(chǔ)等常規(guī)問題;某些數(shù)據(jù)分析方法計(jì)算復(fù)雜度大、求解困難等問題;相同的處理方法在不同應(yīng)用場景、不同分布的訓(xùn)練數(shù)據(jù)上得到的結(jié)果有時(shí)也很不相同。針對以上數(shù)據(jù)分析時(shí)所面臨的問題,本文對三類應(yīng)用數(shù)據(jù)做了智能分析與優(yōu)化研究,具體做了以下幾點(diǎn)研究工作:1.構(gòu)建面向電力數(shù)據(jù)的發(fā)電優(yōu)化調(diào)度算法傳統(tǒng)的發(fā)電調(diào)度對于機(jī)組新產(chǎn)生的數(shù)據(jù)反饋較慢,不具備靈活性。決策由人的經(jīng)驗(yàn)完成,沒有充分利用歷史數(shù)據(jù),缺乏客觀科學(xué)性。2014年初,安徽省已完成對發(fā)電機(jī)組污染物排放數(shù)據(jù)的實(shí)時(shí)采集工作,基于這些數(shù)據(jù)完善一個(gè)優(yōu)化的、輕量級的發(fā)電調(diào)度方案勢在必行。本工作對發(fā)電機(jī)組歷史數(shù)據(jù)中的發(fā)電功率與污染物排放量進(jìn)行回歸分析,擬合出每臺機(jī)組發(fā)電功率與排放數(shù)據(jù)回歸模型,在此基礎(chǔ)上設(shè)計(jì)優(yōu)化調(diào)度算法使所有發(fā)電機(jī)組總污染物排放量降低。2.建立面向電商數(shù)據(jù)的用戶特征預(yù)測模型在個(gè)性化搜索和推薦系統(tǒng)等應(yīng)用中,完整的入口學(xué)信息特征是應(yīng)用具有良好性能的前提條件。但是這些理想的數(shù)據(jù)集很少出現(xiàn)在實(shí)際的應(yīng)用場景中,主要特征的缺失(如年齡、性別等)使這些應(yīng)用無法正常工作。在本工作中設(shè)計(jì)了一個(gè)預(yù)測模型來解決時(shí)間依賴的人口學(xué)特征預(yù)測的問題。該方案的關(guān)鍵點(diǎn)在于利用時(shí)間回溯方法來將用戶歷史行為的內(nèi)在時(shí)間關(guān)聯(lián)考慮在內(nèi),然后搜集數(shù)據(jù)來訓(xùn)練分類器,使用戶的歷史行為與其人口學(xué)特征對應(yīng)。3.提出一種面向空間磁感數(shù)據(jù)的字符識別方法設(shè)計(jì)了一個(gè)細(xì)粒度的字母輸入系統(tǒng)Magemitet,該系統(tǒng)利用設(shè)備周圍空間作為有限輸入?yún)^(qū)域的擴(kuò)展,用戶以使用一個(gè)永磁鐵在設(shè)備周圍書寫的方式來與該設(shè)備通話。Magemite的關(guān)鍵點(diǎn)在于集成在智能設(shè)備中的磁性傳感器能夠感知設(shè)備周圍的磁場強(qiáng)度變化。不同于以往的磁感解決方案只能識別粗粒度的手勢,Magemite能夠識別用戶細(xì)粒度的輸入,例如英文字母。然而用戶不同的書寫模式會(huì)影響識別的精度。為了應(yīng)對這個(gè)挑戰(zhàn),首先對輸入的軌跡做了預(yù)處理,并提取了不同的特征來獨(dú)特地刻畫用戶的輸入,然后使用這些特征向量來訓(xùn)練字母識別模型。最終實(shí)驗(yàn)結(jié)果表明:在發(fā)電優(yōu)化調(diào)度工作中擬合的發(fā)電功率與排放數(shù)據(jù)回歸模型達(dá)到了97.02%的平均準(zhǔn)確度,在10臺機(jī)組上的實(shí)驗(yàn)表明本文的優(yōu)化調(diào)度算法能使機(jī)組總污染物排放量降低4%,達(dá)到節(jié)能減排的目的;通過預(yù)測用戶幼兒年齡的實(shí)驗(yàn)來驗(yàn)證用戶特征預(yù)測模型的效果,在一大型電子商務(wù)平臺的真實(shí)數(shù)據(jù)集下,我們的算法在各個(gè)年齡段上的表現(xiàn)更加均衡,并且在預(yù)測幼兒年齡時(shí)能達(dá)到78.2%的準(zhǔn)確率;Magemite能識別用戶細(xì)粒度的軌跡輸入,在不同情景下的實(shí)驗(yàn)顯示,Magemite能達(dá)到高于85%的平均識別準(zhǔn)確率。
[Abstract]:This paper analyzes and optimizes three kinds of application data , such as data collection , data collection and storage , etc . The key points of this project are to use time - tracing method to consider the intrinsic time of the user ' s historical behavior , then gather data to train the classifier , so that the historical behavior of the user is correspondent to the demographic characteristics . The results show that the optimal scheduling algorithm can reduce the total pollutant discharge of the unit by 4 % and achieve the goal of energy saving and emission reduction . The results show that the optimal scheduling algorithm can reduce the total pollutant discharge of the unit by 4 % and reach the accuracy rate of 78.2 % when the child ' s age is predicted .
【學(xué)位授予單位】:中國科學(xué)技術(shù)大學(xué)
【學(xué)位級別】:博士
【學(xué)位授予年份】:2016
【分類號】:TP311.13
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 郭瑩;;數(shù)據(jù)空間關(guān)鍵問題探究[J];軟件導(dǎo)刊;2012年07期
2 厲劍;張紹雄;劉俊杰;李成柱;;大數(shù)據(jù)引發(fā)信息時(shí)代新變革[J];大眾科技;2013年12期
3 李斌;;大數(shù)據(jù)及其發(fā)展趨勢研究[J];廣西教育;2013年35期
4 張曉軍;孟祥武;;數(shù)字化周期[J];計(jì)算機(jī)科學(xué);2002年05期
5 崔晨;吳揚(yáng)揚(yáng);;基于活動(dòng)的數(shù)據(jù)空間數(shù)據(jù)關(guān)系發(fā)現(xiàn)[J];微型機(jī)與應(yīng)用;2011年11期
6 賈云得;;微型數(shù)字存貯遙測裝置數(shù)據(jù)預(yù)存貯方法[J];遙測遙控;1989年06期
7 靳小龍;王元卓;程學(xué)旗;;大數(shù)據(jù)的研究體系與現(xiàn)狀[J];信息通信技術(shù);2013年06期
8 朝樂門;;數(shù)據(jù)空間及其信息資源管理視角研究[J];情報(bào)理論與實(shí)踐;2013年11期
9 黃一凡;;合并分區(qū) 數(shù)據(jù)無損有妙招[J];電腦愛好者;2011年23期
10 葛敬軍;胡長軍;劉歆;李揚(yáng);劉震宇;;面向領(lǐng)域科學(xué)數(shù)據(jù)的虛擬數(shù)據(jù)空間共享模型[J];小型微型計(jì)算機(jī)系統(tǒng);2014年03期
相關(guān)會(huì)議論文 前5條
1 李鴻奎;陳洪艷;;大連市房地產(chǎn)基礎(chǔ)地理信息系統(tǒng)的設(shè)計(jì)和建設(shè)[A];中國地理信息系統(tǒng)協(xié)會(huì)第九屆年會(huì)論文集[C];2005年
2 董彥磊;申德榮;寇月;聶鐵錚;;數(shù)據(jù)空間中數(shù)據(jù)組織模型以及關(guān)聯(lián)關(guān)系發(fā)現(xiàn)模型的研究[A];第26屆中國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(B輯)[C];2009年
3 龐怡;許洪光;張志敏;;針對海量科技信息的存儲(chǔ)研究[A];信息時(shí)代——科技情報(bào)研究學(xué)術(shù)論文集(第三輯)[C];2008年
4 季承;;Oracle利用HWM高水標(biāo)記收縮數(shù)據(jù)空間方案[A];2013電力行業(yè)信息化年會(huì)論文集[C];2013年
5 季承;;Oracle利用HWM高水標(biāo)記收縮數(shù)據(jù)空間方案[A];2013電力行業(yè)信息化年會(huì)論文集[C];2013年
相關(guān)重要報(bào)紙文章 前6條
1 牛澤亞;用戶如何在數(shù)據(jù)空間里“被遺忘”?[N];人民郵電;2014年
2 風(fēng)格;指引大數(shù)據(jù)未來發(fā)展方向的九大真理[N];中華讀書報(bào);2013年
3 錄音整理 本報(bào)記者 劉文強(qiáng) 楊豐源;創(chuàng)新驅(qū)動(dòng),,奮力奔向大數(shù)據(jù)時(shí)代[N];貴陽日報(bào);2014年
4 中國人民大學(xué)信息學(xué)院 李玉坤;云計(jì)算與數(shù)據(jù)空間[N];中國計(jì)算機(jī)報(bào);2008年
5 整理 本報(bào)記者 蘇丹丹;把握大數(shù)據(jù)機(jī)遇 推動(dòng)文化產(chǎn)業(yè)跨越發(fā)展[N];中國文化報(bào);2013年
6 安徽國稅局 趙為民;稅務(wù)綜合數(shù)據(jù)平臺的設(shè)想[N];計(jì)算機(jī)世界;2007年
相關(guān)博士學(xué)位論文 前10條
1 李曉娜;面向SaaS應(yīng)用的多租戶數(shù)據(jù)放置機(jī)制研究[D];山東大學(xué);2015年
2 張德兵;基于機(jī)器學(xué)習(xí)的數(shù)據(jù)補(bǔ)全、標(biāo)注和檢索若干問題研究[D];浙江大學(xué);2015年
3 劉思彤;空間文本數(shù)據(jù)的查詢處理技術(shù)研究[D];清華大學(xué);2015年
4 侯振隆;重力全張量梯度數(shù)據(jù)的并行反演算法研究及應(yīng)用[D];吉林大學(xué);2016年
5 柯余洋;面向三類應(yīng)用數(shù)據(jù)的智能分析與優(yōu)化研究[D];中國科學(xué)技術(shù)大學(xué);2016年
6 姜朔;數(shù)據(jù)空間中數(shù)據(jù)集成若干關(guān)鍵問題研究[D];東華大學(xué);2014年
7 陳鵬;面向情景感知計(jì)算的時(shí)空數(shù)據(jù)管理、查詢、分析與相關(guān)算法研究[D];華東師范大學(xué);2013年
8 楊丹;數(shù)據(jù)空間中基于語義的實(shí)體搜索關(guān)鍵技術(shù)研究[D];東北大學(xué);2012年
9 王曉蕊;華北克拉通地球化學(xué)科學(xué)數(shù)據(jù)的管理及應(yīng)用研究[D];中國地質(zhì)大學(xué);2008年
10 張曉東;數(shù)字河口平臺建設(shè)關(guān)鍵技術(shù)研究[D];中國海洋大學(xué);2009年
相關(guān)碩士學(xué)位論文 前10條
1 權(quán)西瑞;云環(huán)境下數(shù)據(jù)版權(quán)保護(hù)方法的研究[D];西安建筑科技大學(xué);2015年
2 向兵;中藥顆粒調(diào)劑設(shè)備中輔助硬件及自動(dòng)封口機(jī)的設(shè)計(jì)[D];東北師范大學(xué);2015年
3 朱躍龍;公安情報(bào)自動(dòng)分類系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];電子科技大學(xué);2015年
4 張鵬遠(yuǎn);大數(shù)據(jù)分類存儲(chǔ)及檢索方法研究[D];西安電子科技大學(xué);2014年
5 王夢佳;DOA下數(shù)據(jù)注冊方法的初步研究與實(shí)現(xiàn)[D];成都理工大學(xué);2015年
6 陳啟偉;電機(jī)狀態(tài)云監(jiān)測系統(tǒng)研究與實(shí)現(xiàn)[D];浙江大學(xué);2016年
7 王照清;大數(shù)據(jù)環(huán)境下數(shù)據(jù)查詢優(yōu)化技術(shù)應(yīng)用研究[D];北方工業(yè)大學(xué);2016年
8 賈振美;面向稀疏軌跡數(shù)據(jù)的位置預(yù)測方法研究[D];東北大學(xué);2014年
9 雷德龍;矢量空間數(shù)據(jù)云存儲(chǔ)與馬爾可夫并行聚類算法研究[D];福州大學(xué);2014年
10 王甜甜;國家地理大數(shù)據(jù)戰(zhàn)略平臺研究[D];中共中央黨校;2016年
本文編號:1521081
本文鏈接:http://sikaile.net/shoufeilunwen/xxkjbs/1521081.html