網(wǎng)絡(luò)視頻環(huán)境中面向用戶QoE的分析與應(yīng)用
本文關(guān)鍵詞:網(wǎng)絡(luò)視頻環(huán)境中面向用戶QoE的分析與應(yīng)用 出處:《南京郵電大學(xué)》2016年碩士論文 論文類型:學(xué)位論文
更多相關(guān)文章: 用戶體驗質(zhì)量 建模預(yù)測 決策樹 信息增益 快速離散
【摘要】:互聯(lián)網(wǎng)技術(shù)飛速發(fā)展的當(dāng)下,視頻多樣性服務(wù)也大量涌現(xiàn),用戶對于視頻質(zhì)量的需求也隨之增長。為了更好地服務(wù)用戶,提升用戶體驗,服務(wù)商致力于研究各方面指標(biāo)以改善用戶體驗質(zhì)量(QoE)。因此,如何通過調(diào)整、權(quán)衡各指標(biāo)來預(yù)測QoE成為了當(dāng)下的研究熱點。本文從數(shù)據(jù)分析、建模預(yù)測的角度出發(fā),展開了一系列研究。本文首先進(jìn)行了數(shù)據(jù)搜集、數(shù)據(jù)預(yù)處理等前期準(zhǔn)備工作,從而獲得了大量與視頻相關(guān)的指標(biāo)數(shù)據(jù)。為了對可能影響QoE的因素進(jìn)行分析,本文進(jìn)行了數(shù)據(jù)清洗、離散化、統(tǒng)計分析等工作,從而篩選出合適的影響因素。通過對比多種經(jīng)典機(jī)器學(xué)習(xí)算法,選取決策樹模型對QoE進(jìn)行建模預(yù)測。具體而言,本文的主要研究工作有如下三點:首先,在利用信息增益進(jìn)行相關(guān)性分析時,采用信息增益最大化方法對連續(xù)型數(shù)據(jù)進(jìn)行離散化處理,并對現(xiàn)有快速離散算法進(jìn)行改進(jìn)。通過對含有重復(fù)值的特征數(shù)據(jù)進(jìn)行重新整合歸類,使快速離散算法能適用于任何類型的數(shù)據(jù)集,提高了離散化的準(zhǔn)確率。與此同時將改進(jìn)快速算法運(yùn)用到構(gòu)建樹時的二分離散中,加快了建樹速度,又達(dá)到了與原樹相同的預(yù)測效果。其次,為了精簡C4.5決策樹模型,對停止條件進(jìn)行了改進(jìn)。通過將模型復(fù)雜度與準(zhǔn)確率權(quán)衡比較,共同決定待分裂子集數(shù)據(jù)量的最小值,使決策樹在保證一定準(zhǔn)確率的前提下達(dá)到最精簡模式。通過實驗驗證這樣改進(jìn)會使得模型的復(fù)雜度、算法耗時大大降低,從而能夠適應(yīng)更龐大的數(shù)據(jù)量。最后,針對決策樹建模過程中的特征選取準(zhǔn)則進(jìn)行了改進(jìn)。通過引入特征離散度指標(biāo),與原始信息增益率指標(biāo)相結(jié)合,綜合考慮數(shù)據(jù)本身的離散程度和分布情況,構(gòu)建新的選取標(biāo)準(zhǔn)。通過實驗證明新的選取標(biāo)準(zhǔn)使得特征選取更為準(zhǔn)確,同時可以提高決策樹模型的預(yù)測準(zhǔn)確率。本文最后通過與其他模型進(jìn)行對比,對改進(jìn)模型準(zhǔn)確率、復(fù)雜度、耗時等多方面進(jìn)行測試,驗證了所設(shè)計方案的性能以及改進(jìn)算法在QoE預(yù)測準(zhǔn)確性方面的提升效果。
[Abstract]:The rapid development of Internet technology at present, the diversity of services is the emergence of a large number of video users, along with growth for video quality requirements. In order to better serve customers, enhance the user experience, the service provider is devoted to the study of the indicators to improve the quality of user experience (QoE). Therefore, how to adjust, to predict the QoE become a research the focus of the present balance each index. This paper from the data analysis, modeling and forecasting perspective, launched a series of research. This paper carried out the data collection, data processing and other preparatory work, to obtain a great deal of data associated with video. In order to analyze the influencing factors of QoE, this paper has carried on the data cleaning, discretization, statistical analysis and so on, so as to select the appropriate factors. By comparing various classic machine learning algorithms, then the decision tree model is used to model QoE Forecast. Specifically, the main research work of this paper has the following three points: first, the correlation analysis based on information gain, the information gain maximization method for discretization of continuous data, and the existing fast discrete algorithm. Based on the characteristics of data containing duplicate values were re classified, the fast discrete algorithm can be applied to any type of data sets, to improve the accuracy of the discretization. At the same time the improved fast algorithm using two discrete to construct the tree, accelerate the speed of tree and predicted the same effect as the original tree. Secondly, in order to streamline the C4.5 decision tree model, to stop the condition was improved. The model complexity and accuracy tradeoffs, jointly determine the minimum amount of data to be split subset, the decision tree to the issued under the premise of ensuring accuracy Reduced complexity model. Experiments show this improvement makes the model, computation time is greatly reduced, which can adapt to a large amount of data. Finally, according to the criterion of feature selection decision tree modeling process was improved. By introducing the characteristics of dispersion index, combined with the original information gain rate index, considering the discrete the extent and distribution of the data itself, the criteria for the selection of new building. Experiments show that the feature selection criterion is more accurate, and can improve the prediction accuracy of the decision tree model. Finally, by comparing with other models, the improved model accuracy, complexity, time and other aspects of the test. To verify the design scheme of the improved algorithm performance and forecasting accuracy improvement in QoE.
【學(xué)位授予單位】:南京郵電大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:TP393.09
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 董立巖;李真;周靈艷;;特定信息增益決策森林分類器研究[J];計算機(jī)工程與應(yīng)用;2010年26期
2 孫挺;耿國華;周明全;;基于詞出現(xiàn)和信息增益的連續(xù)屬性離散化方法[J];計算機(jī)應(yīng)用研究;2009年02期
3 熊平;朱天清;顧霄;;基于信息增益比例約束的數(shù)據(jù)匿名方法及其評估機(jī)制[J];計算機(jī)應(yīng)用研究;2014年03期
4 王衛(wèi)平;王旭哠;陳赫然;陳家耀;;基于信息增益的防火墻過濾域排序優(yōu)化[J];計算機(jī)系統(tǒng)應(yīng)用;2009年07期
5 張小康;帥建梅;史林;;基于加權(quán)信息增益的惡意代碼檢測方法[J];計算機(jī)工程;2010年06期
6 苑春燕;李愛華;;基于信息增益和相關(guān)性的貝葉斯分類算法研究[J];網(wǎng)絡(luò)與信息;2010年02期
7 劉慶和;梁正友;;一種基于信息增益的特征優(yōu)化選擇方法[J];計算機(jī)工程與應(yīng)用;2011年12期
8 楊敬妹;王學(xué)軍;;文本分類中信息增益算法的改進(jìn)[J];計算機(jī)時代;2013年09期
9 潘若愚,韓曉峰;一種基于信息增益的產(chǎn)品評價系統(tǒng)模型[J];合肥工業(yè)大學(xué)學(xué)報(自然科學(xué)版);2003年S1期
10 陶劍文;趙杰煜;姚奇富;;信息增益區(qū)分頻繁模式分類方法[J];計算機(jī)工程與應(yīng)用;2009年07期
相關(guān)會議論文 前3條
1 劉惠;邱天爽;;基于模糊集理論和信息增益分析技術(shù)的分類算法[A];第十一屆全國信號處理學(xué)術(shù)年會(CCSP-2003)論文集[C];2003年
2 劉鵬;雷蕾;張雪鳳;;缺失數(shù)據(jù)處理方法的比較研究[A];第二十一屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(技術(shù)報告篇)[C];2004年
3 王孟;白清源;謝麗聰;謝伙生;張瑩;;基于信息增益規(guī)則排序的關(guān)聯(lián)文本分類[A];第二十四屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(技術(shù)報告篇)[C];2007年
相關(guān)碩士學(xué)位論文 前5條
1 孫思瑩;網(wǎng)絡(luò)視頻環(huán)境中面向用戶QoE的分析與應(yīng)用[D];南京郵電大學(xué);2016年
2 黃冬麗;基于信息增益的基因互作挖掘方法研究[D];哈爾濱工業(yè)大學(xué);2014年
3 劉一正;基于信息增益的互聯(lián)網(wǎng)二元關(guān)系抽取[D];華東師范大學(xué);2014年
4 周志凱;免疫入侵檢測中基于信息增益的檢測器生成研究[D];哈爾濱理工大學(xué);2014年
5 黃楊潮;miRNA前體與成熟體預(yù)測方法的設(shè)計與實現(xiàn)[D];哈爾濱工業(yè)大學(xué);2011年
,本文編號:1364736
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/1364736.html