基于特征關聯(lián)的特征識別與推薦算法研究
發(fā)布時間:2021-04-10 23:55
隨著物聯(lián)網的發(fā)展和大數據時代的到來,數據爆炸式增長導致信息過載等問題,使傳統(tǒng)的推薦系統(tǒng)逐漸轉型為個性化推薦系統(tǒng)。個性化推薦算法通過構建用戶畫像和預測用戶行為來提供信息過濾和推薦服務。在以大數據為背景下的推薦系統(tǒng)中,領域推薦技術的數據構成日趨復雜,呈現出海量異構數據、數據特征缺失、數據特征異常和數據特征關聯(lián)等新特征。這些特征從問題規(guī)模、特征缺失程度、異常特征狀態(tài)和關聯(lián)關系等方面對推薦算法提出了新的需求和挑戰(zhàn)。為此,本文開展基于特征關聯(lián)的特征識別、預測與推薦算法研究。主要包含以下幾個方面:(1)特征關系的分類關聯(lián)規(guī)則啟發(fā)式挖掘算法與特征匹配算法;诤A繑祿[藏的關聯(lián)關系,重點研究面向推薦算法的數據本身隱式的分類關聯(lián)規(guī)則。引入分類及連續(xù)的數據特征屬性并離散化,擴展數據特征的二元表示,確保數據特征屬性的多樣性。為了挖掘數據中某些關聯(lián)特征,研究基于最小支持度的啟發(fā)式特征挖掘方法,發(fā)現關聯(lián)特征的頻繁性及構建最優(yōu)特征子集;跀祿卣黝l繁項,研究基于最小置信度的啟發(fā)式分類關聯(lián)規(guī)則挖掘算法,為不同情景模式下,進行基于分類關聯(lián)規(guī)則的特征匹配。利用機器學習庫中健康醫(yī)療情景實驗數據進行實驗驗證與分析,驗證...
【文章來源】:哈爾濱工業(yè)大學黑龍江省 211工程院校 985工程院校
【文章頁數】:131 頁
【學位級別】:博士
【部分圖文】:
IDC公司關于全球數據空間大小的年度預測報告Fig.1-1TheannualsizeoftheglobaldataspherefromIDCforecastreport
第1章緒論-17-成融合技術與系統(tǒng)開發(fā)(2012AA02A601)”。針對現有特征識別及預測和推薦算法在應對特定情景環(huán)境下存在的問題,本文研究特定領域環(huán)境下的特征識別及預測和推薦算法問題,討論如何在特定領域不同數據特征場景下,根據已有數據特征關聯(lián)性及相應的應用環(huán)境需求,對特征識別及預測和推薦算法的模型構建進行合理的設計,以最大化滿足個性化推薦和特征識別準確性。實現模型構建的難點在于對于數據特征關聯(lián)性、數據特征缺失程度、數據特征異常范圍、數據特征稀疏性和異構性的界定和預處理方式。為系統(tǒng)化的提高特征識別及預測和推薦算法的準確率,本文提出基于特征關聯(lián)的特征識別及預測和推薦算法模型與框架,分別從特征關聯(lián)性、特征缺失性和特征異常性三方面入手,分情景加以解決。本文研究的背景、問題、內容和方案如圖1-2所示。圖1-2本文主要研究內容的體系架構Fig.1-2Thearchitectureofmainresearchcontents算法的主要思路和具體研究內容如下:(1)基于特征關系的分類關聯(lián)規(guī)則挖掘與特征匹配算法。通過貝葉斯網絡特征關系馬爾科夫獨立性推理分析,計算領域數據特征屬性隱藏的關聯(lián)關系。利用關聯(lián)性分析技術對數據特征屬性進行頻繁特征項集挖掘,重點研究面向特征匹配和推薦的數據本身隱式的分類關聯(lián)規(guī)則。引入分類及連續(xù)的數據特征屬性擴展數據特征的二元表示模式,確保數據特征項的多樣性。為了發(fā)掘數據中某些關聯(lián)特征,研究基于最小支持度的啟發(fā)式特征挖掘方法,發(fā)現關聯(lián)特征的頻繁性及構建最優(yōu)特征子集;跀祿卣黝l繁項,研究基于最小置信度的啟發(fā)式分類關聯(lián)規(guī)則挖掘
第1章緒論-19-法;進而提出針對數據特征缺失的特征識別策略;考慮到數據間的隱式反饋特性,提出基于加權用戶的協(xié)同過濾特征識別算法;為證明模型的有效性及可表征性,基于無向概率圖的馬爾科夫獨立性推理分析,給出面向預測的特征屬性模型的可表征理論證明;最后,提出基于隱式反饋的協(xié)同過濾預測算法。圖1-3論文主要研究內容及其關系示意圖Fig.1-3Mainresearchcontentsandtheirrelationshipofthethesis第4章研究基于卷積神經網絡的數據異常特征識別與預測算法。在時序序列數據中,基于離散傅里葉變換將時序序列離散為頻域信號并進行規(guī)則化處理;為保證推薦結果的完整性,基于線性基準模型特征識別方法識別異常特征;研究數據的特征提取方法,為減小數據集的規(guī)模,采用深度學習技術對將復雜的圖模式數據降維處理,轉換成機器可識別的時頻序列數據,并基于神經網絡模型,研究深層次的數據異常特征識別方法,使之能夠適應時間序列數據前后依存的關系。第5章研究基于級聯(lián)加權的混合個性化推薦算法。首先,分析領域中不同情景模式下的用戶需求,提出基于分類樹的相似用戶發(fā)現算法,粗粒度計算相似用戶范圍;其次,根據篩選出的相似用戶列表,基于內容的相似用戶發(fā)現算法,細粒度計算相似用戶;然后,基于關聯(lián)規(guī)則的個性化特征匹配算法,與細粒度的計算結果進行加權計算,形成最終相似用戶推薦列表;最后,明確用戶的問題需求和優(yōu)化方法,提出基于多用戶的層次分析決策推薦形式化方法。最后給出結論,并提出進一步的研究和展望。
【參考文獻】:
期刊論文
[1]基于深度學習的推薦系統(tǒng)研究綜述[J]. 黃立威,江碧濤,呂守業(yè),劉艷博,李德毅. 計算機學報. 2018(07)
[2]跨媒體分析與推理:研究進展與發(fā)展方向(英文)[J]. Yu-xin PENG,Wen-wu ZHU,Yao ZHAO,Chang-sheng XU,Qing-ming HUANG,Han-qing LU,Qing-hua ZHENG,Tie-jun HUANG,Wen GAO. Frontiers of Information Technology & Electronic Engineering. 2017(01)
[3]面向隱式反饋的推薦系統(tǒng)研究現狀與趨勢[J]. 陸藝,曹健. 計算機科學. 2016(04)
[4]滿足均勻分布的不確定數據關聯(lián)規(guī)則挖掘算法[J]. 陳愛東,劉國華,費凡,周宇,萬小妹,貟慧. 計算機研究與發(fā)展. 2013(S1)
[5]推薦系統(tǒng)評價指標綜述[J]. 朱郁筱,呂琳媛. 電子科技大學學報. 2012(02)
[6]中西醫(yī)結合治療方案對急性缺血性腦卒中患者神經功能缺損和致殘結局的影響[J]. 謝仁明,陳紅霞,謝雁鳴,郭友華,馮碧君,歐海寧,詹樂昌,張麗萍. 中國中西醫(yī)結合雜志. 2011(09)
[7]中國成人血脂異常防治指南(2007)概要與解讀[J]. 許海燕,頊志敏,陸宗良. 中華老年心腦血管病雜志. 2008(03)
本文編號:3130564
【文章來源】:哈爾濱工業(yè)大學黑龍江省 211工程院校 985工程院校
【文章頁數】:131 頁
【學位級別】:博士
【部分圖文】:
IDC公司關于全球數據空間大小的年度預測報告Fig.1-1TheannualsizeoftheglobaldataspherefromIDCforecastreport
第1章緒論-17-成融合技術與系統(tǒng)開發(fā)(2012AA02A601)”。針對現有特征識別及預測和推薦算法在應對特定情景環(huán)境下存在的問題,本文研究特定領域環(huán)境下的特征識別及預測和推薦算法問題,討論如何在特定領域不同數據特征場景下,根據已有數據特征關聯(lián)性及相應的應用環(huán)境需求,對特征識別及預測和推薦算法的模型構建進行合理的設計,以最大化滿足個性化推薦和特征識別準確性。實現模型構建的難點在于對于數據特征關聯(lián)性、數據特征缺失程度、數據特征異常范圍、數據特征稀疏性和異構性的界定和預處理方式。為系統(tǒng)化的提高特征識別及預測和推薦算法的準確率,本文提出基于特征關聯(lián)的特征識別及預測和推薦算法模型與框架,分別從特征關聯(lián)性、特征缺失性和特征異常性三方面入手,分情景加以解決。本文研究的背景、問題、內容和方案如圖1-2所示。圖1-2本文主要研究內容的體系架構Fig.1-2Thearchitectureofmainresearchcontents算法的主要思路和具體研究內容如下:(1)基于特征關系的分類關聯(lián)規(guī)則挖掘與特征匹配算法。通過貝葉斯網絡特征關系馬爾科夫獨立性推理分析,計算領域數據特征屬性隱藏的關聯(lián)關系。利用關聯(lián)性分析技術對數據特征屬性進行頻繁特征項集挖掘,重點研究面向特征匹配和推薦的數據本身隱式的分類關聯(lián)規(guī)則。引入分類及連續(xù)的數據特征屬性擴展數據特征的二元表示模式,確保數據特征項的多樣性。為了發(fā)掘數據中某些關聯(lián)特征,研究基于最小支持度的啟發(fā)式特征挖掘方法,發(fā)現關聯(lián)特征的頻繁性及構建最優(yōu)特征子集;跀祿卣黝l繁項,研究基于最小置信度的啟發(fā)式分類關聯(lián)規(guī)則挖掘
第1章緒論-19-法;進而提出針對數據特征缺失的特征識別策略;考慮到數據間的隱式反饋特性,提出基于加權用戶的協(xié)同過濾特征識別算法;為證明模型的有效性及可表征性,基于無向概率圖的馬爾科夫獨立性推理分析,給出面向預測的特征屬性模型的可表征理論證明;最后,提出基于隱式反饋的協(xié)同過濾預測算法。圖1-3論文主要研究內容及其關系示意圖Fig.1-3Mainresearchcontentsandtheirrelationshipofthethesis第4章研究基于卷積神經網絡的數據異常特征識別與預測算法。在時序序列數據中,基于離散傅里葉變換將時序序列離散為頻域信號并進行規(guī)則化處理;為保證推薦結果的完整性,基于線性基準模型特征識別方法識別異常特征;研究數據的特征提取方法,為減小數據集的規(guī)模,采用深度學習技術對將復雜的圖模式數據降維處理,轉換成機器可識別的時頻序列數據,并基于神經網絡模型,研究深層次的數據異常特征識別方法,使之能夠適應時間序列數據前后依存的關系。第5章研究基于級聯(lián)加權的混合個性化推薦算法。首先,分析領域中不同情景模式下的用戶需求,提出基于分類樹的相似用戶發(fā)現算法,粗粒度計算相似用戶范圍;其次,根據篩選出的相似用戶列表,基于內容的相似用戶發(fā)現算法,細粒度計算相似用戶;然后,基于關聯(lián)規(guī)則的個性化特征匹配算法,與細粒度的計算結果進行加權計算,形成最終相似用戶推薦列表;最后,明確用戶的問題需求和優(yōu)化方法,提出基于多用戶的層次分析決策推薦形式化方法。最后給出結論,并提出進一步的研究和展望。
【參考文獻】:
期刊論文
[1]基于深度學習的推薦系統(tǒng)研究綜述[J]. 黃立威,江碧濤,呂守業(yè),劉艷博,李德毅. 計算機學報. 2018(07)
[2]跨媒體分析與推理:研究進展與發(fā)展方向(英文)[J]. Yu-xin PENG,Wen-wu ZHU,Yao ZHAO,Chang-sheng XU,Qing-ming HUANG,Han-qing LU,Qing-hua ZHENG,Tie-jun HUANG,Wen GAO. Frontiers of Information Technology & Electronic Engineering. 2017(01)
[3]面向隱式反饋的推薦系統(tǒng)研究現狀與趨勢[J]. 陸藝,曹健. 計算機科學. 2016(04)
[4]滿足均勻分布的不確定數據關聯(lián)規(guī)則挖掘算法[J]. 陳愛東,劉國華,費凡,周宇,萬小妹,貟慧. 計算機研究與發(fā)展. 2013(S1)
[5]推薦系統(tǒng)評價指標綜述[J]. 朱郁筱,呂琳媛. 電子科技大學學報. 2012(02)
[6]中西醫(yī)結合治療方案對急性缺血性腦卒中患者神經功能缺損和致殘結局的影響[J]. 謝仁明,陳紅霞,謝雁鳴,郭友華,馮碧君,歐海寧,詹樂昌,張麗萍. 中國中西醫(yī)結合雜志. 2011(09)
[7]中國成人血脂異常防治指南(2007)概要與解讀[J]. 許海燕,頊志敏,陸宗良. 中華老年心腦血管病雜志. 2008(03)
本文編號:3130564
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3130564.html