基于加權(quán)Word2vec融合多維信息的IOS APP按需推薦研究
發(fā)布時間:2021-07-08 07:39
在大數(shù)據(jù)和移動計(jì)算背景下,國內(nèi)外的手機(jī)應(yīng)用商城推出的APP層出不窮,智能PC設(shè)備已經(jīng)成為人們生活中不可或缺的一部分,各種APP軟件應(yīng)運(yùn)而生,在各類APP的推廣中,如何準(zhǔn)確的為用戶推薦合適的APP使其下載是一個極具挑戰(zhàn)性的問題,吸引了國內(nèi)外研究人員的廣泛關(guān)注。但是,已有的研究方法大都基于單一APP信息進(jìn)行推薦,忽略了能夠體現(xiàn)出APP熱度的多維信息。因此,本文針對IOS手機(jī)用戶,深入研究如何基于APP多維信息進(jìn)行高質(zhì)量的APP推薦,主要研究內(nèi)容如下:(1)提出了一種基于加權(quán)Word2vec的相似APP推薦方法。該方法針對APP Store中與用戶需求并無關(guān)聯(lián)的APP出現(xiàn)在搜索推薦列表中的問題,首先利用爬蟲軟件對七麥數(shù)據(jù)網(wǎng)的APP信息進(jìn)行收集,并對收集的信息進(jìn)行預(yù)處理,然后利用TF-IDF(Term Frequency-Inverse Document frequency,詞頻-逆文檔頻率)算法從APP描述信息中提取特征詞,進(jìn)而采用Word2vec工具對APP描述信息提取的特征詞進(jìn)行向量化。使用類似的方法對用戶需求文本進(jìn)行向量化操作,采用余弦相似度計(jì)算方法進(jìn)行相似度計(jì)算排序,選取與用戶需求文...
【文章來源】:河南大學(xué)河南省
【文章頁數(shù)】:61 頁
【學(xué)位級別】:碩士
【部分圖文】:
基于加權(quán)Word2vec融合多維信息的IOSAPP按需推薦框架
實(shí)鬧匾?。茰O惴ㄋ枷朧峭ü?統(tǒng)計(jì)某個單詞在其他單詞之后出現(xiàn)的次數(shù)以及該單詞是否出現(xiàn)在權(quán)重較高的單詞之后,經(jīng)過不停的迭代,能夠提取出一個文檔的特征詞。TextRank算法與TF-IDF算法不同的是,TF-IDF算法需要許多不同的文檔才能夠提取出一篇文檔的特征詞,而TextRank算法僅僅需要一篇文檔就能夠提取出特征詞。TextRank的算法的原理如圖2-1所示,假設(shè)W1、W2、W3和W4是一篇文章中出現(xiàn)的四個單詞,W1、W2和W3的后面都出現(xiàn)了W4,則相應(yīng)的W4的權(quán)重就會很高;蛘哒fW1、W2和W3的權(quán)重很高的話,那么W4的權(quán)重值也會相應(yīng)的提高。圖2-1TextRank算法原理示意圖2.2長短時記憶網(wǎng)絡(luò)長短時記憶網(wǎng)絡(luò)(LSTM)是循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一個進(jìn)階版本,由Hochreiter
τ貿(mào)【爸饕??ㄒ韻鋁椒矯媯海?)對于文本的處理;(2)與時序相關(guān)的應(yīng)用場景。從其應(yīng)用場景來看,無論是應(yīng)用于哪一種應(yīng)用場景,都有一個共同點(diǎn),就是所處理的內(nèi)容都是有先后順序的。比如對于文本的情感分析處理,一句話中的內(nèi)容先后順序是不能改變的,如果內(nèi)容的先后順序改變了,其情感極性也有可能隨之改變。再比如與時序相關(guān)的應(yīng)用場景,經(jīng)典的場景就是利用LSTM來預(yù)測股票的走勢,每一天的走勢是不能隨意變換位置的,否則含義就變了。LSTM由于其獨(dú)特的結(jié)構(gòu)使得其對于長期依賴的問題有良好的表現(xiàn),其結(jié)構(gòu)如圖2-2所示:圖2-2LSTM結(jié)構(gòu)圖從圖中我們可以看出,LSTM處理信息的流程可以分為三個部分。第一部分決定哪些信息需要被遺忘,通過Sigmoid函數(shù)的輸出值,我們可以判斷在上一個狀態(tài)中的信息有多少可以被遺忘。第二部分決定添加哪些新的信息,該部分分為兩個步驟,第一步是將新的信息通過Sigmoid函數(shù)決定有多少新的信息能夠添加,第二步是tanh層根據(jù)現(xiàn)在的輸入與上一層的輸出生成一個新的狀態(tài)。第三部分為信息的選擇性輸出,計(jì)算出Sigmoid門的輸出與tanh處理后的細(xì)胞狀態(tài)相乘得到最終的輸出結(jié)果。而圖中的水平線是該網(wǎng)絡(luò)結(jié)構(gòu)的關(guān)鍵,它貫穿整個鏈條。LSTM能夠很好的處理與時序有關(guān)問題的關(guān)鍵就在于“門”的存在,以一個簡單的情感極性分析為例,如圖2-3所示:
【參考文獻(xiàn)】:
期刊論文
[1]融合用戶信任和影響力的top-N推薦算法[J]. 張雪峰,陳秀莉,僧德文. 浙江大學(xué)學(xué)報(bào)(工學(xué)版). 2020(02)
[2]基于信息熵加權(quán)的Word2vec中文文本分類研究[J]. 吳萍萍. 長春師范大學(xué)學(xué)報(bào). 2020(02)
[3]基于編碼解碼器與深度主題特征抽取的多標(biāo)簽文本分類[J]. 陳文實(shí),劉心惠,魯明羽. 南京師大學(xué)報(bào)(自然科學(xué)版). 2019(04)
[4]一種基于深度學(xué)習(xí)的中文文本特征提取與分類方法[J]. 曹魯慧,鄧玉香,陳通,李釗. 山東科學(xué). 2019(06)
[5]基于深度學(xué)習(xí)的APP-Store評論情感分析[J]. 李鑫,李曉戈. 計(jì)算機(jī)與數(shù)字工程. 2019(10)
[6]基于位置的個性化關(guān)鍵詞查詢推薦[J]. 梁耀培,吳定明. 深圳大學(xué)學(xué)報(bào)(理工版). 2019(04)
[7]融合主題模型和卷積神經(jīng)網(wǎng)絡(luò)的APP推薦研究[J]. 王杰,唐菁薈,王昊,鄧三鴻. 情報(bào)理論與實(shí)踐. 2019(04)
[8]面向移動APP的個性化推薦算法[J]. 尚燕飛,陳德運(yùn),楊海陸. 哈爾濱理工大學(xué)學(xué)報(bào). 2018(06)
[9]基于社交網(wǎng)絡(luò)信任關(guān)系的服務(wù)推薦方法[J]. 王佳蕾,郭耀,劉志宏. 計(jì)算機(jī)科學(xué). 2018(S2)
[10]基于APP搜索系統(tǒng)的PageRank改進(jìn)算法[J]. 李春生,劉小剛,焦海濤,張可佳. 計(jì)算機(jī)與現(xiàn)代化. 2018(07)
博士論文
[1]搜索引擎中的實(shí)體推薦關(guān)鍵技術(shù)研究[D]. 黃際洲.哈爾濱工業(yè)大學(xué) 2019
碩士論文
[1]基于潛在共現(xiàn)的推薦算法研究及其應(yīng)用[D]. 王恩慧.山西大學(xué) 2019
[2]基于Spark的網(wǎng)絡(luò)數(shù)據(jù)分析系統(tǒng)研究與實(shí)現(xiàn)[D]. 鄭文輝.華中科技大學(xué) 2019
[3]新傣文手寫體字符識別算法比較研究[D]. 張立欣.云南大學(xué) 2018
[4]基于權(quán)限和功能的APP個性化推薦算法的研究[D]. 曾觀音.武漢大學(xué) 2017
[5]基于文本分析的情感挖掘模型研究與應(yīng)用[D]. 程強(qiáng).電子科技大學(xué) 2017
[6]網(wǎng)商用戶評論中錯別字自動檢測與糾正的研究及實(shí)現(xiàn)[D]. 徐夢瑤.北京工業(yè)大學(xué) 2016
[7]基于Hadoop架構(gòu)的商業(yè)推薦引擎協(xié)同過濾算法設(shè)計(jì)與實(shí)現(xiàn)[D]. 周恒新.電子科技大學(xué) 2016
[8]具有語義搜索推薦功能的交互式專業(yè)主頁系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D]. 王爽.北京郵電大學(xué) 2015
本文編號:3271155
【文章來源】:河南大學(xué)河南省
【文章頁數(shù)】:61 頁
【學(xué)位級別】:碩士
【部分圖文】:
基于加權(quán)Word2vec融合多維信息的IOSAPP按需推薦框架
實(shí)鬧匾?。茰O惴ㄋ枷朧峭ü?統(tǒng)計(jì)某個單詞在其他單詞之后出現(xiàn)的次數(shù)以及該單詞是否出現(xiàn)在權(quán)重較高的單詞之后,經(jīng)過不停的迭代,能夠提取出一個文檔的特征詞。TextRank算法與TF-IDF算法不同的是,TF-IDF算法需要許多不同的文檔才能夠提取出一篇文檔的特征詞,而TextRank算法僅僅需要一篇文檔就能夠提取出特征詞。TextRank的算法的原理如圖2-1所示,假設(shè)W1、W2、W3和W4是一篇文章中出現(xiàn)的四個單詞,W1、W2和W3的后面都出現(xiàn)了W4,則相應(yīng)的W4的權(quán)重就會很高;蛘哒fW1、W2和W3的權(quán)重很高的話,那么W4的權(quán)重值也會相應(yīng)的提高。圖2-1TextRank算法原理示意圖2.2長短時記憶網(wǎng)絡(luò)長短時記憶網(wǎng)絡(luò)(LSTM)是循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一個進(jìn)階版本,由Hochreiter
τ貿(mào)【爸饕??ㄒ韻鋁椒矯媯海?)對于文本的處理;(2)與時序相關(guān)的應(yīng)用場景。從其應(yīng)用場景來看,無論是應(yīng)用于哪一種應(yīng)用場景,都有一個共同點(diǎn),就是所處理的內(nèi)容都是有先后順序的。比如對于文本的情感分析處理,一句話中的內(nèi)容先后順序是不能改變的,如果內(nèi)容的先后順序改變了,其情感極性也有可能隨之改變。再比如與時序相關(guān)的應(yīng)用場景,經(jīng)典的場景就是利用LSTM來預(yù)測股票的走勢,每一天的走勢是不能隨意變換位置的,否則含義就變了。LSTM由于其獨(dú)特的結(jié)構(gòu)使得其對于長期依賴的問題有良好的表現(xiàn),其結(jié)構(gòu)如圖2-2所示:圖2-2LSTM結(jié)構(gòu)圖從圖中我們可以看出,LSTM處理信息的流程可以分為三個部分。第一部分決定哪些信息需要被遺忘,通過Sigmoid函數(shù)的輸出值,我們可以判斷在上一個狀態(tài)中的信息有多少可以被遺忘。第二部分決定添加哪些新的信息,該部分分為兩個步驟,第一步是將新的信息通過Sigmoid函數(shù)決定有多少新的信息能夠添加,第二步是tanh層根據(jù)現(xiàn)在的輸入與上一層的輸出生成一個新的狀態(tài)。第三部分為信息的選擇性輸出,計(jì)算出Sigmoid門的輸出與tanh處理后的細(xì)胞狀態(tài)相乘得到最終的輸出結(jié)果。而圖中的水平線是該網(wǎng)絡(luò)結(jié)構(gòu)的關(guān)鍵,它貫穿整個鏈條。LSTM能夠很好的處理與時序有關(guān)問題的關(guān)鍵就在于“門”的存在,以一個簡單的情感極性分析為例,如圖2-3所示:
【參考文獻(xiàn)】:
期刊論文
[1]融合用戶信任和影響力的top-N推薦算法[J]. 張雪峰,陳秀莉,僧德文. 浙江大學(xué)學(xué)報(bào)(工學(xué)版). 2020(02)
[2]基于信息熵加權(quán)的Word2vec中文文本分類研究[J]. 吳萍萍. 長春師范大學(xué)學(xué)報(bào). 2020(02)
[3]基于編碼解碼器與深度主題特征抽取的多標(biāo)簽文本分類[J]. 陳文實(shí),劉心惠,魯明羽. 南京師大學(xué)報(bào)(自然科學(xué)版). 2019(04)
[4]一種基于深度學(xué)習(xí)的中文文本特征提取與分類方法[J]. 曹魯慧,鄧玉香,陳通,李釗. 山東科學(xué). 2019(06)
[5]基于深度學(xué)習(xí)的APP-Store評論情感分析[J]. 李鑫,李曉戈. 計(jì)算機(jī)與數(shù)字工程. 2019(10)
[6]基于位置的個性化關(guān)鍵詞查詢推薦[J]. 梁耀培,吳定明. 深圳大學(xué)學(xué)報(bào)(理工版). 2019(04)
[7]融合主題模型和卷積神經(jīng)網(wǎng)絡(luò)的APP推薦研究[J]. 王杰,唐菁薈,王昊,鄧三鴻. 情報(bào)理論與實(shí)踐. 2019(04)
[8]面向移動APP的個性化推薦算法[J]. 尚燕飛,陳德運(yùn),楊海陸. 哈爾濱理工大學(xué)學(xué)報(bào). 2018(06)
[9]基于社交網(wǎng)絡(luò)信任關(guān)系的服務(wù)推薦方法[J]. 王佳蕾,郭耀,劉志宏. 計(jì)算機(jī)科學(xué). 2018(S2)
[10]基于APP搜索系統(tǒng)的PageRank改進(jìn)算法[J]. 李春生,劉小剛,焦海濤,張可佳. 計(jì)算機(jī)與現(xiàn)代化. 2018(07)
博士論文
[1]搜索引擎中的實(shí)體推薦關(guān)鍵技術(shù)研究[D]. 黃際洲.哈爾濱工業(yè)大學(xué) 2019
碩士論文
[1]基于潛在共現(xiàn)的推薦算法研究及其應(yīng)用[D]. 王恩慧.山西大學(xué) 2019
[2]基于Spark的網(wǎng)絡(luò)數(shù)據(jù)分析系統(tǒng)研究與實(shí)現(xiàn)[D]. 鄭文輝.華中科技大學(xué) 2019
[3]新傣文手寫體字符識別算法比較研究[D]. 張立欣.云南大學(xué) 2018
[4]基于權(quán)限和功能的APP個性化推薦算法的研究[D]. 曾觀音.武漢大學(xué) 2017
[5]基于文本分析的情感挖掘模型研究與應(yīng)用[D]. 程強(qiáng).電子科技大學(xué) 2017
[6]網(wǎng)商用戶評論中錯別字自動檢測與糾正的研究及實(shí)現(xiàn)[D]. 徐夢瑤.北京工業(yè)大學(xué) 2016
[7]基于Hadoop架構(gòu)的商業(yè)推薦引擎協(xié)同過濾算法設(shè)計(jì)與實(shí)現(xiàn)[D]. 周恒新.電子科技大學(xué) 2016
[8]具有語義搜索推薦功能的交互式專業(yè)主頁系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D]. 王爽.北京郵電大學(xué) 2015
本文編號:3271155
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3271155.html
最近更新
教材專著