融合情感標(biāo)簽與時(shí)空特征的餐廳推薦算法研究
發(fā)布時(shí)間:2021-08-11 06:24
隨著電子商務(wù)的廣泛應(yīng)用和位置采集技術(shù)的不斷成熟,越來越多的用戶可以隨時(shí)進(jìn)行簽到發(fā)表自己的觀點(diǎn)和看法,因而產(chǎn)生了大量的簽到數(shù)據(jù),這些簽到數(shù)據(jù)主要包括帶有用戶情感的評(píng)價(jià)文本,地理位置(經(jīng)、緯度)、簽到時(shí)間等信息,簽到數(shù)據(jù)信息非常具有研究?jī)r(jià)值,可以通過分析簽到信息特征更好地刻畫用戶興趣模型。隨著用戶簽到信息過載問題的出現(xiàn),使得推薦技術(shù)的研究受到廣泛的關(guān)注,有效的推薦算法不僅可以幫助用戶發(fā)現(xiàn)新興趣點(diǎn),還可以幫助興趣地點(diǎn)商家發(fā)掘更多的潛在客戶,提高商家的利益。本論文針對(duì)大眾點(diǎn)評(píng)網(wǎng)美食餐廳的簽到信息作為研究對(duì)象,對(duì)真實(shí)的數(shù)據(jù)集進(jìn)行一系列的統(tǒng)計(jì)處理,從情感、空間、時(shí)間等多角度挖掘用戶行為的特征及規(guī)律,分析影響用戶興趣的重要因素,根據(jù)發(fā)現(xiàn)的簽到特征進(jìn)行餐廳推薦算法的深入研究。首先,進(jìn)行了融入情感標(biāo)簽的協(xié)同過濾算法研究,對(duì)評(píng)論語(yǔ)句進(jìn)行分詞、詞性標(biāo)注等句法處理,按照句法路徑從簽到數(shù)據(jù)的評(píng)論信息中抽取帶有評(píng)論者感情的情感標(biāo)簽,采用基于詞典的情感分析方法,在充分考慮程度副詞及否定詞對(duì)情感極性的影響的基礎(chǔ)上分析用戶標(biāo)簽情感極性。利用用戶—特征情感評(píng)分矩陣計(jì)算用戶間相似度,找到最相似的K個(gè)用戶,根據(jù)“最近鄰居”獲...
【文章來源】:大連海事大學(xué)遼寧省 211工程院校
【文章頁(yè)數(shù)】:88 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖2.?2基于項(xiàng)目的協(xié)同過濾推薦過程??Fig.?2.2?Project-based?collaborative?filtering?recommendation?process??
?融合情感標(biāo)簽與時(shí)空特征的推薦算法研究???得到對(duì)應(yīng)的URL,并且存儲(chǔ)對(duì)應(yīng)的URL到待爬取隊(duì)列中,然后返回上一步,繼續(xù)解析??新的URL,當(dāng)完成整個(gè)網(wǎng)絡(luò)的遍歷或者達(dá)到系統(tǒng)設(shè)置的條件,停止。工作流程如圖2.5??所示。??初始化配置信息??I??初始化待爬取隊(duì)列??1??創(chuàng)建workder縣城???????抓取隊(duì)一中彈!??i?反爬處理:切換IP、??Fetcherk取頁(yè)面|?丨離請(qǐng)求_??Y?Handler處理頁(yè)面一?<<^3容為反爬^^^>—Y>將1:乩放回待抓取隊(duì)列??;?|?N??Parser解析頁(yè)面一容為目標(biāo)^??解析并獲取目標(biāo)數(shù)據(jù)???I???將URL放到己爬取隊(duì)列??丁?,??_?_?|解析并獲取獲取后續(xù)URL放入待爬取隊(duì)列??C5D?—?I?—??存儲(chǔ)解析的目標(biāo)數(shù)據(jù)???^r-<Celayma?>J?N??圖2.?5爬蟲工作流程??Fig.?2.5?Reptile?workflow??控制器,解析器,資源庫(kù)組成了?Web爬蟲系統(tǒng)框架的主要過程,三者間互相配合,??協(xié)同完成爬蟲工作。其中,控制器是中央部分,通過系統(tǒng)傳遞的URL鏈接分配線程,??然后調(diào)用線程啟動(dòng)爬蟲來抓取網(wǎng)頁(yè)。解析器的主要任務(wù)是進(jìn)行網(wǎng)頁(yè)信息的下載并通過過??濾、提取特定HTML標(biāo)簽和分析信息等一系列方式處理網(wǎng)頁(yè)數(shù)據(jù),是整個(gè)過程的主要??-12?-??
?大連海事大學(xué)碩士學(xué)位論文???37?t???36.9?????36.7?J?H????煒?36.6?—-—???一?一?????—??故?.‘??度?36.5???_?:-?V?/?.———??36.4??^——?????舞?*??36.3?i?;???36.2?n??—??參?參??36.1???——?一?一??113.4?113.9?114.4?114.9?115.4??經(jīng)度??圖4.?5簽到數(shù)據(jù)集經(jīng)緯度分布??Fig.4.5?Check-in?dataset?latitude?and?longitude?distribution??圖4.6統(tǒng)計(jì)了用戶簽到的相鄰位置間的距離與用戶簽到位置的概率的分布,從圖中??能夠看出,用戶簽到位置的概率與用戶簽到的相鄰位置間的距離成反比,即相鄰簽到位??置的距離越近,那么用戶簽到該位置的槪率越大。??0.6????0.5?—\???0.4?\???\??率.\??0.2?-—A?——??〇1????0?10?20?30?40?50?60??距禽(km)??圖4.?6用戶相鄰簽到位置的距離分布??Fig.4.6?Distance?distribution?of?users'?adjacent?check-in?locations??-45?-??
【參考文獻(xiàn)】:
期刊論文
[1]基于知網(wǎng)的詞語(yǔ)語(yǔ)義相似度改進(jìn)算法[J]. 李蕾,楊麗花. 計(jì)算機(jī)技術(shù)與發(fā)展. 2019(04)
[2]一種基于HowNet語(yǔ)義計(jì)算的綜合特征詞權(quán)重計(jì)算方法[J]. 孫麗莉,張小剛. 統(tǒng)計(jì)與決策. 2018(18)
[3]基于句法路徑的中文評(píng)論細(xì)粒度情感分析[J]. 胡征,陳爾希,曾獻(xiàn)輝,蔡一. 信息技術(shù). 2018(09)
[4]基于依存句法的跨語(yǔ)言細(xì)粒度情感分析[J]. 唐曉波,劉一平. 情報(bào)理論與實(shí)踐. 2018(06)
[5]基于用戶興趣的協(xié)同過濾推薦算法[J]. 宋晨晨,曲朝陽(yáng),任有學(xué),劉耀偉,牛強(qiáng),獨(dú)健鴻. 民營(yíng)科技. 2017(07)
[6]基于改進(jìn)相似性度量的項(xiàng)目協(xié)同過濾推薦算法[J]. 于金明,孟軍,吳秋峰. 計(jì)算機(jī)應(yīng)用. 2017(05)
[7]基于多特征融合的微博主題情感挖掘[J]. 黃發(fā)良,馮時(shí),王大玲,于戈. 計(jì)算機(jī)學(xué)報(bào). 2017(04)
[8]基于知網(wǎng)與詞林的詞語(yǔ)語(yǔ)義相似度計(jì)算[J]. 朱新華,馬潤(rùn)聰,孫柳,陳宏朝. 中文信息學(xué)報(bào). 2016(04)
[9]基于時(shí)間感知的地點(diǎn)推薦算法[J]. 盧露. 計(jì)算機(jī)工程與科學(xué). 2016(03)
[10]時(shí)間衰減制導(dǎo)的協(xié)同過濾相似性計(jì)算[J]. 李源鑫,肖如良,陳洪濤,趙婷,李宏恩. 計(jì)算機(jī)系統(tǒng)應(yīng)用. 2013(11)
碩士論文
[1]基于深度特征提取的文本情感極性分類研究[D]. 田竹.山東大學(xué) 2017
[2]基于統(tǒng)計(jì)方法的中文短文本情感分析[D]. 盧興.北京理工大學(xué) 2016
[3]基于位置服務(wù)的個(gè)性化推薦算法研究[D]. 林學(xué)欽.華南理工大學(xué) 2012
[4]基于語(yǔ)義的標(biāo)簽推薦系統(tǒng)關(guān)鍵問題研究[D]. 鄧雙義.華東師范大學(xué) 2010
本文編號(hào):3335637
【文章來源】:大連海事大學(xué)遼寧省 211工程院校
【文章頁(yè)數(shù)】:88 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖2.?2基于項(xiàng)目的協(xié)同過濾推薦過程??Fig.?2.2?Project-based?collaborative?filtering?recommendation?process??
?融合情感標(biāo)簽與時(shí)空特征的推薦算法研究???得到對(duì)應(yīng)的URL,并且存儲(chǔ)對(duì)應(yīng)的URL到待爬取隊(duì)列中,然后返回上一步,繼續(xù)解析??新的URL,當(dāng)完成整個(gè)網(wǎng)絡(luò)的遍歷或者達(dá)到系統(tǒng)設(shè)置的條件,停止。工作流程如圖2.5??所示。??初始化配置信息??I??初始化待爬取隊(duì)列??1??創(chuàng)建workder縣城???????抓取隊(duì)一中彈!??i?反爬處理:切換IP、??Fetcherk取頁(yè)面|?丨離請(qǐng)求_??Y?Handler處理頁(yè)面一?<<^3容為反爬^^^>—Y>將1:乩放回待抓取隊(duì)列??;?|?N??Parser解析頁(yè)面一容為目標(biāo)^??解析并獲取目標(biāo)數(shù)據(jù)???I???將URL放到己爬取隊(duì)列??丁?,??_?_?|解析并獲取獲取后續(xù)URL放入待爬取隊(duì)列??C5D?—?I?—??存儲(chǔ)解析的目標(biāo)數(shù)據(jù)???^r-<Celayma?>J?N??圖2.?5爬蟲工作流程??Fig.?2.5?Reptile?workflow??控制器,解析器,資源庫(kù)組成了?Web爬蟲系統(tǒng)框架的主要過程,三者間互相配合,??協(xié)同完成爬蟲工作。其中,控制器是中央部分,通過系統(tǒng)傳遞的URL鏈接分配線程,??然后調(diào)用線程啟動(dòng)爬蟲來抓取網(wǎng)頁(yè)。解析器的主要任務(wù)是進(jìn)行網(wǎng)頁(yè)信息的下載并通過過??濾、提取特定HTML標(biāo)簽和分析信息等一系列方式處理網(wǎng)頁(yè)數(shù)據(jù),是整個(gè)過程的主要??-12?-??
?大連海事大學(xué)碩士學(xué)位論文???37?t???36.9?????36.7?J?H????煒?36.6?—-—???一?一?????—??故?.‘??度?36.5???_?:-?V?/?.———??36.4??^——?????舞?*??36.3?i?;???36.2?n??—??參?參??36.1???——?一?一??113.4?113.9?114.4?114.9?115.4??經(jīng)度??圖4.?5簽到數(shù)據(jù)集經(jīng)緯度分布??Fig.4.5?Check-in?dataset?latitude?and?longitude?distribution??圖4.6統(tǒng)計(jì)了用戶簽到的相鄰位置間的距離與用戶簽到位置的概率的分布,從圖中??能夠看出,用戶簽到位置的概率與用戶簽到的相鄰位置間的距離成反比,即相鄰簽到位??置的距離越近,那么用戶簽到該位置的槪率越大。??0.6????0.5?—\???0.4?\???\??率.\??0.2?-—A?——??〇1????0?10?20?30?40?50?60??距禽(km)??圖4.?6用戶相鄰簽到位置的距離分布??Fig.4.6?Distance?distribution?of?users'?adjacent?check-in?locations??-45?-??
【參考文獻(xiàn)】:
期刊論文
[1]基于知網(wǎng)的詞語(yǔ)語(yǔ)義相似度改進(jìn)算法[J]. 李蕾,楊麗花. 計(jì)算機(jī)技術(shù)與發(fā)展. 2019(04)
[2]一種基于HowNet語(yǔ)義計(jì)算的綜合特征詞權(quán)重計(jì)算方法[J]. 孫麗莉,張小剛. 統(tǒng)計(jì)與決策. 2018(18)
[3]基于句法路徑的中文評(píng)論細(xì)粒度情感分析[J]. 胡征,陳爾希,曾獻(xiàn)輝,蔡一. 信息技術(shù). 2018(09)
[4]基于依存句法的跨語(yǔ)言細(xì)粒度情感分析[J]. 唐曉波,劉一平. 情報(bào)理論與實(shí)踐. 2018(06)
[5]基于用戶興趣的協(xié)同過濾推薦算法[J]. 宋晨晨,曲朝陽(yáng),任有學(xué),劉耀偉,牛強(qiáng),獨(dú)健鴻. 民營(yíng)科技. 2017(07)
[6]基于改進(jìn)相似性度量的項(xiàng)目協(xié)同過濾推薦算法[J]. 于金明,孟軍,吳秋峰. 計(jì)算機(jī)應(yīng)用. 2017(05)
[7]基于多特征融合的微博主題情感挖掘[J]. 黃發(fā)良,馮時(shí),王大玲,于戈. 計(jì)算機(jī)學(xué)報(bào). 2017(04)
[8]基于知網(wǎng)與詞林的詞語(yǔ)語(yǔ)義相似度計(jì)算[J]. 朱新華,馬潤(rùn)聰,孫柳,陳宏朝. 中文信息學(xué)報(bào). 2016(04)
[9]基于時(shí)間感知的地點(diǎn)推薦算法[J]. 盧露. 計(jì)算機(jī)工程與科學(xué). 2016(03)
[10]時(shí)間衰減制導(dǎo)的協(xié)同過濾相似性計(jì)算[J]. 李源鑫,肖如良,陳洪濤,趙婷,李宏恩. 計(jì)算機(jī)系統(tǒng)應(yīng)用. 2013(11)
碩士論文
[1]基于深度特征提取的文本情感極性分類研究[D]. 田竹.山東大學(xué) 2017
[2]基于統(tǒng)計(jì)方法的中文短文本情感分析[D]. 盧興.北京理工大學(xué) 2016
[3]基于位置服務(wù)的個(gè)性化推薦算法研究[D]. 林學(xué)欽.華南理工大學(xué) 2012
[4]基于語(yǔ)義的標(biāo)簽推薦系統(tǒng)關(guān)鍵問題研究[D]. 鄧雙義.華東師范大學(xué) 2010
本文編號(hào):3335637
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3335637.html
最近更新
教材專著