基于文本挖掘的商品推薦
本文選題:特征詞 切入點:相似度計算 出處:《哈爾濱商業(yè)大學學報(自然科學版)》2017年04期 論文類型:期刊論文
【摘要】:對電子商務網(wǎng)站的評論文本進行分詞、去停用詞等整理,通過詞頻統(tǒng)計提取特征詞,應用詞頻-逆文檔頻率提高特征詞的類別區(qū)分能力以增加特征詞的準確性.在收集大量的電子商務網(wǎng)站的評論文本及一系列預處理后構建了特征詞詞庫.采用詞語相似度計算方法用于關鍵詞向量與特征詞詞庫相似度的計算.根據(jù)相似度計算結果對用戶評論的商品進行排序以實現(xiàn)對用戶商品的推薦.設計了商品推薦系統(tǒng)并完成了實驗程序.利用收集到的用戶評論文本完成了對商品的推薦實驗,并對實驗結果進行了考察與分析.
[Abstract]:The comment text of electronic commerce website is partitioned, the word is stopped, and the feature words are extracted by word frequency statistics. Using word frequency-inverse document frequency to improve the classification ability of feature words in order to increase the accuracy of feature words. After collecting a large number of comment texts and a series of preprocessing of e-commerce websites, a feature word database was constructed. The similarity calculation method is used to calculate the similarity between the keyword vector and the word base of feature words. According to the result of similarity calculation, the items commented by the user are sorted to realize the recommendation of the user's goods. A commodity recommendation system is designed. And completed the experimental program. Using the collected user comments to complete the product recommendation experiment, The experimental results are investigated and analyzed.
【作者單位】: 哈爾濱商業(yè)大學計算機與信息工程學院;黑龍江旅游職業(yè)技術學院基礎學部;
【基金】:黑龍江省教育廳科學研究項目(12511127)
【分類號】:TP391.1
【相似文獻】
相關期刊論文 前10條
1 徐建民;張猛;吳樹芳;;基于話題的事件相似度計算[J];計算機工程與設計;2014年04期
2 王鈞;趙曰利;;浙大中藥指紋圖譜相似度計算軟件在煙用香精香料色譜分析中的引入應用[J];現(xiàn)代儀器;2007年03期
3 單建芳;劉宗田;周文;;事件相似度計算[J];小型微型計算機系統(tǒng);2010年04期
4 劉文劍;郭寧;金天國;;制造資源本體的相似度計算模型[J];計算機集成制造系統(tǒng);2010年11期
5 邸書靈;劉曉飛;李歡;;基于分詞的語句相似度計算的改進[J];石家莊鐵道大學學報(自然科學版);2011年04期
6 秦學勇;張潤梅;;兩級相似度計算在主觀題機器閱卷中的應用[J];計算機工程;2012年11期
7 田衛(wèi)東;強繼朋;;基于問句類型的問句相似度計算[J];計算機應用研究;2014年04期
8 廉站俊;呂學強;張玉杰;施水才;;基于句子相似度計算的信息抽取[J];現(xiàn)代圖書情報技術;2007年06期
9 李偉;;中文語句相似度計算的方法初探[J];蘭州工業(yè)高等?茖W校學報;2009年04期
10 蘭美輝;任友俊;徐堅;高煒;;k-部排序本體相似度計算[J];計算機應用;2012年04期
相關會議論文 前10條
1 劉磊;張桂平;蔡東風;季鐸;;基于語義預測的雙語術語相似度計算[A];第四屆全國信息檢索與內(nèi)容安全學術會議論文集(上)[C];2008年
2 郭麗;蔡東風;季鐸;白宇;;統(tǒng)計與語義相融合的詞語相似度計算[A];第四屆全國學生計算語言學研討會會議論文集[C];2008年
3 陳立;宋自林;鄭世明;張英;;基于本體的概念相似度計算研究[A];江蘇省系統(tǒng)工程學會第十一屆學術年會論文集[C];2009年
4 車萬翔;劉挺;秦兵;李生;;面向雙語句對檢索的漢語句子相似度計算[A];語言計算與基于內(nèi)容的文本處理——全國第七屆計算語言學聯(lián)合學術會議論文集[C];2003年
5 郭文宏;范學峰;;基于語義詞典和本體知識的概念相似度計算[A];2008'中國信息技術與應用學術論壇論文集(二)[C];2008年
6 宋彥;張桂平;蔡東風;;基于N-gram的句子相似度計算技術[A];內(nèi)容計算的研究與應用前沿——第九屆全國計算語言學學術會議論文集[C];2007年
7 關毅;王曉龍;王強;;論系統(tǒng)相似的度量[A];全國第八屆計算語言學聯(lián)合學術會議(JSCL-2005)論文集[C];2005年
8 林民;宋柔;;基于結構描述的漢字字形相似度計算[A];第三屆學生計算語言學研討會論文集[C];2006年
9 趙妍妍;秦兵;劉挺;張俐;蘇中;;基于多特征融合的句子相似度計算[A];全國第八屆計算語言學聯(lián)合學術會議(JSCL-2005)論文集[C];2005年
10 張亮;尹存燕;陳家駿;;基于語義樹的中文詞語相似度計算與分析[A];中國計算機語言學研究前沿進展(2007-2009)[C];2009年
相關博士學位論文 前4條
1 馮曉文;基于GPU的相似度計算關鍵技術研究[D];華中科技大學;2014年
2 王秀紅;文本相似度計算核函數(shù)的構造及其在分布式信息檢索中的應用研究[D];江蘇大學;2012年
3 劉磊;概念內(nèi)涵屬性計算研究[D];上海交通大學;2011年
4 任磊;推薦系統(tǒng)關鍵技術研究[D];華東師范大學;2012年
相關碩士學位論文 前10條
1 梁韜;中文微博新詞與熱點話題發(fā)現(xiàn)技術研究[D];湖南工業(yè)大學;2015年
2 汪建成;漢越雙語新聞話題分析方法研究[D];昆明理工大學;2015年
3 唐海燕;基于全文的教育資源檢索模型研究[D];四川師范大學;2015年
4 舒佳根;中文實體鏈接研究[D];蘇州大學;2015年
5 孔行;基于主題推薦的輔助寫作系統(tǒng)[D];哈爾濱工業(yè)大學;2015年
6 孫潤志;基于語義理解的文本相似度計算研究與實現(xiàn)[D];中國科學院研究生院(沈陽計算技術研究所);2015年
7 劉敏;基于詞向量的句子相似度計算及其在基于實例的機器翻譯中的應用[D];北京理工大學;2015年
8 康毅;面向客服的自動問答系統(tǒng)關鍵技術研究[D];東北大學;2014年
9 吳宇浩;南海檔案數(shù)字化半自動?敝械牡妆就扑]探討[D];南京大學;2015年
10 吐爾遜阿依·阿不來提;小學維吾爾語文教材中的單句相似度研究[D];新疆師范大學;2015年
,本文編號:1625537
本文鏈接:http://sikaile.net/jingjilunwen/dianzishangwulunwen/1625537.html