面向在線社交網(wǎng)絡(luò)用戶生成內(nèi)容的飲食話題發(fā)現(xiàn)研究
本文關(guān)鍵詞:面向在線社交網(wǎng)絡(luò)用戶生成內(nèi)容的飲食話題發(fā)現(xiàn)研究
更多相關(guān)文章: 話題檢測 用戶生成內(nèi)容 主題覆蓋率 飲食挖掘
【摘要】:【目的】通過大規(guī)模文本聚類技術(shù)進行話題檢測,并自動揀選優(yōu)質(zhì)話題!痉椒ā恳孕吕宋⒉┥吓c飲食相關(guān)的微博內(nèi)容為數(shù)據(jù)源,結(jié)合文本聚類與深度學(xué)習(xí)知識進行話題檢測。通過匹配微博發(fā)布的月份,將微博劃分為四季微博;使用向量空間模型和文本聚類方法,對不同季節(jié)的微博進行話題檢測,獲得候選話題;結(jié)合深度學(xué)習(xí)知識,提出主題覆蓋率概念,用以自動評價話題質(zhì)量,去除低質(zhì)量話題!窘Y(jié)果】基于主題覆蓋率的話題篩選結(jié)果符合人工揀選預(yù)期,抽取獲得主題覆蓋率高于0.5的優(yōu)質(zhì)話題!揪窒蕖吭掝}檢測質(zhì)量的評價主要以定性評價為主!窘Y(jié)論】通過計算主題覆蓋率來自動選擇優(yōu)質(zhì)話題,該方法效率高,通用性強,獲得的話題便于理解,較好地揭示了四季中飲食微博的話題分布。
【作者單位】: 南京理工大學(xué)經(jīng)濟管理學(xué)院;杭州師范大學(xué)阿里巴巴復(fù)雜科學(xué)研究中心;江蘇省數(shù)據(jù)工程與知識服務(wù)重點實驗室(南京大學(xué));
【關(guān)鍵詞】: 話題檢測 用戶生成內(nèi)容 主題覆蓋率 飲食挖掘
【基金】:國家社會科學(xué)基金項目“在線社交網(wǎng)絡(luò)中基于用戶的知識組織模式研究”(項目編號:14BTQ033);國家社會科學(xué)基金重點項目“大數(shù)據(jù)環(huán)境下社會輿情與決策支持方法體系研究”(項目編號:14AZD084) 江蘇省普通高校研究生科研創(chuàng)新(實踐)計劃項目“基于社交媒體的多粒度電影評論挖掘研究”(項目編號:SJLX15_0166)的研究成果之一
【分類號】:TP391.1;G206
【正文快照】: 1引言 Web2.0理念和技術(shù)的發(fā)展,帶動了社交媒體的迅速發(fā)展。多種多樣的社交平臺,為用戶之間的交流提供了極大的便捷。越來越多的人通過社交網(wǎng)絡(luò)分享自己對事物的觀點。與此同時,隨著生活水平的提高,人們對飲食的關(guān)注日益增加,人們在社交網(wǎng)絡(luò)上分享美食、推薦菜譜、探討飲食功
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 趙亞琴;周獻中;;一種基于小生境遺傳算法的中文文本聚類新方法[J];計算機工程;2006年06期
2 劉務(wù)華;羅鐵堅;王文杰;;文本聚類技術(shù)的有效性驗證[J];計算機工程;2007年01期
3 丁X;許侃;;基于文本聚類方法的我國科技管理研究領(lǐng)域的計量研究[J];科學(xué)學(xué)研究;2007年S1期
4 孫愛香;楊鑫華;;關(guān)于文本聚類有效性評價的研究[J];山東理工大學(xué)學(xué)報(自然科學(xué)版);2007年05期
5 丘志宏;宮雷光;;利用上下文提高文本聚類的效果[J];中文信息學(xué)報;2007年06期
6 吳啟明;易云飛;;文本聚類綜述[J];河池學(xué)院學(xué)報;2008年02期
7 李江華;楊書新;劉利峰;;基于概念格的文本聚類[J];計算機應(yīng)用;2008年09期
8 趙文鵬;;淺談文本聚類研究[J];企業(yè)家天地下半月刊(理論版);2009年02期
9 章成志;;文本聚類結(jié)果描述研究綜述[J];現(xiàn)代圖書情報技術(shù);2009年02期
10 馬娜;;文本聚類研究[J];電腦知識與技術(shù);2009年20期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 趙世奇;劉挺;李生;;一種基于主題的文本聚類方法[A];第三屆學(xué)生計算語言學(xué)研討會論文集[C];2006年
2 王洪俊;俞士汶;蘇祺;施水才;肖詩斌;;中文文本聚類的特征單元比較[A];第二屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議(NCIRCS-2005)論文集[C];2005年
3 胡吉祥;許洪波;劉悅;王斌;程學(xué)旗;;基于重復(fù)串的短文本聚類研究[A];全國第八屆計算語言學(xué)聯(lián)合學(xué)術(shù)會議(JSCL-2005)論文集[C];2005年
4 白剛;張錚;丁宗堯;朱毅;;中文文本聚類在互聯(lián)網(wǎng)搜索的研究與應(yīng)用[A];第三屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集[C];2007年
5 張猛;王大玲;于戈;;一種基于自動閾值發(fā)現(xiàn)的文本聚類方法[A];第二十一屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(研究報告篇)[C];2004年
6 王樂;田李;賈焰;韓偉紅;;一個并行的文本聚類混合算法[A];第二十四屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(研究報告篇)[C];2007年
7 章成志;;基于多語文本聚類的主題層次體系生成研究1)[A];國家自然科學(xué)基金委員會管理科學(xué)部宏觀管理與政策學(xué)科青年基金獲得者交流研討會論文集[C];2010年
8 邱立坤;程葳;龍志yN;孫嬌華;;面向BBS的話題挖掘初探[A];全國第八屆計算語言學(xué)聯(lián)合學(xué)術(shù)會議(JSCL-2005)論文集[C];2005年
9 羅娜;左萬利;袁福宇;張靖波;張慧杰;;使用本體語義提高文本聚類(英文)[A];全國語域web與本體能研討會論文集[C];2006年
10 孫承杰;朱文煥;林磊;劉遠超;;BBS短文本聚類技術(shù)研究[A];第五屆全國信息檢索學(xué)術(shù)會議論文集[C];2009年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前3條
1 徐森;文本聚類集成關(guān)鍵技術(shù)研究[D];哈爾濱工程大學(xué);2010年
2 高茂庭;文本聚類分析若干問題研究[D];天津大學(xué);2007年
3 孟憲軍;互聯(lián)網(wǎng)文本聚類與檢索技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2009年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 康健;基于Multi-agent和群體智能的藏文網(wǎng)絡(luò)輿情管理研究[D];西南交通大學(xué);2015年
2 李偉;基于頻繁詞集詞共現(xiàn)網(wǎng)絡(luò)的短文本聚類方法[D];北京交通大學(xué);2016年
3 龐衛(wèi)巍;微博熱點話題檢測研究與分析[D];浙江工業(yè)大學(xué);2012年
4 朱德超;基于詞嵌入文本聚類技術(shù)的研究與實現(xiàn)[D];東華大學(xué);2016年
5 張虎;文本聚類在IT運維系統(tǒng)中的應(yīng)用研究[D];西安工程大學(xué);2016年
6 魏彥婧;基于AP算法的文本聚類研究與實現(xiàn)[D];東北大學(xué);2014年
7 華珍;文本聚類中特征選擇方法研究[D];湖北工業(yè)大學(xué);2016年
8 張海濤;基于文本降維和蟻群算法的文本聚類研究[D];安徽大學(xué);2016年
9 張麗;一種中文文本聚類方法的研究[D];哈爾濱工程大學(xué);2009年
10 李伯陽;文本聚類方法研究及其應(yīng)用[D];廈門大學(xué);2008年
,本文編號:577304
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/577304.html