社交網(wǎng)絡(luò)中用戶生成內(nèi)容隱含位置的推測(cè)方法研究
發(fā)布時(shí)間:2023-01-29 17:50
隨著社交網(wǎng)絡(luò)興起,用戶在社交網(wǎng)絡(luò)上產(chǎn)生了大量的用戶生成內(nèi)容,其中基于位置的用戶生成內(nèi)容可為個(gè)性化推薦、事件檢測(cè)、輿情監(jiān)控等智能應(yīng)用提供服務(wù)。然而社交網(wǎng)絡(luò)中僅有極少數(shù)的用戶生成內(nèi)容被標(biāo)記了位置,而且已有面向用戶生成內(nèi)容的位置推測(cè)方法多是城市級(jí)粗粒度的,不利于為用戶提供更精準(zhǔn)的個(gè)性化服務(wù)。為此,本文提出了一種推測(cè)社交網(wǎng)絡(luò)中用戶生成內(nèi)容隱含的細(xì)粒度位置的方法,該方法包括以下三部分。首先,解決用戶生成內(nèi)容中的實(shí)體識(shí)別問(wèn)題。本文提出一種根據(jù)知識(shí)庫(kù)和自然語(yǔ)言處理技術(shù)構(gòu)建的實(shí)體識(shí)別模型,用自然語(yǔ)言處理技術(shù)識(shí)別句子成分,根據(jù)知識(shí)庫(kù)識(shí)別不同句子成分中的實(shí)體,對(duì)拼寫錯(cuò)誤的實(shí)體通過(guò)詞干提取獲得實(shí)體。在一定程度上解決了社交網(wǎng)絡(luò)中用戶生成內(nèi)容具有的口語(yǔ)話、拼寫錯(cuò)誤、不規(guī)則書寫等問(wèn)題。其次,解決用戶生成內(nèi)容的過(guò)濾問(wèn)題。社交網(wǎng)絡(luò)中的用戶生成內(nèi)容涵蓋面非常廣泛,不是所有的用戶生成內(nèi)容都適合于位置推測(cè)。因此本文提出一種用戶生成內(nèi)容過(guò)濾模型,該模型根據(jù)地名庫(kù)和實(shí)體位置相關(guān)性函數(shù)判斷用戶生成內(nèi)容是否可用于位置推測(cè)。最后,構(gòu)建用于用戶生成內(nèi)容中隱含位置推測(cè)的實(shí)體位置模型。該模型以基于地理位置的社交網(wǎng)絡(luò)中的數(shù)據(jù)為數(shù)據(jù)集,抽取數(shù)...
【文章頁(yè)數(shù)】:63 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
1 緒論
1.1 研究背景及意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀分析
1.2.1 國(guó)外研究現(xiàn)狀
1.2.2 國(guó)內(nèi)研究現(xiàn)狀
1.3 本文研究?jī)?nèi)容
1.4 論文結(jié)構(gòu)安排
2 用戶生成內(nèi)容的實(shí)體識(shí)別
2.1 實(shí)體識(shí)別背景知識(shí)
2.1.1 Probase介紹
2.1.2 自然語(yǔ)言處理技術(shù)
2.2 實(shí)體識(shí)別現(xiàn)有方法研究
2.2.1 基于Probase的實(shí)體識(shí)別
2.2.2 基于自然語(yǔ)言處理的實(shí)體識(shí)別
2.3 FG_UGC的用戶生成內(nèi)容實(shí)體識(shí)別
2.3.1 FG_UGC的實(shí)體識(shí)別方案設(shè)計(jì)
2.3.2 FG_UGC的實(shí)體識(shí)別具體過(guò)程
2.4 本章小結(jié)
3 用戶生成內(nèi)容的過(guò)濾
3.1 用戶生成內(nèi)容過(guò)濾原則
3.2 用戶生成內(nèi)容過(guò)濾模型
3.3 地名實(shí)體的識(shí)別
3.3.1 地理數(shù)據(jù)庫(kù)
3.3.2 地名實(shí)體的識(shí)別
3.4 位置相關(guān)實(shí)體的識(shí)別
3.4.1 TFIDF簡(jiǎn)介
3.4.2 實(shí)體的位置相關(guān)性函數(shù)
3.4.3 基于實(shí)體的位置相關(guān)性函數(shù)過(guò)濾
3.5 本章小結(jié)
4 用戶生成內(nèi)容的位置推測(cè)
4.1 位置推測(cè)理論
4.2 實(shí)體-位置模型
4.2.1 實(shí)體-位置模型框架
4.2.2 實(shí)體-位置模型的建立
4.3 用戶生成內(nèi)容的位置推測(cè)
4.3.1 待推測(cè)UGC的實(shí)體加權(quán)
4.3.2 UGC的候選位置的排序
4.4 本章小結(jié)
5 實(shí)驗(yàn)結(jié)果與分析
5.1 實(shí)驗(yàn)數(shù)據(jù)的采集
5.2 實(shí)驗(yàn)說(shuō)明
5.3 實(shí)驗(yàn)分析
5.3.1 PoI的 tip數(shù)目的影響
5.3.2 過(guò)濾參數(shù)?的影響
5.3.3 參數(shù)topn的影響
5.3.4 與現(xiàn)有方法的比較
5.3.5 松弛條件下的準(zhǔn)確率
5.4 本章小結(jié)
6 總結(jié)與展望
6.1 總結(jié)
6.2 展望
致謝
參考文獻(xiàn)
附錄
【參考文獻(xiàn)】:
期刊論文
[1]基于改進(jìn)的TF-IDF算法及共現(xiàn)詞的主題詞抽取算法[J]. 公冶小燕,林培光,任威隆,張晨,張春云. 南京大學(xué)學(xué)報(bào)(自然科學(xué)). 2017(06)
[2]基于短文本情感分析的敏感信息識(shí)別[J]. 李揚(yáng),潘泉,楊濤. 西安交通大學(xué)學(xué)報(bào). 2016(09)
[3]基于語(yǔ)料庫(kù)的英語(yǔ)文章語(yǔ)法錯(cuò)誤檢查及糾正方法[J]. 譚詠梅,王曉輝,楊一梟. 北京郵電大學(xué)學(xué)報(bào). 2016(04)
[4]基于遷移的微博分詞和文本規(guī)范化聯(lián)合模型[J]. 錢濤,姬東鴻,戴文華. 華南理工大學(xué)學(xué)報(bào)(自然科學(xué)版). 2015(11)
[5]一種大數(shù)據(jù)環(huán)境下的在線社交媒體位置推斷方法[J]. 王凱,余偉,楊莎,吳敏,胡亞慧,李石君. 軟件學(xué)報(bào). 2015(11)
[6]相關(guān)實(shí)體發(fā)現(xiàn)中基于Wikipedia的實(shí)體排序[J]. 張俊三,瞿有利,稅儀冬,田盛豐. 計(jì)算機(jī)研究與發(fā)展. 2014(06)
[7]基于改進(jìn)Trie樹(shù)結(jié)構(gòu)的正向最大匹配算法[J]. 熊志斌,朱劍鋒. 計(jì)算機(jī)應(yīng)用與軟件. 2014(05)
[8]知識(shí)共享許可協(xié)議的兼容性研究[J]. 傅蓉. 圖書情報(bào)工作. 2013(21)
[9]基于后綴樹(shù)的帶有通配符的模式匹配研究[J]. 侯寶劍,謝飛,胡學(xué)鋼,劉應(yīng)玲,王海平. 計(jì)算機(jī)科學(xué). 2012(12)
[10]空間數(shù)據(jù)上Top-k關(guān)鍵詞模糊查詢算法[J]. 胡駿,范舉,李國(guó)良,陳姍姍. 計(jì)算機(jī)學(xué)報(bào). 2012(11)
博士論文
[1]社會(huì)化電子商務(wù)用戶信息采納過(guò)程及影響因素研究[D]. 耿榮娜.吉林大學(xué) 2017
[2]實(shí)體搜索與實(shí)體解析方法研究[D]. 姜麗麗.蘭州大學(xué) 2012
碩士論文
[1]移動(dòng)社交網(wǎng)絡(luò)中的位置預(yù)測(cè)方法研究[D]. 吳琪.重慶郵電大學(xué) 2016
[2]支持多語(yǔ)義層次的短文本特征提取及其分類技術(shù)[D]. 賈霞光.東北大學(xué) 2014
[3]基于位置社交網(wǎng)絡(luò)的個(gè)性化地點(diǎn)推薦算法研究[D]. 王靜金.廈門大學(xué) 2014
本文編號(hào):3732735
【文章頁(yè)數(shù)】:63 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
1 緒論
1.1 研究背景及意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀分析
1.2.1 國(guó)外研究現(xiàn)狀
1.2.2 國(guó)內(nèi)研究現(xiàn)狀
1.3 本文研究?jī)?nèi)容
1.4 論文結(jié)構(gòu)安排
2 用戶生成內(nèi)容的實(shí)體識(shí)別
2.1 實(shí)體識(shí)別背景知識(shí)
2.1.1 Probase介紹
2.1.2 自然語(yǔ)言處理技術(shù)
2.2 實(shí)體識(shí)別現(xiàn)有方法研究
2.2.1 基于Probase的實(shí)體識(shí)別
2.2.2 基于自然語(yǔ)言處理的實(shí)體識(shí)別
2.3 FG_UGC的用戶生成內(nèi)容實(shí)體識(shí)別
2.3.1 FG_UGC的實(shí)體識(shí)別方案設(shè)計(jì)
2.3.2 FG_UGC的實(shí)體識(shí)別具體過(guò)程
2.4 本章小結(jié)
3 用戶生成內(nèi)容的過(guò)濾
3.1 用戶生成內(nèi)容過(guò)濾原則
3.2 用戶生成內(nèi)容過(guò)濾模型
3.3 地名實(shí)體的識(shí)別
3.3.1 地理數(shù)據(jù)庫(kù)
3.3.2 地名實(shí)體的識(shí)別
3.4 位置相關(guān)實(shí)體的識(shí)別
3.4.1 TFIDF簡(jiǎn)介
3.4.2 實(shí)體的位置相關(guān)性函數(shù)
3.4.3 基于實(shí)體的位置相關(guān)性函數(shù)過(guò)濾
3.5 本章小結(jié)
4 用戶生成內(nèi)容的位置推測(cè)
4.1 位置推測(cè)理論
4.2 實(shí)體-位置模型
4.2.1 實(shí)體-位置模型框架
4.2.2 實(shí)體-位置模型的建立
4.3 用戶生成內(nèi)容的位置推測(cè)
4.3.1 待推測(cè)UGC的實(shí)體加權(quán)
4.3.2 UGC的候選位置的排序
4.4 本章小結(jié)
5 實(shí)驗(yàn)結(jié)果與分析
5.1 實(shí)驗(yàn)數(shù)據(jù)的采集
5.2 實(shí)驗(yàn)說(shuō)明
5.3 實(shí)驗(yàn)分析
5.3.1 PoI的 tip數(shù)目的影響
5.3.2 過(guò)濾參數(shù)?的影響
5.3.3 參數(shù)topn的影響
5.3.4 與現(xiàn)有方法的比較
5.3.5 松弛條件下的準(zhǔn)確率
5.4 本章小結(jié)
6 總結(jié)與展望
6.1 總結(jié)
6.2 展望
致謝
參考文獻(xiàn)
附錄
【參考文獻(xiàn)】:
期刊論文
[1]基于改進(jìn)的TF-IDF算法及共現(xiàn)詞的主題詞抽取算法[J]. 公冶小燕,林培光,任威隆,張晨,張春云. 南京大學(xué)學(xué)報(bào)(自然科學(xué)). 2017(06)
[2]基于短文本情感分析的敏感信息識(shí)別[J]. 李揚(yáng),潘泉,楊濤. 西安交通大學(xué)學(xué)報(bào). 2016(09)
[3]基于語(yǔ)料庫(kù)的英語(yǔ)文章語(yǔ)法錯(cuò)誤檢查及糾正方法[J]. 譚詠梅,王曉輝,楊一梟. 北京郵電大學(xué)學(xué)報(bào). 2016(04)
[4]基于遷移的微博分詞和文本規(guī)范化聯(lián)合模型[J]. 錢濤,姬東鴻,戴文華. 華南理工大學(xué)學(xué)報(bào)(自然科學(xué)版). 2015(11)
[5]一種大數(shù)據(jù)環(huán)境下的在線社交媒體位置推斷方法[J]. 王凱,余偉,楊莎,吳敏,胡亞慧,李石君. 軟件學(xué)報(bào). 2015(11)
[6]相關(guān)實(shí)體發(fā)現(xiàn)中基于Wikipedia的實(shí)體排序[J]. 張俊三,瞿有利,稅儀冬,田盛豐. 計(jì)算機(jī)研究與發(fā)展. 2014(06)
[7]基于改進(jìn)Trie樹(shù)結(jié)構(gòu)的正向最大匹配算法[J]. 熊志斌,朱劍鋒. 計(jì)算機(jī)應(yīng)用與軟件. 2014(05)
[8]知識(shí)共享許可協(xié)議的兼容性研究[J]. 傅蓉. 圖書情報(bào)工作. 2013(21)
[9]基于后綴樹(shù)的帶有通配符的模式匹配研究[J]. 侯寶劍,謝飛,胡學(xué)鋼,劉應(yīng)玲,王海平. 計(jì)算機(jī)科學(xué). 2012(12)
[10]空間數(shù)據(jù)上Top-k關(guān)鍵詞模糊查詢算法[J]. 胡駿,范舉,李國(guó)良,陳姍姍. 計(jì)算機(jī)學(xué)報(bào). 2012(11)
博士論文
[1]社會(huì)化電子商務(wù)用戶信息采納過(guò)程及影響因素研究[D]. 耿榮娜.吉林大學(xué) 2017
[2]實(shí)體搜索與實(shí)體解析方法研究[D]. 姜麗麗.蘭州大學(xué) 2012
碩士論文
[1]移動(dòng)社交網(wǎng)絡(luò)中的位置預(yù)測(cè)方法研究[D]. 吳琪.重慶郵電大學(xué) 2016
[2]支持多語(yǔ)義層次的短文本特征提取及其分類技術(shù)[D]. 賈霞光.東北大學(xué) 2014
[3]基于位置社交網(wǎng)絡(luò)的個(gè)性化地點(diǎn)推薦算法研究[D]. 王靜金.廈門大學(xué) 2014
本文編號(hào):3732735
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3732735.html
最近更新
教材專著