大量網(wǎng)絡游記文本中熱度地名提取方法與實證研究
本文關鍵詞:大量網(wǎng)絡游記文本中熱度地名提取方法與實證研究,由筆耕文化傳播整理發(fā)布。
【摘要】:探討網(wǎng)絡游記文本中的地名使用特征及其研究意義,地名使用狀態(tài)的定量特征能夠反映游客對旅游地景觀的認知結構與旅游行為的一般過程。在現(xiàn)有中文分詞技術基礎上,結合游記文本中的地名使用特點,選用ATF*PDF方法計算特征詞匯在整個旅游文本集中使用狀態(tài)的綜合權重,設計了一種基于大量網(wǎng)絡游記文本的熱度地名自動提取方法,為不使用自定義地名庫的旅游地理研究奠定了基礎。以游客點評網(wǎng)游記為樣本的實驗證明,該方法能夠?qū)崿F(xiàn)旅游相關地名的快速提取,地名使用熱度越高,提取準確率越高;對地名提取結果的類型結構分析發(fā)現(xiàn)了自然和人文旅游地游記在詞匯使用方面的共性和差異,指示了旅游文本地名的分布意義及其對旅行過程其他信息解讀的潛在價值,預示了網(wǎng)絡游記文本在進一步解析旅游者的旅游地認知特征和旅游行為過程方面的科學意義。
【作者單位】: 河北師范大學資源與環(huán)境科學學院;河北省科學院地理科學研究所;河北省環(huán)境演變與生態(tài)建設實驗室;
【關鍵詞】: 網(wǎng)絡游記文本 熱度地名 ATF*PDF模型 多樣本集合共現(xiàn)
【基金】:國家自然科學基金項目(41101105、41171105) 河北省軟科學研究計劃項目(13406002D) 河北省高校重點學科建設項目
【分類號】:F592;F224
【正文快照】: 0引言網(wǎng)絡游記是旅游者基于自身旅游體驗主動發(fā)表在互聯(lián)網(wǎng)中主要描述旅行過程和感受的文本,其相比問卷調(diào)查和訪談更能夠代表游客的真實態(tài)度[1],可以作為旅游地研究的重要數(shù)據(jù)來源[2]。目前,國內(nèi)外以互聯(lián)網(wǎng)游記文本為數(shù)據(jù)源的旅游地研究越來越多,主要關注旅游者行為及其對旅游
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 劉瑜;張毅;田原;薛露露;;廣義地名及其本體研究[J];地理與地理信息科學;2007年06期
2 張雪英;張春菊;閭國年;;地理命名實體分類體系的設計與應用分析[J];地球信息科學學報;2010年02期
3 張春菊;張雪英;朱少楠;徐希濤;;基于網(wǎng)絡爬蟲的地名數(shù)據(jù)庫維護方法[J];地球信息科學學報;2011年04期
4 王佳果;王堯;;基于NVivo軟件的互聯(lián)網(wǎng)旅游文本的質(zhì)性研究——以貴州黔東南肇興的旅游者文本為例[J];旅游論壇;2009年01期
5 唐順英;周尚意;;文本在游客地方感建構中的作用研究——基于曲阜游記的分析[J];地理與地理信息科學;2013年02期
6 劉群,張華平,俞鴻魁,程學旗;基于層疊隱馬模型的漢語詞法分析[J];計算機研究與發(fā)展;2004年08期
7 胡志敏;;基于綜合權重的多文檔關鍵詞抽取算法[J];計算機與數(shù)字工程;2010年06期
8 苗學玲;保繼剛;;“眾樂樂”:旅游虛擬社區(qū)“結伴旅行”之質(zhì)性研究[J];旅游學刊;2007年08期
9 肖亮;趙黎明;;互聯(lián)網(wǎng)傳播的臺灣旅游目的地形象——基于兩岸相關網(wǎng)站的內(nèi)容分析[J];旅游學刊;2009年03期
10 黃德根,岳廣玲,楊元生;基于統(tǒng)計的中文地名識別[J];中文信息學報;2003年02期
【共引文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 于江德;王希杰;;詞位標注漢語分詞技術詳解[J];安陽師范學院學報;2010年05期
2 楊爾弘;;媒體5年詞語使用情況調(diào)查分析[J];北華大學學報(社會科學版);2011年04期
3 付艷;楊冬青;唐世渭;伍偉;王騰蛟;高軍;;基于實體識別的在線主題檢測方法[J];北京大學學報(自然科學版);2009年02期
4 馬志強;周長勝;丁維;楊娜;;校園網(wǎng)搜索引擎的研究與實現(xiàn)[J];北京機械工業(yè)學院學報;2007年01期
5 劉文華;康海燕;;領域問答系統(tǒng)生成器的研究[J];北京信息科技大學學報(自然科學版);2009年03期
6 李玉森;張雪英;袁正午;;面向GIS的地理命名實體識別研究[J];重慶郵電大學學報(自然科學版);2008年06期
7 傅鸝;孫堅;付春雷;;基于語義的音樂檢索系統(tǒng)[J];重慶理工大學學報(自然科學版);2011年01期
8 張雪英;朱少楠;徐希濤;;基于Neogeography的中文地名詞典維護和服務機制[J];測繪通報;2012年01期
9 張雪英;朱少楠;張春菊;;中文文本的地理命名實體標注[J];測繪學報;2012年01期
10 高東平;;基于類型論的漢語分詞系統(tǒng)TTCS[J];重慶理工大學學報(社會科學);2011年08期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 李金;宋陽;梁洪;;語言殘障患者醫(yī)療輔助系統(tǒng)設計[A];第九屆全國信息獲取與處理學術會議論文集Ⅱ[C];2011年
2 于江德;王希杰;樊孝忠;;漢語詞法分析中上文和下文孰重孰輕[A];中國計算語言學研究前沿進展(2009-2011)[C];2011年
3 韓冬煦;常寶寶;;基于邊界熵和卡方統(tǒng)計量的多領域適應性中文分詞方法[A];中國計算語言學研究前沿進展(2009-2011)[C];2011年
4 修馳;宋柔;;基于“大詞”實例的中文分詞研究[A];中國計算語言學研究前沿進展(2009-2011)[C];2011年
5 余驍捷;邵陽;吳及;王俠;;基于SVM和MMR融和的自動文摘方法[A];第十一屆全國人機語音通訊學術會議論文集(一)[C];2011年
6 董俊林;聶偉;楊君英;張春爐;;命名實體識別與提取分析[A];邏輯學及其應用研究——第四屆全國邏輯系統(tǒng)、智能科學與信息科學學術會議論文集[C];2008年
7 李玉梅;靳光瑾;黃昌寧;;中文分詞規(guī)范中的歧義字段消解細則[A];第五屆全國語言文字應用學術研討會論文集[C];2007年
8 俞鴻魁;張華平;劉群;呂學強;施水才;;基于層疊隱馬爾可夫模型的中文命名實體識別[A];全國網(wǎng)絡與信息安全技術研討會'2005論文集(下冊)[C];2005年
9 喬春庚;肖詩斌;孫麗華;施水才;;規(guī)則與統(tǒng)計相結合的案件名稱識別[A];第三屆學生計算語言學研討會論文集[C];2006年
10 張sソ,
本文編號:416091
本文鏈接:http://sikaile.net/jingjilunwen/jingjiguanlilunwen/416091.html