基于文本相似度算法的京津冀特色旅游線路開發(fā)
發(fā)布時間:2020-12-07 05:42
隨著經(jīng)濟的發(fā)展和技術(shù)的進步,人們的休閑時間與時俱增,恩格爾系數(shù)與時俱減,人們可支配收入大幅度增加,生活水平提高了,對旅游的需求也越來越大。旅游已經(jīng)成為現(xiàn)代人生活中重要的部分,并且旅游者已不滿足傳統(tǒng)的旅游產(chǎn)品,越來越傾向于選擇個性化的,具有鮮明特色的休閑度假旅游產(chǎn)品。旅游收入在國內(nèi)生產(chǎn)總值中的占比越來越大,加快旅游業(yè)發(fā)展成為推動我國經(jīng)濟發(fā)展的重要方式之一。中國旅游業(yè)發(fā)展已進入爆發(fā)式增長期,大眾旅游時代即將全面來臨。京津旅游資源豐富,河北省旅游景點眾多,但景點分布分散,開發(fā)程度有待提高的問題明顯。隨著京津冀一體化格局的不斷演變,整合京津冀旅游資源,開發(fā)具有區(qū)域特色和發(fā)展?jié)摿Φ穆糜尉路,延伸京津游客的旅游線路長度;引進京津的旅游接待能力、管理經(jīng)驗和雄厚的資金實力,必將有利于調(diào)整京津冀區(qū)域旅游集散結(jié)構(gòu),加速河北旅游業(yè)的開發(fā),促進京津冀旅游一體化發(fā)展,形成三地共享的特色旅游品牌。運用全新的旅游線路開發(fā)思路,將文本相似度算法應(yīng)用到旅游線路開發(fā)中,通過描述景點的文本信息,分析得出景點的特征,將具有相同特征的景點歸為一類,結(jié)合地理位置的特征將同類型的景點設(shè)計在一條線路中形成特色旅游線路。線路開發(fā)具有可...
【文章來源】:河北經(jīng)貿(mào)大學河北省
【文章頁數(shù)】:48 頁
【學位級別】:碩士
【部分圖文】:
文本處理過程
2 文本處理文本通常是具有完整、系統(tǒng)含義的一個句子或多個句子,屬于自然語言,是非結(jié)構(gòu)化的信息。若要計算文本間的相似度,需要把這些非結(jié)構(gòu)化的信息即文本,轉(zhuǎn)化成計算機能夠識別和計算的數(shù)字化的表示形式,這樣才能計算出文本間的相似度。計算文本相似度前期需要完成的過程主要包括分詞,去停用詞、提取特征項、計算特征項權(quán)重,度量相似度等。2.1 文本預處理文本預處理過程包括分詞和去停用詞。本文將要分析的內(nèi)容為從百度百科下載下來的共 90 個景點的文本信息,一個景點的信息為一個文本。下面以北京故宮博物院為例,介紹論文的實現(xiàn)過程,其文本內(nèi)容如下圖所示。
去掉這些分詞并不影響文本的主要內(nèi)容,遂也要將他們?nèi)サ。本文將整理得到?1200 余個常見停用詞組成停用詞詞典,去掉文中出現(xiàn)在停用詞詞典中的詞。經(jīng)過分詞、去掉停用詞之后的故宮博物院文本如下圖所示。經(jīng)過文本預處理之后,故宮博物院文本中就是一個一個獨立的可以代表實際意義的詞語,例如:明朝、清朝、兩代、皇宮。
【參考文獻】:
期刊論文
[1]張家口文化旅游資源開發(fā)利用之探究[J]. 田曉菁,牛志忠. 旅游縱覽(下半月). 2016(01)
[2]基于京津冀客源市場的保定旅游商品開發(fā)對比研究[J]. 胡葉星寒,劉志平. 保定學院學報. 2014(05)
[3]“旅游興市”戰(zhàn)略背景下秦皇島市旅游經(jīng)濟發(fā)展研究[J]. 華艷. 商場現(xiàn)代化. 2014(19)
[4]面向用戶生成內(nèi)容的短文本聚類算法研究[J]. 趙輝,劉懷亮. 現(xiàn)代圖書情報技術(shù). 2013(09)
[5]京津冀地區(qū)的旅游聯(lián)動發(fā)展:模式、對象與路徑[J]. 寧澤群,李享,吳泰岳,汪金輝. 北京聯(lián)合大學學報(人文社會科學版). 2013(01)
[6]京津冀旅游協(xié)作共生共贏研究[J]. 孫振杰,董國英,李秀娥. 合作經(jīng)濟與科技. 2012(19)
[7]京津冀區(qū)域旅游經(jīng)濟空間結(jié)構(gòu)研究[J]. 尚雪梅. 河北大學學報(哲學社會科學版). 2012(03)
[8]開啟京津冀區(qū)域經(jīng)濟一體化新篇章——2011年首都圈發(fā)展高層論壇綜述[J]. 吳慶玲,齊子翔. 首都經(jīng)濟貿(mào)易大學學報. 2012(03)
[9]文本聚類中文本表示和相似度計算研究綜述[J]. 吳夙慧,成穎,鄭彥寧,潘云濤. 情報科學. 2012(04)
[10]淺析河北省旅游資源保護與開發(fā)[J]. 張旭. 科技創(chuàng)新導報. 2011(26)
碩士論文
[1]河北灤州古城文化旅游開發(fā)研究[D]. 龐勵.廣西師范大學 2016
[2]基于向量空間模型的文本相似度算法研究[D]. 譚靜.西南石油大學 2015
[3]京津冀協(xié)同發(fā)展下的保定市旅游產(chǎn)品體系的優(yōu)化[D]. 張森森.河北大學 2015
[4]基于語義領(lǐng)域向量空間模型的文本相似度計算[D]. 唐果.云南大學 2013
[5]旅行社旅游線路節(jié)點設(shè)計分析[D]. 劉倩.西北大學 2006
[6]旅游線路設(shè)計研究[D]. 龔軍姣.湖南師范大學 2005
[7]旅游線路優(yōu)化中的運籌學問題[D]. 吳凱.東北財經(jīng)大學 2003
本文編號:2902735
【文章來源】:河北經(jīng)貿(mào)大學河北省
【文章頁數(shù)】:48 頁
【學位級別】:碩士
【部分圖文】:
文本處理過程
2 文本處理文本通常是具有完整、系統(tǒng)含義的一個句子或多個句子,屬于自然語言,是非結(jié)構(gòu)化的信息。若要計算文本間的相似度,需要把這些非結(jié)構(gòu)化的信息即文本,轉(zhuǎn)化成計算機能夠識別和計算的數(shù)字化的表示形式,這樣才能計算出文本間的相似度。計算文本相似度前期需要完成的過程主要包括分詞,去停用詞、提取特征項、計算特征項權(quán)重,度量相似度等。2.1 文本預處理文本預處理過程包括分詞和去停用詞。本文將要分析的內(nèi)容為從百度百科下載下來的共 90 個景點的文本信息,一個景點的信息為一個文本。下面以北京故宮博物院為例,介紹論文的實現(xiàn)過程,其文本內(nèi)容如下圖所示。
去掉這些分詞并不影響文本的主要內(nèi)容,遂也要將他們?nèi)サ。本文將整理得到?1200 余個常見停用詞組成停用詞詞典,去掉文中出現(xiàn)在停用詞詞典中的詞。經(jīng)過分詞、去掉停用詞之后的故宮博物院文本如下圖所示。經(jīng)過文本預處理之后,故宮博物院文本中就是一個一個獨立的可以代表實際意義的詞語,例如:明朝、清朝、兩代、皇宮。
【參考文獻】:
期刊論文
[1]張家口文化旅游資源開發(fā)利用之探究[J]. 田曉菁,牛志忠. 旅游縱覽(下半月). 2016(01)
[2]基于京津冀客源市場的保定旅游商品開發(fā)對比研究[J]. 胡葉星寒,劉志平. 保定學院學報. 2014(05)
[3]“旅游興市”戰(zhàn)略背景下秦皇島市旅游經(jīng)濟發(fā)展研究[J]. 華艷. 商場現(xiàn)代化. 2014(19)
[4]面向用戶生成內(nèi)容的短文本聚類算法研究[J]. 趙輝,劉懷亮. 現(xiàn)代圖書情報技術(shù). 2013(09)
[5]京津冀地區(qū)的旅游聯(lián)動發(fā)展:模式、對象與路徑[J]. 寧澤群,李享,吳泰岳,汪金輝. 北京聯(lián)合大學學報(人文社會科學版). 2013(01)
[6]京津冀旅游協(xié)作共生共贏研究[J]. 孫振杰,董國英,李秀娥. 合作經(jīng)濟與科技. 2012(19)
[7]京津冀區(qū)域旅游經(jīng)濟空間結(jié)構(gòu)研究[J]. 尚雪梅. 河北大學學報(哲學社會科學版). 2012(03)
[8]開啟京津冀區(qū)域經(jīng)濟一體化新篇章——2011年首都圈發(fā)展高層論壇綜述[J]. 吳慶玲,齊子翔. 首都經(jīng)濟貿(mào)易大學學報. 2012(03)
[9]文本聚類中文本表示和相似度計算研究綜述[J]. 吳夙慧,成穎,鄭彥寧,潘云濤. 情報科學. 2012(04)
[10]淺析河北省旅游資源保護與開發(fā)[J]. 張旭. 科技創(chuàng)新導報. 2011(26)
碩士論文
[1]河北灤州古城文化旅游開發(fā)研究[D]. 龐勵.廣西師范大學 2016
[2]基于向量空間模型的文本相似度算法研究[D]. 譚靜.西南石油大學 2015
[3]京津冀協(xié)同發(fā)展下的保定市旅游產(chǎn)品體系的優(yōu)化[D]. 張森森.河北大學 2015
[4]基于語義領(lǐng)域向量空間模型的文本相似度計算[D]. 唐果.云南大學 2013
[5]旅行社旅游線路節(jié)點設(shè)計分析[D]. 劉倩.西北大學 2006
[6]旅游線路設(shè)計研究[D]. 龔軍姣.湖南師范大學 2005
[7]旅游線路優(yōu)化中的運籌學問題[D]. 吳凱.東北財經(jīng)大學 2003
本文編號:2902735
本文鏈接:http://sikaile.net/guanlilunwen/lvyoujiudianguanlilunwen/2902735.html
最近更新
教材專著