天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

內(nèi)蒙古自治區(qū)旅游領(lǐng)域知識(shí)庫(kù)構(gòu)建及應(yīng)用研究

發(fā)布時(shí)間:2021-01-04 02:53
  互聯(lián)網(wǎng)技術(shù)不斷推陳出新,信息同時(shí)也在成指數(shù)級(jí)爆炸增長(zhǎng),搜索引擎逐漸代替?zhèn)鹘y(tǒng)書(shū)本,成為人們快速獲取知識(shí)的重要來(lái)源。對(duì)海量的互聯(lián)網(wǎng)數(shù)據(jù)進(jìn)行規(guī)范化,并挖掘利用其有效的信息,是人工智能領(lǐng)域發(fā)展的重要研究課題。自2012年谷歌提出了知識(shí)圖譜的概念,并成功應(yīng)用在搜索引擎中,知識(shí)圖譜即知識(shí)庫(kù)成為一項(xiàng)建立并規(guī)范一定規(guī)模知識(shí)資源的技術(shù)。之后,業(yè)界將關(guān)注焦點(diǎn)聚集在如何研究構(gòu)建具體領(lǐng)域的垂直知識(shí)圖譜,其中,進(jìn)展較快的項(xiàng)目多為金融領(lǐng)域,旅游領(lǐng)域涉及較少,而學(xué)術(shù)界和工業(yè)界也沒(méi)有公開(kāi)的內(nèi)蒙古旅游領(lǐng)域知識(shí)圖譜的成果。本文旨在整合內(nèi)蒙古自治區(qū)旅游領(lǐng)域的景點(diǎn)信息,建立多源數(shù)據(jù)的領(lǐng)域本體知識(shí)庫(kù)。首先,設(shè)計(jì)爬蟲(chóng)類(lèi)工具,從百科類(lèi)和旅游類(lèi)網(wǎng)站獲取關(guān)于內(nèi)蒙古自治區(qū)A級(jí)景點(diǎn)的信息。經(jīng)過(guò)知識(shí)清洗等預(yù)處理工作后,形成<實(shí)體,屬性,屬性值>和<實(shí)體1,關(guān)系,實(shí)體2>形式的三元組知識(shí)。其次,將獲取的三元組通過(guò)Protégé本體編輯工具,自頂向下地規(guī)范模式層的概念,降低與數(shù)據(jù)層對(duì)接的成本。最后,使用圖數(shù)據(jù)庫(kù)Neo4j,存儲(chǔ)模式層的本體和數(shù)據(jù)層的三元組知識(shí),完成知識(shí)庫(kù)的構(gòu)建。現(xiàn)有搜索引擎對(duì)于用戶的提問(wèn),返回的結(jié)果多為基... 

【文章來(lái)源】:內(nèi)蒙古大學(xué)內(nèi)蒙古自治區(qū) 211工程院校

【文章頁(yè)數(shù)】:57 頁(yè)

【學(xué)位級(jí)別】:碩士

【部分圖文】:

內(nèi)蒙古自治區(qū)旅游領(lǐng)域知識(shí)庫(kù)構(gòu)建及應(yīng)用研究


數(shù)據(jù)獲取流程

流程圖,流程,引擎,組件


圖 3.2 通用爬蟲(chóng)流程Figure 3.2 the basic work of SpiderScrapy,是一種高效的 Python 爬蟲(chóng)框架,使用事件驅(qū)動(dòng)網(wǎng)絡(luò)引擎框架 Twisted 作基礎(chǔ)框架,實(shí)現(xiàn)了快速、高層次的 Web 數(shù)據(jù)爬取。Scrapy 的用途廣泛,除了作為通用網(wǎng)絡(luò)爬蟲(chóng)工具,還可以獲取 API 所返回的數(shù)據(jù),也用于數(shù)據(jù)挖掘、檢測(cè)和自動(dòng)化測(cè)試[59]。Scrapy 框架包含較多組件,引擎、爬蟲(chóng)、調(diào)度器、下載器、管道項(xiàng)目和中間件,對(duì)應(yīng)框架中名稱(chēng) Scrapy Engine、Spider、Scheduler、Downloader 和 Item Pipeline,中間件包括 Spider Middlewares 和 Downloader Middlewares。這些組件協(xié)同高效地完成爬蟲(chóng)工作。整個(gè)框架的核心 Engine,控制數(shù)據(jù)流在各組件間流轉(zhuǎn),處理了大部分的操作;Scheduler 則接受引擎發(fā)送的 Request 對(duì)象,并按照一定方式進(jìn)行整理后加入隊(duì)列,在引擎需要時(shí)傳回請(qǐng)求對(duì)象;Downloader 負(fù)責(zé)下載引擎發(fā)送

行政區(qū)劃,示例,景點(diǎn)


景點(diǎn)實(shí)體和城市實(shí)體兩類(lèi)名稱(chēng),一般情況不易變更,并且是景點(diǎn)知識(shí)庫(kù)的重要組成部分。因此本文主要獲取景點(diǎn)名稱(chēng)和城市名稱(chēng)這兩種實(shí)體,形成結(jié)構(gòu)化詞條,便于屬性的爬取?紤]到一個(gè)命名實(shí)體的指稱(chēng)項(xiàng)可能對(duì)應(yīng)多個(gè)實(shí)體概念,因此需要盡可能獲得多的不同叫法實(shí)體名稱(chēng)。景點(diǎn)實(shí)體的來(lái)源分為兩部分,一份為官方旅游發(fā)展委員會(huì)公開(kāi)的 A 級(jí)旅游景區(qū)名單[62],共 362 個(gè) A 級(jí)景點(diǎn):包含景點(diǎn)名稱(chēng)、景點(diǎn)等級(jí)和評(píng)級(jí)時(shí)間,一份是已收集到的內(nèi)蒙古自治區(qū)景點(diǎn)名,共 1006 個(gè)景點(diǎn)。憲法第三十條規(guī)定了的三級(jí)行政區(qū)域劃分[63],地名實(shí)體按此標(biāo)準(zhǔn)分為,第一級(jí):全國(guó)為最大行政區(qū)劃,下分為省、自治區(qū)或直轄市;第二級(jí):省、自治區(qū)下轄市、縣、自治縣、自治州;第三級(jí):直轄市和較大的市區(qū)下轄區(qū)、縣,自治州分為縣、自治縣、市,縣、自治縣分為鄉(xiāng)、民族鄉(xiāng)、鎮(zhèn)。通過(guò)行政區(qū)劃網(wǎng)[64],獲取到內(nèi)蒙古自治區(qū)獲取各個(gè)級(jí)別的名稱(chēng)和行政區(qū)劃代碼,共 12 個(gè)二級(jí)及103 個(gè)三級(jí)區(qū)劃單位的地名,得到地名實(shí)體。如圖 3.3 為內(nèi)蒙古自治區(qū)的三級(jí)行政區(qū)劃。

【參考文獻(xiàn)】:
期刊論文
[1]基于OWL+SKOS的期刊本體構(gòu)建與應(yīng)用[J]. 羅婷婷,李嬌,鮮國(guó)建,趙瑞雪,寇遠(yuǎn)濤.  數(shù)字圖書(shū)館論壇. 2018(12)
[2]Scrapy分布式爬蟲(chóng)搜索引擎[J]. 劉思林.  電腦知識(shí)與技術(shù). 2018(34)
[3]融合知識(shí)表示的知識(shí)庫(kù)問(wèn)答系統(tǒng)[J]. 安波,韓先培,孫樂(lè).  中國(guó)科學(xué):信息科學(xué). 2018(11)
[4]中文實(shí)體關(guān)系抽取研究綜述[J]. 武文雅,陳鈺楓,徐金安,張玉潔.  計(jì)算機(jī)與現(xiàn)代化. 2018(08)
[5]命名實(shí)體識(shí)別研究綜述[J]. 劉瀏,王東波.  情報(bào)學(xué)報(bào). 2018(03)
[6]特定領(lǐng)域概念屬性關(guān)系抽取方法研究[J]. 王旭陽(yáng),姜喜秋.  吉林大學(xué)學(xué)報(bào)(信息科學(xué)版). 2017(04)
[7]基于Scrapy的深層網(wǎng)絡(luò)爬蟲(chóng)研究[J]. 劉宇,鄭成煥.  軟件. 2017(07)
[8]垂直知識(shí)圖譜的構(gòu)建與應(yīng)用研究[J]. 阮彤,王夢(mèng)婕,王昊奮,胡芳槐.  知識(shí)管理論壇. 2016(03)
[9]本體研究綜述[J]. 王向前,張寶隆,李慧宗.  情報(bào)雜志. 2016(06)
[10]知識(shí)庫(kù)實(shí)體對(duì)齊技術(shù)綜述[J]. 莊嚴(yán),李國(guó)良,馮建華.  計(jì)算機(jī)研究與發(fā)展. 2016(01)

博士論文
[1]基于領(lǐng)域本體的蒙醫(yī)藥學(xué)知識(shí)庫(kù)構(gòu)建與知識(shí)發(fā)現(xiàn)研究[D]. 鮑玉來(lái).吉林大學(xué) 2018
[2]基于本體的中國(guó)行政區(qū)劃地名識(shí)別與抽取研究[D]. 杜萍.蘭州大學(xué) 2011
[3]信息抽取中關(guān)鍵技術(shù)的研究[D]. 張素香.北京郵電大學(xué) 2007
[4]基于本體的不確定性知識(shí)管理研究[D]. 程勇.中國(guó)科學(xué)院研究生院(計(jì)算技術(shù)研究所) 2005

碩士論文
[1]基于地理本體的吉林地域知識(shí)圖譜的構(gòu)建[D]. 劉鎏.北京交通大學(xué) 2017
[2]古建筑領(lǐng)域本體的構(gòu)建及應(yīng)用研究[D]. 徐月潔.廣西師范大學(xué) 2017



本文編號(hào):2956005

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/2956005.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶02397***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com
久久天堂夜夜一本婷婷| 国产一级二级三级观看| 青青久久亚洲婷婷中文网| 有坂深雪中文字幕亚洲中文| 亚洲黄色在线观看免费高清| 大香蕉再在线大香蕉再在线| 久久经典一区二区三区| 高清亚洲精品中文字幕乱码| 欧美日韩国产午夜福利| 国产户外勾引精品露出一区| 九九热视频免费在线视频| 亚洲中文字幕一区三区| 国产精品视频第一第二区| 老熟妇2久久国内精品| 太香蕉久久国产精品视频| 亚洲国产av国产av| 日本不卡在线一区二区三区| 在线播放欧美精品一区| 亚洲中文字幕三区四区| 日本不卡在线视频你懂的| 青青操日老女人的穴穴| 日韩人妻毛片中文字幕| 91欧美日韩国产在线观看 | 国产成人精品国内自产拍| 国产又色又爽又黄又大| 初尝人妻少妇中文字幕在线| 国产成人精品一区二区三区| 大香蕉伊人一区二区三区| 午夜精品黄片在线播放| 日本久久精品在线观看| 亚洲一区二区三区三州| 精品偷拍一区二区三区| 国产视频福利一区二区| 美女极度色诱视频在线观看| 亚洲国产91精品视频| 午夜午夜精品一区二区| 欧美一区二区三区十区| 日韩黄色一级片免费收看| 国产超薄黑色肉色丝袜| 91亚洲精品综合久久| 日韩夫妻午夜性生活视频|