傳媒數(shù)據(jù)庫(kù)建設(shè)的理念、流程和規(guī)范 ——以突發(fā)事件數(shù)據(jù)庫(kù)為例
發(fā)布時(shí)間:2021-06-14 11:13
大數(shù)據(jù)技術(shù)為大數(shù)據(jù)時(shí)代傳媒行業(yè)的轉(zhuǎn)型與發(fā)展提供了新思路。建設(shè)傳媒數(shù)據(jù)庫(kù)是傳媒機(jī)構(gòu)發(fā)揮數(shù)據(jù)優(yōu)勢(shì)的有效途徑,將有利于傳媒業(yè)務(wù)的革新和傳媒產(chǎn)業(yè)鏈的拓展。突發(fā)事件數(shù)據(jù)庫(kù)作為傳媒數(shù)據(jù)庫(kù)的子數(shù)據(jù)庫(kù)之一,在傳媒實(shí)踐領(lǐng)域具有重要的作用。緒論部分闡述了傳媒亟需建設(shè)數(shù)據(jù)庫(kù)的時(shí)代背景和現(xiàn)實(shí)需要,傳媒數(shù)據(jù)庫(kù)建設(shè)的理論意義與現(xiàn)實(shí)意義,傳媒數(shù)據(jù)庫(kù)建設(shè)的研究現(xiàn)狀、突發(fā)事件數(shù)據(jù)庫(kù)建設(shè)的研究現(xiàn)狀及其它領(lǐng)域數(shù)據(jù)庫(kù)建設(shè)的研究現(xiàn)狀。第一章研究了大數(shù)據(jù)時(shí)代傳媒建設(shè)數(shù)據(jù)庫(kù)的必要性與可行性。建設(shè)傳媒數(shù)據(jù)庫(kù)將重塑大數(shù)據(jù)時(shí)代傳媒行業(yè)的核心競(jìng)爭(zhēng)力,優(yōu)化傳媒資源的整合方式,以及創(chuàng)新傳媒行業(yè)的服務(wù)方式。大數(shù)據(jù)時(shí)代,海量信息以數(shù)據(jù)的方式呈現(xiàn),大數(shù)據(jù)技術(shù)日漸成熟,傳媒從業(yè)者向大數(shù)據(jù)人才復(fù)合發(fā)展,這些均為傳媒數(shù)據(jù)庫(kù)的建設(shè)與應(yīng)用奠定了基礎(chǔ)。第二章設(shè)計(jì)了基于人機(jī)協(xié)同理念的傳媒數(shù)據(jù)庫(kù)建設(shè)流程,以突發(fā)事件數(shù)據(jù)庫(kù)為例,主要包括確立主題、數(shù)據(jù)采集、數(shù)據(jù)處理三個(gè)步驟。其中,數(shù)據(jù)采集的流程包括制定采集標(biāo)準(zhǔn)、設(shè)計(jì)采集工具、明確數(shù)據(jù)存儲(chǔ)方式;數(shù)據(jù)處理的流程包括數(shù)據(jù)清洗、數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)檢查。此外,還明確了每一個(gè)流程環(huán)節(jié)應(yīng)該遵守的科學(xué)規(guī)范。第三章研究了數(shù)據(jù)挖掘的概念與主...
【文章來(lái)源】:華中師范大學(xué)湖北省 211工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:65 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖2.2.1突發(fā)事件分級(jí)分類表??在建設(shè)突發(fā)事件數(shù)據(jù)庫(kù)時(shí),首先要明確突發(fā)事件的分級(jí)分類標(biāo)準(zhǔn),弄清要建設(shè)??的數(shù)據(jù)庫(kù)從屬于哪一級(jí)分類,進(jìn)一步細(xì)化所建數(shù)據(jù)庫(kù)的主題,為下一步數(shù)據(jù)的采集??
則有“淹沒(méi)”、“被困”、“救援”、“疏散”是網(wǎng)絡(luò)爬蟲(chóng)工具從數(shù)據(jù)源中抓取與洪澇災(zāi)害相二十篇左右關(guān)于洪澇災(zāi)害本體、影響和救援的新初步確定為:(洪漠or山洪or內(nèi)漠or降水or中斷or道路淹沒(méi)or傷亡or受傷or失蹤oror救援or?緊急轉(zhuǎn)移)。??采集的工具??據(jù)產(chǎn)生的速度超乎想象,傳統(tǒng)的數(shù)據(jù)統(tǒng)計(jì)方式保數(shù)據(jù)的信度。因此,大數(shù)據(jù)時(shí)代提高數(shù)據(jù)采集據(jù)釆集軟件。網(wǎng)絡(luò)爬蟲(chóng)技術(shù)能實(shí)現(xiàn)“樣本等于全海量的數(shù)據(jù),通過(guò)客觀數(shù)據(jù)展現(xiàn)事件。??為網(wǎng)絡(luò)蜘蛛或Web信息采集器,是通過(guò)網(wǎng)頁(yè)的鏈和個(gè)性化的Web網(wǎng)頁(yè)搜索與采集。它通常從一運(yùn)行,獲得初始網(wǎng)頁(yè)上的URL,在抓取網(wǎng)頁(yè)的URL并存入待爬行URL系列,不斷循環(huán)往復(fù),直終止條件。其工作原理如圖所示:??開(kāi)始
具有一定的難度。??件的權(quán)威且真實(shí)的本體數(shù)據(jù)難以獲取。突發(fā)事件發(fā)生后公安消防部等國(guó)家機(jī)構(gòu)參與突發(fā)事件的應(yīng)急救援管理,但因不具備突發(fā)事件數(shù)據(jù)內(nèi)容和資源的整合能力,沒(méi)有,重大突發(fā)事件發(fā)生后往往造成嚴(yán)重的社會(huì)后果,破壞件高度相關(guān)的一些細(xì)節(jié)往往具有機(jī)密性,不容易被外界自然語(yǔ)言處理的技術(shù)手段解決多種類、小樣本的文本自件的種類繁多,不同類型的突發(fā)事件文本具有不同的特得僅靠機(jī)器算法自動(dòng)采集突發(fā)事件數(shù)據(jù)難以達(dá)到令人采用聚焦爬蟲(chóng)技術(shù)抓取歷史的和即時(shí)的新聞數(shù)據(jù),它的容相關(guān)的網(wǎng)頁(yè)。我們可以依據(jù)最小數(shù)據(jù)集及關(guān)鍵詞過(guò)濾無(wú)關(guān)的鏈接,而保留相關(guān)規(guī)則的有用鏈接,并將該鏈接外,在編制程序時(shí)要將一定的搜索策略定義好,待程序URL隊(duì)列。聚焦爬蟲(chóng)軟件會(huì)重復(fù)上述流程,直至滿足程所示:??
【參考文獻(xiàn)】:
期刊論文
[1]重慶非物質(zhì)文化遺產(chǎn)數(shù)據(jù)庫(kù)建設(shè)與研究[J]. 羅敏. 重慶文理學(xué)院學(xué)報(bào)(社會(huì)科學(xué)版). 2018(04)
[2]建設(shè)“一帶一路”沿線國(guó)家語(yǔ)言文化禁忌多媒體數(shù)據(jù)庫(kù)[J]. 陳祥雨,陳美華. 外語(yǔ)研究. 2017(05)
[3]融媒體數(shù)據(jù)庫(kù)安全技術(shù)研究[J]. 吳戈,陳俊,邱揚(yáng). 新聞前哨. 2017(08)
[4]中國(guó)術(shù)語(yǔ)數(shù)據(jù)庫(kù)研究進(jìn)展與趨勢(shì)分析[J]. 閆寧,賀玢,王寶濟(jì),劉清水. 世界農(nóng)業(yè). 2016(12)
[5]蒙古語(yǔ)族多語(yǔ)種數(shù)據(jù)庫(kù)標(biāo)注規(guī)范研究[J]. 寶玉柱. 滿語(yǔ)研究. 2015(02)
[6]數(shù)據(jù)庫(kù)在全媒體新聞集團(tuán)的應(yīng)用與效益[J]. 宋宣諭. 青年記者. 2015(23)
[7]基于關(guān)系數(shù)據(jù)庫(kù)的漢字構(gòu)形分析及其應(yīng)用[J]. 趙彤. 語(yǔ)言文字應(yīng)用. 2015(03)
[8]大數(shù)據(jù)與生態(tài)史:中國(guó)災(zāi)害史料整理與數(shù)據(jù)庫(kù)建設(shè)[J]. 夏明方. 清史研究. 2015(02)
[9]大數(shù)據(jù)與新聞報(bào)道[J]. 陳力丹,李熠祺,娜佳. 新聞?dòng)浾? 2015(02)
[10]廣電網(wǎng)絡(luò)BOSS系統(tǒng)數(shù)據(jù)庫(kù)優(yōu)化技術(shù)研究[J]. 盛蕊,李想. 中國(guó)有線電視. 2014(11)
博士論文
[1]網(wǎng)絡(luò)突發(fā)事件蔓延及干預(yù)研究[D]. 葉金珠.華中科技大學(xué) 2012
碩士論文
[1]道路交通事故數(shù)據(jù)庫(kù)建設(shè)與傳媒預(yù)警研究[D]. 于清.華中師范大學(xué) 2018
[2]大數(shù)據(jù)路徑下臺(tái)風(fēng)災(zāi)害(2001-2010)的傳媒預(yù)警研究[D]. 梁鵬.華中師范大學(xué) 2014
本文編號(hào):3229713
【文章來(lái)源】:華中師范大學(xué)湖北省 211工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:65 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖2.2.1突發(fā)事件分級(jí)分類表??在建設(shè)突發(fā)事件數(shù)據(jù)庫(kù)時(shí),首先要明確突發(fā)事件的分級(jí)分類標(biāo)準(zhǔn),弄清要建設(shè)??的數(shù)據(jù)庫(kù)從屬于哪一級(jí)分類,進(jìn)一步細(xì)化所建數(shù)據(jù)庫(kù)的主題,為下一步數(shù)據(jù)的采集??
則有“淹沒(méi)”、“被困”、“救援”、“疏散”是網(wǎng)絡(luò)爬蟲(chóng)工具從數(shù)據(jù)源中抓取與洪澇災(zāi)害相二十篇左右關(guān)于洪澇災(zāi)害本體、影響和救援的新初步確定為:(洪漠or山洪or內(nèi)漠or降水or中斷or道路淹沒(méi)or傷亡or受傷or失蹤oror救援or?緊急轉(zhuǎn)移)。??采集的工具??據(jù)產(chǎn)生的速度超乎想象,傳統(tǒng)的數(shù)據(jù)統(tǒng)計(jì)方式保數(shù)據(jù)的信度。因此,大數(shù)據(jù)時(shí)代提高數(shù)據(jù)采集據(jù)釆集軟件。網(wǎng)絡(luò)爬蟲(chóng)技術(shù)能實(shí)現(xiàn)“樣本等于全海量的數(shù)據(jù),通過(guò)客觀數(shù)據(jù)展現(xiàn)事件。??為網(wǎng)絡(luò)蜘蛛或Web信息采集器,是通過(guò)網(wǎng)頁(yè)的鏈和個(gè)性化的Web網(wǎng)頁(yè)搜索與采集。它通常從一運(yùn)行,獲得初始網(wǎng)頁(yè)上的URL,在抓取網(wǎng)頁(yè)的URL并存入待爬行URL系列,不斷循環(huán)往復(fù),直終止條件。其工作原理如圖所示:??開(kāi)始
具有一定的難度。??件的權(quán)威且真實(shí)的本體數(shù)據(jù)難以獲取。突發(fā)事件發(fā)生后公安消防部等國(guó)家機(jī)構(gòu)參與突發(fā)事件的應(yīng)急救援管理,但因不具備突發(fā)事件數(shù)據(jù)內(nèi)容和資源的整合能力,沒(méi)有,重大突發(fā)事件發(fā)生后往往造成嚴(yán)重的社會(huì)后果,破壞件高度相關(guān)的一些細(xì)節(jié)往往具有機(jī)密性,不容易被外界自然語(yǔ)言處理的技術(shù)手段解決多種類、小樣本的文本自件的種類繁多,不同類型的突發(fā)事件文本具有不同的特得僅靠機(jī)器算法自動(dòng)采集突發(fā)事件數(shù)據(jù)難以達(dá)到令人采用聚焦爬蟲(chóng)技術(shù)抓取歷史的和即時(shí)的新聞數(shù)據(jù),它的容相關(guān)的網(wǎng)頁(yè)。我們可以依據(jù)最小數(shù)據(jù)集及關(guān)鍵詞過(guò)濾無(wú)關(guān)的鏈接,而保留相關(guān)規(guī)則的有用鏈接,并將該鏈接外,在編制程序時(shí)要將一定的搜索策略定義好,待程序URL隊(duì)列。聚焦爬蟲(chóng)軟件會(huì)重復(fù)上述流程,直至滿足程所示:??
【參考文獻(xiàn)】:
期刊論文
[1]重慶非物質(zhì)文化遺產(chǎn)數(shù)據(jù)庫(kù)建設(shè)與研究[J]. 羅敏. 重慶文理學(xué)院學(xué)報(bào)(社會(huì)科學(xué)版). 2018(04)
[2]建設(shè)“一帶一路”沿線國(guó)家語(yǔ)言文化禁忌多媒體數(shù)據(jù)庫(kù)[J]. 陳祥雨,陳美華. 外語(yǔ)研究. 2017(05)
[3]融媒體數(shù)據(jù)庫(kù)安全技術(shù)研究[J]. 吳戈,陳俊,邱揚(yáng). 新聞前哨. 2017(08)
[4]中國(guó)術(shù)語(yǔ)數(shù)據(jù)庫(kù)研究進(jìn)展與趨勢(shì)分析[J]. 閆寧,賀玢,王寶濟(jì),劉清水. 世界農(nóng)業(yè). 2016(12)
[5]蒙古語(yǔ)族多語(yǔ)種數(shù)據(jù)庫(kù)標(biāo)注規(guī)范研究[J]. 寶玉柱. 滿語(yǔ)研究. 2015(02)
[6]數(shù)據(jù)庫(kù)在全媒體新聞集團(tuán)的應(yīng)用與效益[J]. 宋宣諭. 青年記者. 2015(23)
[7]基于關(guān)系數(shù)據(jù)庫(kù)的漢字構(gòu)形分析及其應(yīng)用[J]. 趙彤. 語(yǔ)言文字應(yīng)用. 2015(03)
[8]大數(shù)據(jù)與生態(tài)史:中國(guó)災(zāi)害史料整理與數(shù)據(jù)庫(kù)建設(shè)[J]. 夏明方. 清史研究. 2015(02)
[9]大數(shù)據(jù)與新聞報(bào)道[J]. 陳力丹,李熠祺,娜佳. 新聞?dòng)浾? 2015(02)
[10]廣電網(wǎng)絡(luò)BOSS系統(tǒng)數(shù)據(jù)庫(kù)優(yōu)化技術(shù)研究[J]. 盛蕊,李想. 中國(guó)有線電視. 2014(11)
博士論文
[1]網(wǎng)絡(luò)突發(fā)事件蔓延及干預(yù)研究[D]. 葉金珠.華中科技大學(xué) 2012
碩士論文
[1]道路交通事故數(shù)據(jù)庫(kù)建設(shè)與傳媒預(yù)警研究[D]. 于清.華中師范大學(xué) 2018
[2]大數(shù)據(jù)路徑下臺(tái)風(fēng)災(zāi)害(2001-2010)的傳媒預(yù)警研究[D]. 梁鵬.華中師范大學(xué) 2014
本文編號(hào):3229713
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3229713.html
最近更新
教材專著