新聞線索采集分析推送系統(tǒng)的設(shè)計(jì)與開發(fā)
發(fā)布時間:2021-03-20 21:37
隨著互聯(lián)網(wǎng)技術(shù)的高速發(fā)展,電視、廣播、報(bào)紙等傳統(tǒng)媒體行業(yè)受到巨大的沖擊。電腦、手機(jī)逐漸代替了電視機(jī)、收音機(jī)、報(bào)紙、雜志。差不多十年前開始,傳統(tǒng)媒體紛紛轉(zhuǎn)型求變,從開始的“三網(wǎng)融合”,到“互聯(lián)網(wǎng)+”,再到“媒體融合”。出現(xiàn)了“統(tǒng)籌策劃、一次采集、多種生成、多元傳播、科學(xué)評價、有效應(yīng)用”的全新業(yè)務(wù)模式。更推動了內(nèi)容、平臺、渠道、數(shù)據(jù)、技術(shù)、人才、機(jī)制、管理等方面深度融合。隨著各地媒體紛紛建設(shè)自己的融媒體中心,在這個“內(nèi)容為王”的時期,開發(fā)一套媒體融合平臺便成了最重要的工作之一。而作為媒體融合平臺中最核心的數(shù)據(jù)中心更是保障著其它系統(tǒng)正常運(yùn)作。經(jīng)過研究媒體融合過程中的最迫切的需求和關(guān)鍵業(yè)務(wù),結(jié)合比較成熟的互聯(lián)網(wǎng)和自然語言處理技術(shù),設(shè)計(jì)并且實(shí)現(xiàn)了新聞線索采集分析推送系統(tǒng)。首先,本文在討論新聞線索采集分析推送系統(tǒng)的背景和開發(fā)設(shè)計(jì)上所面對的問題的基礎(chǔ)上,分析了系統(tǒng)的功能需求和非功能性需求。并且在需求分析基礎(chǔ)上,我們對系統(tǒng)進(jìn)行了技術(shù)架構(gòu)和功能架構(gòu)的設(shè)計(jì)。技術(shù)架構(gòu)主要考慮系統(tǒng)的穩(wěn)定性,可擴(kuò)展性,可維護(hù)性以及性能問題,采用了 Linux系統(tǒng)下Nginx+MySQL+PHP(LNMP)的網(wǎng)站服務(wù)器架構(gòu)[24...
【文章來源】:山東大學(xué)山東省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:88 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖2-3新聞線索采集分析推送系統(tǒng)功能模塊??2.?3.?2功能性需求??
?山東大學(xué)碩士學(xué)位論文???_?_?^^inckide??include?一??O??_?^^Jnckide??????£!S3??include??一?-一---??圖2*4采集模塊用例??(1)內(nèi)部數(shù)據(jù)整合。主要包括臺內(nèi)幾個主要平臺。新聞網(wǎng)站的新聞發(fā)布平??臺、視頻發(fā)布平臺、媒資管理平臺、新聞熱線平臺。我們需要通過api接口,直??接把數(shù)據(jù)庫數(shù)據(jù)導(dǎo)入我們系統(tǒng)的數(shù)據(jù)庫中。??(2)全網(wǎng)數(shù)據(jù)采集。新聞采編部門會提供給我們他們平時工作中素材的重??要來源。通過不同的采集方法進(jìn)行數(shù)據(jù)。其中按模式分,我們主要抓取了七類:??天氣預(yù)報(bào)、網(wǎng)站、報(bào)紙、微信、微博、論壇、APP。按技術(shù)分,我們將使用客戶??端采集工具,Python爬蟲框架,移動端模擬抓包的技術(shù)采集數(shù)據(jù)。然后采集的??數(shù)據(jù)會存入數(shù)據(jù)庫中,并且會進(jìn)行分詞,進(jìn)入搜索引擎建立全文索引。??3.?dāng)?shù)據(jù)分析模塊需求分析??數(shù)據(jù)分析用例如圖2-5所示。??11??
?山東大學(xué)碩士學(xué)位論文???jT?mmi?)??\?\w?mmmrnmi?j??N,?^??圖2-5數(shù)據(jù)分析用例??數(shù)據(jù)入庫后,在基礎(chǔ)數(shù)據(jù)結(jié)構(gòu)化的基礎(chǔ)上,對數(shù)據(jù)按照不同維度的語義??分析和數(shù)據(jù)統(tǒng)計(jì),所有數(shù)據(jù)按照不同的應(yīng)用場景存儲至對應(yīng)的服務(wù)器,在個后臺??系統(tǒng)上呈現(xiàn)給用戶。??(1)熱詞排行。??熱詞對采訪、寫稿、大屏展示等工作能夠起到突出重點(diǎn),讓內(nèi)容以關(guān)鍵詞??為中心展開,使新聞報(bào)道表達(dá)更準(zhǔn)確。??(2)熱門新聞。??每天的新聞數(shù)據(jù)量龐大。記者和編輯們不能全部拿來進(jìn)行深入報(bào)道。所以,??熱門新聞可以提供給他們哪些新聞大家比較關(guān)注,可以進(jìn)行深入報(bào)道。??(3)各類新聞排行。??各類新聞排行可以提供近期每個分類新聞中瀏覽量最多的新聞。可以進(jìn)行績??效考核。后續(xù),可以按瀏覽最多的新聞制作專題。??(4)微信、微博排行。??12??
【參考文獻(xiàn)】:
期刊論文
[1]基于機(jī)器學(xué)習(xí)算法的引文情感自動識別研究——以自然語言處理領(lǐng)域?yàn)槔齕J]. 徐琳宏,丁堃,林原,楊陽. 現(xiàn)代情報(bào). 2020(01)
[2]媒體融合的現(xiàn)狀及發(fā)展趨勢[J]. 胡占凡. 浙江傳媒學(xué)院學(xué)報(bào). 2016(02)
碩士論文
[1]基于微信的企業(yè)營銷平臺[D]. 尹鵬吉.山東大學(xué) 2015
本文編號:3091710
【文章來源】:山東大學(xué)山東省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:88 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖2-3新聞線索采集分析推送系統(tǒng)功能模塊??2.?3.?2功能性需求??
?山東大學(xué)碩士學(xué)位論文???_?_?^^inckide??include?一??O??_?^^Jnckide??????£!S3??include??一?-一---??圖2*4采集模塊用例??(1)內(nèi)部數(shù)據(jù)整合。主要包括臺內(nèi)幾個主要平臺。新聞網(wǎng)站的新聞發(fā)布平??臺、視頻發(fā)布平臺、媒資管理平臺、新聞熱線平臺。我們需要通過api接口,直??接把數(shù)據(jù)庫數(shù)據(jù)導(dǎo)入我們系統(tǒng)的數(shù)據(jù)庫中。??(2)全網(wǎng)數(shù)據(jù)采集。新聞采編部門會提供給我們他們平時工作中素材的重??要來源。通過不同的采集方法進(jìn)行數(shù)據(jù)。其中按模式分,我們主要抓取了七類:??天氣預(yù)報(bào)、網(wǎng)站、報(bào)紙、微信、微博、論壇、APP。按技術(shù)分,我們將使用客戶??端采集工具,Python爬蟲框架,移動端模擬抓包的技術(shù)采集數(shù)據(jù)。然后采集的??數(shù)據(jù)會存入數(shù)據(jù)庫中,并且會進(jìn)行分詞,進(jìn)入搜索引擎建立全文索引。??3.?dāng)?shù)據(jù)分析模塊需求分析??數(shù)據(jù)分析用例如圖2-5所示。??11??
?山東大學(xué)碩士學(xué)位論文???jT?mmi?)??\?\w?mmmrnmi?j??N,?^??圖2-5數(shù)據(jù)分析用例??數(shù)據(jù)入庫后,在基礎(chǔ)數(shù)據(jù)結(jié)構(gòu)化的基礎(chǔ)上,對數(shù)據(jù)按照不同維度的語義??分析和數(shù)據(jù)統(tǒng)計(jì),所有數(shù)據(jù)按照不同的應(yīng)用場景存儲至對應(yīng)的服務(wù)器,在個后臺??系統(tǒng)上呈現(xiàn)給用戶。??(1)熱詞排行。??熱詞對采訪、寫稿、大屏展示等工作能夠起到突出重點(diǎn),讓內(nèi)容以關(guān)鍵詞??為中心展開,使新聞報(bào)道表達(dá)更準(zhǔn)確。??(2)熱門新聞。??每天的新聞數(shù)據(jù)量龐大。記者和編輯們不能全部拿來進(jìn)行深入報(bào)道。所以,??熱門新聞可以提供給他們哪些新聞大家比較關(guān)注,可以進(jìn)行深入報(bào)道。??(3)各類新聞排行。??各類新聞排行可以提供近期每個分類新聞中瀏覽量最多的新聞。可以進(jìn)行績??效考核。后續(xù),可以按瀏覽最多的新聞制作專題。??(4)微信、微博排行。??12??
【參考文獻(xiàn)】:
期刊論文
[1]基于機(jī)器學(xué)習(xí)算法的引文情感自動識別研究——以自然語言處理領(lǐng)域?yàn)槔齕J]. 徐琳宏,丁堃,林原,楊陽. 現(xiàn)代情報(bào). 2020(01)
[2]媒體融合的現(xiàn)狀及發(fā)展趨勢[J]. 胡占凡. 浙江傳媒學(xué)院學(xué)報(bào). 2016(02)
碩士論文
[1]基于微信的企業(yè)營銷平臺[D]. 尹鵬吉.山東大學(xué) 2015
本文編號:3091710
本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/3091710.html
最近更新
教材專著