天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 教育論文 > 體育論文 >

基于體育賽事互聯(lián)網(wǎng)數(shù)據(jù)的賽事推薦模型研究 ——以馬拉松賽事為例

發(fā)布時(shí)間:2021-07-14 07:58
  隨著社會(huì)經(jīng)濟(jì)的快速發(fā)展與思想理念的轉(zhuǎn)變,當(dāng)前群眾參與體育賽事的熱情日趨高漲。以馬拉松賽事為例,去年全國(guó)的參賽場(chǎng)次已過(guò)千場(chǎng)。但復(fù)雜的賽事分類標(biāo)準(zhǔn)與賽事信息供給不均增加了跑者選擇賽事的難度與時(shí)間成本。如何更好地利用現(xiàn)存的大量賽事網(wǎng)絡(luò)數(shù)據(jù),解決賽事信息流通的過(guò)載已成為推動(dòng)體育信息數(shù)字化發(fā)展的潛在應(yīng)用問(wèn)題;诖藛(wèn)題導(dǎo)向,本文選擇研究當(dāng)下體育賽事互聯(lián)網(wǎng)數(shù)據(jù)的共同特征及對(duì)應(yīng)適用的賽事推薦技術(shù),構(gòu)建可行的賽事推薦模型作為主要的解決方向。本文通過(guò)對(duì)目前賽事的特征進(jìn)行探討研究,分析對(duì)比適合互聯(lián)網(wǎng)賽事數(shù)據(jù)的推薦技術(shù)。并以愛(ài)燃燒網(wǎng)的馬拉松賽事數(shù)據(jù)為例,對(duì)相應(yīng)賽事推薦模型的算法選擇與模型構(gòu)建進(jìn)行探討,確定基于內(nèi)容的推薦模型及其常用的三種關(guān)鍵算法來(lái)實(shí)現(xiàn)賽事推薦模型構(gòu)建的目標(biāo)。在上述基礎(chǔ)上,進(jìn)一步研究賽事推薦模型的構(gòu)建框架,著重分析了賽事向量化與賽事相似度計(jì)算步驟,并在采集的馬拉松賽事數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn)對(duì)比。從結(jié)果看,構(gòu)建的賽事推薦模型在馬拉松賽事的推薦上有較好的性能表現(xiàn),其驗(yàn)證了基于內(nèi)容進(jìn)行推薦的算法在推薦賽事信息上的可行性。以此可以有效滿足現(xiàn)有群眾對(duì)馬拉松賽事推薦的需求,同時(shí)也為構(gòu)建有效的體育賽事互聯(lián)網(wǎng)數(shù)據(jù)處... 

【文章來(lái)源】:上海體育學(xué)院上海市

【文章頁(yè)數(shù)】:84 頁(yè)

【學(xué)位級(jí)別】:碩士

【部分圖文】:

基于體育賽事互聯(lián)網(wǎng)數(shù)據(jù)的賽事推薦模型研究 ——以馬拉松賽事為例


推薦系統(tǒng)通用流程

框架圖,賽事,網(wǎng)絡(luò)數(shù),框架


基于體育賽事互聯(lián)網(wǎng)數(shù)據(jù)的賽事推薦模型研究——以馬拉松賽事為例15的字段名稱,根據(jù)數(shù)據(jù)表構(gòu)建第三范式的標(biāo)準(zhǔn),每個(gè)字段名稱都是獨(dú)立且不重復(fù)的,其代表了在該數(shù)據(jù)集下的一種數(shù)據(jù)特征。同時(shí)在數(shù)據(jù)存儲(chǔ)過(guò)程中,三類賽事網(wǎng)絡(luò)數(shù)據(jù)包含對(duì)應(yīng)數(shù)據(jù)表中所有字段信息的數(shù)據(jù),視為一條數(shù)據(jù)表的元數(shù)據(jù),也稱為元組[36]。為了有效地采集賽事網(wǎng)絡(luò)數(shù)據(jù)中的特征數(shù)據(jù),且使數(shù)據(jù)集符合體育項(xiàng)目賽事的信息詳情,本研究明確三種數(shù)據(jù)集下的固有字段名,從而使該采集框架能夠匹配至各類賽事的網(wǎng)絡(luò)數(shù)據(jù)采集過(guò)程中。圖2-1賽事網(wǎng)絡(luò)數(shù)據(jù)采集框架其中賽事屬性網(wǎng)絡(luò)數(shù)據(jù)集應(yīng)包含賽事編號(hào)、賽事名稱、賽事舉辦地、賽事日期、賽事簡(jiǎn)介五種字段名,賽事編號(hào)是該數(shù)據(jù)集的主鍵即必要的字段名;用戶屬性網(wǎng)絡(luò)數(shù)據(jù)集包含用戶編號(hào)、用戶名稱、用戶性別、用戶所在地四種字段名,其中用戶編號(hào)是該數(shù)據(jù)集的必要字段名;用戶參與賽事網(wǎng)絡(luò)數(shù)據(jù)集則和其他兩表相關(guān)聯(lián),同時(shí)擁有賽事編號(hào)、用戶編號(hào),且含有必要的用戶參賽編號(hào)。如表2-1、表2-2、表2-3所示,在該采集框架應(yīng)用于各類賽事的網(wǎng)絡(luò)數(shù)據(jù)采集時(shí),應(yīng)根據(jù)所需采集的賽事相關(guān)公開內(nèi)容來(lái)確定包含其中對(duì)應(yīng)的數(shù)據(jù)集及字段名稱。在三個(gè)數(shù)據(jù)集構(gòu)成的數(shù)據(jù)表中,賽事編號(hào)、用戶編號(hào)與用戶參賽編號(hào)是每個(gè)數(shù)據(jù)表的主鍵,即該字段是確定數(shù)據(jù)集中數(shù)據(jù)唯一性的關(guān)鍵字段。根據(jù)各類體育項(xiàng)目賽事網(wǎng)絡(luò)數(shù)據(jù)的不同可以選擇增添其他字段構(gòu)成對(duì)應(yīng)合理的數(shù)據(jù)表。表2-1賽事屬性數(shù)據(jù)集采集字段36陳英達(dá),黃巨濤,林強(qiáng),等.關(guān)系型數(shù)據(jù)庫(kù)邏輯設(shè)計(jì)規(guī)范研究[J].微型電腦應(yīng)用,2018,34(6):1-2,7.

流程圖,流程,賽事,內(nèi)容


基于體育賽事互聯(lián)網(wǎng)數(shù)據(jù)的賽事推薦模型研究——以馬拉松賽事為例16表2-2用戶屬性數(shù)據(jù)集采集字段表2-3用戶參賽數(shù)據(jù)集采集字段·2.3體育賽事互聯(lián)網(wǎng)數(shù)據(jù)的采集步驟在大數(shù)據(jù)時(shí)代下,數(shù)據(jù)分析離不開對(duì)數(shù)據(jù)的合理搜索與采集。當(dāng)前對(duì)于大批量互聯(lián)網(wǎng)數(shù)據(jù)的采集已進(jìn)入自動(dòng)化采集的時(shí)期,該行為又稱為網(wǎng)絡(luò)數(shù)據(jù)搜集或網(wǎng)絡(luò)爬蟲[37]。網(wǎng)絡(luò)爬蟲技術(shù)目前在科學(xué)研究、輿情搜集、信息安全領(lǐng)域發(fā)揮了較大的作用,通過(guò)網(wǎng)絡(luò)爬蟲技術(shù)可以按設(shè)定的程序內(nèi)容大批量地獲取規(guī)則化的數(shù)據(jù)信息。目前基于python語(yǔ)言的爬蟲技術(shù)應(yīng)用最為廣泛,通過(guò)python語(yǔ)言可以編寫個(gè)性化的網(wǎng)站數(shù)據(jù)采集框架。同時(shí)也在插件的輔助下進(jìn)行較大批量的數(shù)據(jù)采集,其中比較常用的插件模塊包括了requests網(wǎng)頁(yè)請(qǐng)求模塊、scrapy爬蟲框架與selenium自動(dòng)化網(wǎng)頁(yè)測(cè)試框架。網(wǎng)絡(luò)爬蟲的實(shí)現(xiàn)流程如圖2-2網(wǎng)絡(luò)爬蟲的實(shí)現(xiàn)流程所示,首先需要獲取待采集數(shù)據(jù)的網(wǎng)絡(luò)站點(diǎn)地址(URL),通過(guò)代碼對(duì)站點(diǎn)發(fā)送瀏覽請(qǐng)求從而獲取站點(diǎn)內(nèi)容,并進(jìn)行解析使之轉(zhuǎn)換為可讀取的數(shù)據(jù),最后根據(jù)需要的內(nèi)容提取對(duì)應(yīng)的數(shù)據(jù)類型并將其進(jìn)行存儲(chǔ)。通過(guò)編寫代碼或使用爬蟲框架可以循環(huán)運(yùn)行網(wǎng)絡(luò)爬蟲步驟并進(jìn)行大量的站點(diǎn)自動(dòng)化采集內(nèi)容從而實(shí)現(xiàn)了自動(dòng)化的操作。圖2-2網(wǎng)絡(luò)爬蟲的實(shí)現(xiàn)流程體育賽事互聯(lián)網(wǎng)數(shù)據(jù)的采集同樣可以按照網(wǎng)絡(luò)爬蟲技術(shù)進(jìn)行擴(kuò)展。首先需要確定需要采集數(shù)據(jù)的目標(biāo)網(wǎng)站與其中的目標(biāo)內(nèi)容。通過(guò)Python語(yǔ)言或其他計(jì)算機(jī)語(yǔ)言編寫相應(yīng)的網(wǎng)站內(nèi)容請(qǐng)求模塊代碼、內(nèi)容解析模塊代碼與內(nèi)容采集模塊代碼。其后按照請(qǐng)求或取賽事數(shù)據(jù)網(wǎng)站內(nèi)容,解析賽事數(shù)據(jù)內(nèi)容、采集對(duì)應(yīng)字段數(shù)37李影.體驗(yàn)型商品評(píng)論分主題效用排序研究[D].大連:東北財(cái)經(jīng)大學(xué),2017.

【參考文獻(xiàn)】:
期刊論文
[1]計(jì)算文本相似度的方法體系與應(yīng)用分析[J]. 黃文彬,車尚錕.  情報(bào)理論與實(shí)踐. 2019(11)
[2]關(guān)系型數(shù)據(jù)庫(kù)邏輯設(shè)計(jì)規(guī)范研究[J]. 陳英達(dá),黃巨濤,林強(qiáng),唐亮亮.  微型電腦應(yīng)用. 2018(06)
[3]中央電視臺(tái)2018年平昌冬奧會(huì)轉(zhuǎn)播賽事數(shù)據(jù)的處理與展現(xiàn)[J]. 邊志琨.  現(xiàn)代電視技術(shù). 2018(06)
[4]文本特征提取方法研究綜述[J]. 徐冠華,趙景秀,楊紅亞,劉爽.  軟件導(dǎo)刊. 2018(05)
[5]無(wú)監(jiān)督的中文商品屬性結(jié)構(gòu)化方法[J]. 侯博議,陳群,楊婧穎,李戰(zhàn)懷.  軟件學(xué)報(bào). 2017(02)
[6]利用互聯(lián)網(wǎng)共享體育信息資源模式的探索[J]. 羅曉紅,劉潤(rùn)芝.  山東體育科技. 2016(06)
[7]個(gè)性化推薦系統(tǒng)理論探索:從系統(tǒng)向用戶為中心的演進(jìn)[J]. 劉凱,王偉軍,黃英輝,方璐.  情報(bào)理論與實(shí)踐. 2016(03)
[8]體育網(wǎng)絡(luò)信息資源整合研究[J]. 劉存,唐秋霞.  搏擊(武術(shù)科學(xué)). 2015(10)
[9]體育信息資源整合及其網(wǎng)絡(luò)共享服務(wù)模式的構(gòu)建[J]. 王洪恩.  電子測(cè)試. 2015(08)
[10]Word2vec的工作原理及應(yīng)用探究[J]. 周練.  科技情報(bào)開發(fā)與經(jīng)濟(jì). 2015(02)

博士論文
[1]我國(guó)體育信息資源配置研究[D]. 楊世木.上海體育學(xué)院 2010

碩士論文
[1]馬拉松賽事參賽者參與動(dòng)機(jī)分析[D]. 董曉琴.上海體育學(xué)院 2019
[2]基于用戶行為序列的推薦算法研究[D]. 蔣云鵬.新疆大學(xué) 2019
[3]新浪體育微博的傳播內(nèi)容研究[D]. 葉子.武漢體育學(xué)院 2019
[4]基于LSTM網(wǎng)絡(luò)的政策挖掘研究與應(yīng)用[D]. 李志鵬.北京交通大學(xué) 2019
[5]非傳統(tǒng)和傳統(tǒng)路跑賽事參賽者跑步動(dòng)機(jī)的對(duì)比研究[D]. 陳玲玲.首都體育學(xué)院 2019
[6]中國(guó)馬拉松賽事發(fā)展時(shí)空分布及影響因素研究[D]. 任杰.上海師范大學(xué) 2019
[7]基于Word2Vec的在線商品特征提取與文本分類研究[D]. 章躍琳.溫州大學(xué) 2019
[8]基于用戶行為的個(gè)性化推薦系統(tǒng)的研究與實(shí)現(xiàn)[D]. 毛雨欣.河北科技大學(xué) 2019
[9]中文現(xiàn)代小說(shuō)的作者識(shí)別研究[D]. 肖亮.大連理工大學(xué) 2018
[10]文本向量化方法對(duì)文本分類效果影響的改進(jìn)研究[D]. 趙政.首都經(jīng)濟(jì)貿(mào)易大學(xué) 2018



本文編號(hào):3283744

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/jiaoyulunwen/tylw/3283744.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶f8f85***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com