太原市教育局政務(wù)大數(shù)據(jù)平臺(tái)的新聞分類和推薦方法研究
發(fā)布時(shí)間:2021-06-03 18:28
大數(shù)據(jù)、云計(jì)算和人工智能的快速發(fā)展,使得傳統(tǒng)的電子政務(wù)已難以適應(yīng)當(dāng)今的新形勢(shì),建設(shè)一個(gè)融合大數(shù)據(jù)、數(shù)字化和智能化的政務(wù)平臺(tái)已成為當(dāng)今政府尋求發(fā)展的新思路。自2017年以來太原市教育局政務(wù)大數(shù)據(jù)平臺(tái)建設(shè)不斷取得成就,但是與發(fā)達(dá)國(guó)家和我國(guó)先進(jìn)省市的政務(wù)平臺(tái)相比仍然有較大差距。目前該平臺(tái)采用的新聞分類方法的分類粒度較粗且分類的準(zhǔn)確率較低,對(duì)于新聞推薦來說目前該平臺(tái)使用的推薦方法存在著不能及時(shí)反映用戶興趣變化,推薦結(jié)果準(zhǔn)確率較低和推薦個(gè)性化程度較低等問題,本文針對(duì)其政務(wù)大數(shù)據(jù)平臺(tái)存在的這些問題進(jìn)行了研究。本文對(duì)傳統(tǒng)的TF-IDF特征提取方法進(jìn)行了改進(jìn),提出一種結(jié)合教育政務(wù)詞庫(kù)(GE)和特征詞位置信息(LF)的教育政務(wù)新聞特征提取方法,即ETF-IDF-L特征提取方法,然后分別通過樸素貝葉斯和卷積神經(jīng)網(wǎng)絡(luò)對(duì)教育政務(wù)新聞進(jìn)行分類,通過實(shí)驗(yàn)發(fā)現(xiàn)對(duì)于一些擁有較少數(shù)據(jù)量的新聞?lì)悇e來說基于ETF-IDF-L的特征提取和向量空間模型文本表示方法結(jié)合多項(xiàng)式樸素貝葉斯分類模型得到的分類效果較好,對(duì)于擁有較多數(shù)據(jù)量的新聞?lì)悇e來說基于Word2vec的卷積神經(jīng)網(wǎng)絡(luò)分類模型得到的分類效果較好,這兩種分類模型的準(zhǔn)確度和...
【文章來源】:中北大學(xué)山西省
【文章頁(yè)數(shù)】:82 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
文教育文本網(wǎng)頁(yè)文本……去除停用詞……特征
文本分類過程圖
中北大學(xué)學(xué)位論文192.3推薦系統(tǒng)現(xiàn)在互聯(lián)網(wǎng)的大面積普及使得信息量呈現(xiàn)爆炸性增長(zhǎng)的態(tài)勢(shì),給用戶及時(shí)獲取高質(zhì)量信息造成了障礙,形成了信息過載。我們?nèi)粘=?jīng)常用到的一些搜索引擎,如百度、搜狗等信息檢索系統(tǒng)的目的就是讓使用者可以在最短的時(shí)間找到自己需要的信息,從而幫助我們更好的解決信息過載這一問題,但這只是一種初級(jí)階段,在此階段不能實(shí)現(xiàn)理想的個(gè)性化推薦。基于此基礎(chǔ)之上誕生的推薦系統(tǒng)[41,42]便是一種信息過濾系統(tǒng),它的工作原理是通過收集系統(tǒng)用戶對(duì)某些物品的偏好程度、興趣度以及相關(guān)的訪問行為等,依據(jù)這些信息和系統(tǒng)用戶的興趣進(jìn)行匹配,根據(jù)此原理來為用戶進(jìn)行推薦,其推薦的個(gè)性化和準(zhǔn)確率較之前的搜索引擎有很大程度的提升。2.3.1推薦系統(tǒng)構(gòu)成推薦系統(tǒng)是借助后臺(tái)的方式向使用者提供服務(wù)的,它通過采集用戶和物品的信息以及用戶的相關(guān)行為之后,根據(jù)所要進(jìn)行推薦的對(duì)象的特點(diǎn)結(jié)合相應(yīng)的推薦算法,得到一個(gè)需要的推薦模型,然后再根據(jù)得到的推薦模型進(jìn)行決策分析,最終得到推薦結(jié)果。其工作過程可分為七個(gè)階段,將這七個(gè)階段組合到一起便形成了我們的推薦系統(tǒng)的工作過程,如圖2-5所示。圖2-5推薦系統(tǒng)工作過程Fig.2-5Recommendationsystemworkingprocess用戶、商品相關(guān)行為及特征信息處理訓(xùn)練模型決策分析推薦模型最終結(jié)果應(yīng)用場(chǎng)景
【參考文獻(xiàn)】:
期刊論文
[1]機(jī)器學(xué)習(xí)方法在文本分類中的應(yīng)用[J]. 陶林潤(rùn)德. 中國(guó)戰(zhàn)略新興產(chǎn)業(yè). 2017(40)
[2]一種改進(jìn)的文本分類算法[J]. 任朋啟,王芳,黃樹成. 電子設(shè)計(jì)工程. 2017(18)
[3]基于機(jī)器學(xué)習(xí)的專利文本分類算法研究綜述[J]. 劉紅光,馬雙剛,劉桂鋒. 圖書情報(bào)研究. 2016(03)
[4]社會(huì)化推薦系統(tǒng)研究[J]. 孟祥武,劉樹棟,張玉潔,胡勛. 軟件學(xué)報(bào). 2015(06)
[5]基于知識(shí)的推薦系統(tǒng)用戶交互模型研究[J]. 艾磊,趙輝. 軟件導(dǎo)刊. 2015(03)
[6]云計(jì)算環(huán)境下基于協(xié)同過濾的個(gè)性化推薦機(jī)制[J]. 朱夏,宋愛波,東方,羅軍舟. 計(jì)算機(jī)研究與發(fā)展. 2014(10)
[7]協(xié)同過濾推薦技術(shù)綜述[J]. 冷亞軍,陸青,梁昌勇. 模式識(shí)別與人工智能. 2014(08)
[8]基于用戶相似度的協(xié)同過濾推薦算法[J]. 榮輝桂,火生旭,胡春華,莫進(jìn)俠. 通信學(xué)報(bào). 2014(02)
[9]個(gè)性化推薦系統(tǒng)綜述[J]. 王國(guó)霞,劉賀平. 計(jì)算機(jī)工程與應(yīng)用. 2012(07)
[10]基于特征類別屬性分析的文本分類器分類噪聲裁剪方法[J]. 王強(qiáng),關(guān)毅,王曉龍. 自動(dòng)化學(xué)報(bào). 2007(08)
博士論文
[1]國(guó)家治理中大數(shù)據(jù)應(yīng)用問題研究[D]. 盧洪.中共中央黨校 2018
[2]文本分類及其相關(guān)技術(shù)研究[D]. 李榮陸.復(fù)旦大學(xué) 2005
碩士論文
[1]基于機(jī)器學(xué)習(xí)的文本分類研究與實(shí)現(xiàn)[D]. 王振.南京郵電大學(xué) 2018
[2]基于分詞頻的特征選擇算法在文本分類中的研究[D]. 劉藝彬.西安理工大學(xué) 2018
[3]基于深度學(xué)習(xí)的文本分類技術(shù)的研究[D]. 龐丹丹.北方工業(yè)大學(xué) 2018
[4]混合推薦算法的研究[D]. 宋瑞平.蘭州大學(xué) 2014
本文編號(hào):3211021
【文章來源】:中北大學(xué)山西省
【文章頁(yè)數(shù)】:82 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
文教育文本網(wǎng)頁(yè)文本……去除停用詞……特征
文本分類過程圖
中北大學(xué)學(xué)位論文192.3推薦系統(tǒng)現(xiàn)在互聯(lián)網(wǎng)的大面積普及使得信息量呈現(xiàn)爆炸性增長(zhǎng)的態(tài)勢(shì),給用戶及時(shí)獲取高質(zhì)量信息造成了障礙,形成了信息過載。我們?nèi)粘=?jīng)常用到的一些搜索引擎,如百度、搜狗等信息檢索系統(tǒng)的目的就是讓使用者可以在最短的時(shí)間找到自己需要的信息,從而幫助我們更好的解決信息過載這一問題,但這只是一種初級(jí)階段,在此階段不能實(shí)現(xiàn)理想的個(gè)性化推薦。基于此基礎(chǔ)之上誕生的推薦系統(tǒng)[41,42]便是一種信息過濾系統(tǒng),它的工作原理是通過收集系統(tǒng)用戶對(duì)某些物品的偏好程度、興趣度以及相關(guān)的訪問行為等,依據(jù)這些信息和系統(tǒng)用戶的興趣進(jìn)行匹配,根據(jù)此原理來為用戶進(jìn)行推薦,其推薦的個(gè)性化和準(zhǔn)確率較之前的搜索引擎有很大程度的提升。2.3.1推薦系統(tǒng)構(gòu)成推薦系統(tǒng)是借助后臺(tái)的方式向使用者提供服務(wù)的,它通過采集用戶和物品的信息以及用戶的相關(guān)行為之后,根據(jù)所要進(jìn)行推薦的對(duì)象的特點(diǎn)結(jié)合相應(yīng)的推薦算法,得到一個(gè)需要的推薦模型,然后再根據(jù)得到的推薦模型進(jìn)行決策分析,最終得到推薦結(jié)果。其工作過程可分為七個(gè)階段,將這七個(gè)階段組合到一起便形成了我們的推薦系統(tǒng)的工作過程,如圖2-5所示。圖2-5推薦系統(tǒng)工作過程Fig.2-5Recommendationsystemworkingprocess用戶、商品相關(guān)行為及特征信息處理訓(xùn)練模型決策分析推薦模型最終結(jié)果應(yīng)用場(chǎng)景
【參考文獻(xiàn)】:
期刊論文
[1]機(jī)器學(xué)習(xí)方法在文本分類中的應(yīng)用[J]. 陶林潤(rùn)德. 中國(guó)戰(zhàn)略新興產(chǎn)業(yè). 2017(40)
[2]一種改進(jìn)的文本分類算法[J]. 任朋啟,王芳,黃樹成. 電子設(shè)計(jì)工程. 2017(18)
[3]基于機(jī)器學(xué)習(xí)的專利文本分類算法研究綜述[J]. 劉紅光,馬雙剛,劉桂鋒. 圖書情報(bào)研究. 2016(03)
[4]社會(huì)化推薦系統(tǒng)研究[J]. 孟祥武,劉樹棟,張玉潔,胡勛. 軟件學(xué)報(bào). 2015(06)
[5]基于知識(shí)的推薦系統(tǒng)用戶交互模型研究[J]. 艾磊,趙輝. 軟件導(dǎo)刊. 2015(03)
[6]云計(jì)算環(huán)境下基于協(xié)同過濾的個(gè)性化推薦機(jī)制[J]. 朱夏,宋愛波,東方,羅軍舟. 計(jì)算機(jī)研究與發(fā)展. 2014(10)
[7]協(xié)同過濾推薦技術(shù)綜述[J]. 冷亞軍,陸青,梁昌勇. 模式識(shí)別與人工智能. 2014(08)
[8]基于用戶相似度的協(xié)同過濾推薦算法[J]. 榮輝桂,火生旭,胡春華,莫進(jìn)俠. 通信學(xué)報(bào). 2014(02)
[9]個(gè)性化推薦系統(tǒng)綜述[J]. 王國(guó)霞,劉賀平. 計(jì)算機(jī)工程與應(yīng)用. 2012(07)
[10]基于特征類別屬性分析的文本分類器分類噪聲裁剪方法[J]. 王強(qiáng),關(guān)毅,王曉龍. 自動(dòng)化學(xué)報(bào). 2007(08)
博士論文
[1]國(guó)家治理中大數(shù)據(jù)應(yīng)用問題研究[D]. 盧洪.中共中央黨校 2018
[2]文本分類及其相關(guān)技術(shù)研究[D]. 李榮陸.復(fù)旦大學(xué) 2005
碩士論文
[1]基于機(jī)器學(xué)習(xí)的文本分類研究與實(shí)現(xiàn)[D]. 王振.南京郵電大學(xué) 2018
[2]基于分詞頻的特征選擇算法在文本分類中的研究[D]. 劉藝彬.西安理工大學(xué) 2018
[3]基于深度學(xué)習(xí)的文本分類技術(shù)的研究[D]. 龐丹丹.北方工業(yè)大學(xué) 2018
[4]混合推薦算法的研究[D]. 宋瑞平.蘭州大學(xué) 2014
本文編號(hào):3211021
本文鏈接:http://sikaile.net/jiaoyulunwen/ktjx/3211021.html
最近更新
教材專著