大型開放式在線教育中大數(shù)據(jù)的文本分類研究
本文關(guān)鍵詞:大型開放式在線教育中大數(shù)據(jù)的文本分類研究,由筆耕文化傳播整理發(fā)布。
【摘要】:“互聯(lián)網(wǎng)+”是當(dāng)前應(yīng)對經(jīng)濟(jì)結(jié)構(gòu)轉(zhuǎn)型,創(chuàng)建經(jīng)濟(jì)新增長點(diǎn)的一個重要突破。電信業(yè)、制造業(yè)、金融業(yè)等傳統(tǒng)產(chǎn)業(yè)都在進(jìn)一步地與互聯(lián)網(wǎng)相融合!盎ヂ(lián)網(wǎng)+傳統(tǒng)產(chǎn)業(yè)”的模式正成為國家發(fā)展的重要戰(zhàn)略!盎ヂ(lián)網(wǎng)+傳統(tǒng)教育”即大型開放式網(wǎng)絡(luò)課程(Massively Open Online Courses,MOOC)作為現(xiàn)代教育的一種新趨勢,越來越受到各個方面的關(guān)注。然而,跟蹤MOOC網(wǎng)站上用戶的行為并從他們反饋的大數(shù)據(jù)中挖掘出有效信息為決策者提供支持是當(dāng)前面臨的主要問題。為此,本課題將針對大型開放式網(wǎng)絡(luò)課程的特點(diǎn)使用大數(shù)據(jù)在文本分類分析過程中的一些關(guān)鍵性技術(shù)對MOOC網(wǎng)站上抓取到的大量用戶評論數(shù)據(jù)進(jìn)行情感傾向預(yù)測分類。本文的主要思路是:首先通過介紹大數(shù)據(jù)分析和數(shù)據(jù)挖掘的相關(guān)理論與技術(shù)明確本課題的研究內(nèi)容是分布式分類計算;其次闡述與本課題相關(guān)的幾種分類算法以及它們的Map Reduce并行化方式;然后給出對MOOC網(wǎng)站上的用戶評論內(nèi)容通過文本向量化和特征選擇法相結(jié)合進(jìn)行情感傾向分類的流程;最后參照前文的流程和方法進(jìn)行算法實驗,對比得出最優(yōu)實驗組合,并使用最優(yōu)實驗組合對網(wǎng)易公開課中抓取到的大量用戶評論數(shù)據(jù)進(jìn)行文本的情感傾向預(yù)測分類。
【關(guān)鍵詞】:大數(shù)據(jù) 數(shù)據(jù)挖掘 分布式計算 文本情感分類 Massively Open Online Courses
【學(xué)位授予單位】:西華師范大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:TP391.1;G434
【目錄】:
- 摘要5-6
- Abstract6-7
- 第1章 前言7-12
- 1.1 課題背景7-8
- 1.2 研究意義8-9
- 1.3 國內(nèi)外研究現(xiàn)狀9-10
- 1.4 課題主要研究內(nèi)容10-12
- 第2章 大數(shù)據(jù)相關(guān)理論與技術(shù)12-22
- 2.1 大數(shù)據(jù)及其相關(guān)技術(shù)12-13
- 2.1.1 大數(shù)據(jù)的定義12-13
- 2.2 大數(shù)據(jù)相關(guān)技術(shù)13-19
- 2.3 大數(shù)據(jù)分析19-22
- 2.3.1 數(shù)據(jù)探索和數(shù)據(jù)挖掘20
- 2.3.2 數(shù)據(jù)挖掘20-22
- 第3章 分布式分類計算22-32
- 3.1 分類預(yù)測22-27
- 3.1.1 分布式分類計算22-23
- 3.1.2 分類原理23-24
- 3.1.3 文本情感分類的流程24-27
- 3.2 相似性度量27-28
- 3.3 最近鄰KNN分類28-30
- 3.3.1 KNN基本原理28-29
- 3.3.2 KNN MapReduce并行化29-30
- 3.4 質(zhì)心分類30
- 3.4.1 質(zhì)心分類的基本原理30
- 3.4.2 質(zhì)心分類并行化30
- 3.5 貪婪貝葉斯30-31
- 3.6 支持向量機(jī)31-32
- 第4章 MOOC網(wǎng)站中用戶評論的文本情感分類過程32-38
- 4.1 文本情感分類的方法32-33
- 4.2 文本情感分類33-36
- 4.2.1 數(shù)據(jù)收集33-34
- 4.2.2 文本向量化34-36
- 4.2.3 特征選擇36
- 4.3 用戶評論數(shù)據(jù)情感分類36-38
- 第5章 算法實驗38-42
- 5.1 實驗環(huán)境搭建38-40
- 5.1.1 集群規(guī)劃38
- 5.1.2 軟件準(zhǔn)備38-40
- 5.2 實驗數(shù)據(jù)40
- 5.3 實驗過程和結(jié)果40-42
- 第6章 總結(jié)與展望42-44
- 6.1 本課題的研究總結(jié)42
- 6.2 本課題的創(chuàng)新之處42-43
- 6.3 本課題的不足以及對未來工作的展望43-44
- 參考文獻(xiàn)44-46
- 致謝46-49
- 在學(xué)期間的科研情況49
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 葉真;讓笑聲給教學(xué)帶來生機(jī)[J];成都體院學(xué)報;1987年04期
2 白冰;;虛構(gòu)·假說·磨玉——情感傾向的生成[J];赤峰學(xué)院學(xué)報(漢文哲學(xué)社會科學(xué)版);2007年02期
3 劉洪高;;談《荷塘月色》的情感傾向[J];荊州師專學(xué)報;1993年03期
4 少木森;;青年教師的職業(yè)情感傾向初探[J];思想政治課教學(xué);1987年06期
5 劉曉琦;;語文教學(xué)應(yīng)體現(xiàn)教師的情感傾向[J];現(xiàn)代語文(文學(xué)研究);2011年07期
6 姚璽;;支持資源作用下的工作-家庭促進(jìn):情感傾向的調(diào)節(jié)作用[J];經(jīng)營管理者;2013年05期
7 張有志;;探尋文字風(fēng)格之美[J];同學(xué)少年;2008年12期
8 劉鳳英;;青春期學(xué)生情感傾向調(diào)查及引導(dǎo)[J];中小學(xué)心理健康教育;2008年14期
9 周來祥;;談共鳴問題[J];山東大學(xué)學(xué)報(中國語言文學(xué)版);1961年S4期
10 劉曉紅;;動物成語與漢民族的情感傾向[J];語文知識;2000年04期
中國重要會議論文全文數(shù)據(jù)庫 前4條
1 楊江;侯敏;王寧;;基于主題情感句的漢語評論文傾向性分析[A];第五屆全國青年計算語言學(xué)研討會論文集[C];2010年
2 林慧恩;林世平;;中文情感傾向分析中主觀句子抽取方法的研究[A];全國第20屆計算機(jī)技術(shù)與應(yīng)用學(xué)術(shù)會議(CACIS·2009)暨全國第1屆安全關(guān)鍵技術(shù)與應(yīng)用學(xué)術(shù)會議論文集(上冊)[C];2009年
3 王素格;楊安娜;;一種混合語言信息的詞語搭配傾向判別方法[A];第五屆全國信息檢索學(xué)術(shù)會議論文集[C];2009年
4 宋曉雷;王素格;李紅霞;;基于概率潛在語義分析的詞匯情感傾向判別[A];第五屆全國青年計算語言學(xué)研討會論文集[C];2010年
中國重要報紙全文數(shù)據(jù)庫 前3條
1 唐楠;新聞應(yīng)避免情感傾向[N];中國新聞出版報;2005年
2 魯東;不盡鄉(xiāng)情入畫來[N];中國文化報;2001年
3 楊勇濤;讓攝影喚起心靈的本真[N];中國攝影報;2005年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前6條
1 房磊;融合知識的情感分析研究[D];清華大學(xué);2015年
2 張奇;細(xì)顆粒度情感傾向分析若干關(guān)鍵問題研究[D];復(fù)旦大學(xué);2008年
3 王素格;基于Web的評論文本情感分類問題研究[D];上海大學(xué);2008年
4 楊卉;Web文本觀點(diǎn)挖掘及隱含情感傾向的研究[D];吉林大學(xué);2011年
5 李思;WEB觀點(diǎn)挖掘中關(guān)鍵問題的研究[D];北京郵電大學(xué);2012年
6 李方濤;基于產(chǎn)品評論的情感分析研究[D];清華大學(xué);2011年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 王帥;情感分析的特征提取算法與觀點(diǎn)的聚類算法研究[D];昆明理工大學(xué);2015年
2 馮金剛;網(wǎng)絡(luò)輿情中文信息情感傾向分析研究[D];華北電力大學(xué);2015年
3 魏從源;網(wǎng)絡(luò)信息的情感傾向分類技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2013年
4 周冬衛(wèi);中文微博評論的情感傾向分析[D];華東交通大學(xué);2015年
5 吳斐;跨領(lǐng)域條件下詞匯情感傾向判別方法研究[D];合肥工業(yè)大學(xué);2015年
6 徐凱;基于產(chǎn)品特征的用戶評論情感傾向分析研究[D];合肥工業(yè)大學(xué);2015年
7 王格;網(wǎng)絡(luò)評論的情感傾向分析[D];武漢工程大學(xué);2015年
8 劉其;基于用戶評論的群體情緒識別與演化研究[D];東華大學(xué);2015年
9 張佳明;微博話題的公眾情感分析技術(shù)研究[D];解放軍信息工程大學(xué);2015年
10 唐浩浩;面向事件的微博情感傾向性分析技術(shù)研究[D];解放軍信息工程大學(xué);2014年
本文關(guān)鍵詞:大型開放式在線教育中大數(shù)據(jù)的文本分類研究,由筆耕文化傳播整理發(fā)布。
,本文編號:459688
本文鏈接:http://sikaile.net/jiaoyulunwen/jiaoyutizhilunwen/459688.html