在線教育課程評(píng)論文本情感傾向性研究
【圖文】:
結(jié)構(gòu)的分析,我們首先需要拿到該網(wǎng)站英語(yǔ)模塊的鏈接,在該頁(yè)面下會(huì)顯示所有的英語(yǔ)課程,通常用戶只需要點(diǎn)進(jìn)去就可以查看該課程的詳情。該網(wǎng)站的英語(yǔ)模塊的頁(yè)面如圖3.3所示。圖3.3 網(wǎng)易云課堂英語(yǔ)模塊頁(yè)面圖我們查看該頁(yè)面的源碼,該頁(yè)面的源碼上擁有各個(gè)課程模塊的鏈接、標(biāo)題、講師等信息,我們通過正則表達(dá)式可以實(shí)現(xiàn)對(duì)鏈接、標(biāo)題、講師等信息的定位。具體的做法是使用 WebDriver 實(shí)例化一個(gè)瀏覽器,瀏覽該英語(yǔ)模塊的頁(yè)面并獲取整個(gè)頁(yè)面源碼,然后使用 HTMLParser 包的正則表達(dá)式對(duì)頁(yè)面進(jìn)行解析,這樣就可以得到每個(gè)課程模塊的鏈接、課程名、講師等信息。我們將獲取到的每個(gè)課程模塊的鏈接放入 URL 庫(kù)中等待評(píng)論文本的抓取。我們?cè)賹?shí)例化一個(gè)瀏覽器瀏覽URL 庫(kù)中的課程模塊鏈接,點(diǎn)擊評(píng)論區(qū)的“查看更多”,,對(duì)該頁(yè)面的源碼進(jìn)行解析獲取課程評(píng)論文本,該網(wǎng)站課程評(píng)論文本示例如圖 3.4 所示。
圖 3.4 課程評(píng)論文本示例圖需要注意的是由于上圖中的課程評(píng)論文本是通過 Ajax 異步加載的,所以碼在點(diǎn)擊評(píng)論區(qū)的“查看更多”之后才會(huì)顯示出來(lái),如果直接在當(dāng)前頁(yè)析將無(wú)法獲取評(píng)論文本。通過對(duì)網(wǎng)易云課堂英語(yǔ)課程評(píng)論文本的爬取,本實(shí)驗(yàn)的數(shù)據(jù)共 8569 條,課程評(píng)論數(shù)據(jù)樣例如表 3.1 所示。
【學(xué)位授予單位】:江西財(cái)經(jīng)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2017
【分類號(hào)】:G434
【參考文獻(xiàn)】
相關(guān)期刊論文 前10條
1 賀杰;;基于Webdriver爬蟲技術(shù)的研究[J];科技廣場(chǎng);2016年10期
2 楊現(xiàn)民;王榴卉;唐斯斯;;教育大數(shù)據(jù)的應(yīng)用模式與政策建議[J];電化教育研究;2015年09期
3 孟卓;袁梅宇;;教育數(shù)據(jù)挖掘發(fā)展現(xiàn)狀及研究規(guī)律的分析[J];教育導(dǎo)刊;2015年02期
4 DENG ChenWei;HUANG GuangBin;XU Jia;TANG JieXiong;;Extreme learning machines: new trends and applications[J];Science China(Information Sciences);2015年02期
5 胡藝齡;顧小清;趙春;;在線學(xué)習(xí)行為分析建模及挖掘[J];開放教育研究;2014年02期
6 徐鵬;王以寧;劉艷華;張海;;大數(shù)據(jù)視角分析學(xué)習(xí)變革——美國(guó)《通過教育數(shù)據(jù)挖掘和學(xué)習(xí)分析促進(jìn)教與學(xué)》報(bào)告解讀及啟示[J];遠(yuǎn)程教育雜志;2013年06期
7 唐曉波;肖璐;;基于情感分析的評(píng)論挖掘模型研究[J];情報(bào)理論與實(shí)踐;2013年07期
8 王洪偉;鄭麗娟;尹裴;史偉;;在線評(píng)論的情感極性分類研究綜述[J];情報(bào)科學(xué);2012年08期
9 鄭艷紅;張東站;;基于同義詞詞林的文本特征選擇方法[J];廈門大學(xué)學(xué)報(bào)(自然科學(xué)版);2012年02期
10 趙妍妍;秦兵;劉挺;;文本情感分析[J];軟件學(xué)報(bào);2010年08期
相關(guān)會(huì)議論文 前1條
1 羅海飛;虞立群;章志凌;邵曉敏;陳林;汪更生;陳弈秋;何偉杰;;一種改進(jìn)型CHI的特征抽取方法[A];第二十四屆中國(guó)控制會(huì)議論文集(下冊(cè))[C];2005年
相關(guān)重要報(bào)紙文章 前1條
1 倪閩景;;教育大數(shù)據(jù)的價(jià)值判斷[N];中國(guó)教師報(bào);2016年
相關(guān)博士學(xué)位論文 前2條
1 劉智;課程評(píng)論的情感傾向識(shí)別與話題挖掘技術(shù)研究[D];華中師范大學(xué);2014年
2 平源;基于支持向量機(jī)的聚類及文本分類研究[D];北京郵電大學(xué);2012年
相關(guān)碩士學(xué)位論文 前5條
1 崔連超;互聯(lián)網(wǎng)評(píng)論文本情感分析研究[D];山東大學(xué);2015年
2 李然;基于深度學(xué)習(xí)的短文本情感傾向性研究[D];北京理工大學(xué);2015年
3 馬治濤;文本分類停用詞處理和特征選擇技術(shù)研究[D];西安電子科技大學(xué);2014年
4 王t熺
本文編號(hào):2558364
本文鏈接:http://sikaile.net/jiaoyulunwen/jiaoyutizhilunwen/2558364.html