基于改進的主題分割模型在教師話語文本分析中的應(yīng)用研究
發(fā)布時間:2021-05-28 10:21
課堂話語作為課堂教學(xué)的重要媒介和主要手段,也是判斷教師自身專業(yè)素質(zhì)、教學(xué)理念和教學(xué)效果的重要指標(biāo)之一。采用圖式化和量化的方法對課堂教學(xué)話語內(nèi)容進行結(jié)構(gòu)化、系統(tǒng)化地剖析,能夠科學(xué)并且客觀地呈現(xiàn)課堂教學(xué)的內(nèi)在層次邏輯,從微觀角度分析課堂教學(xué)的結(jié)構(gòu),F(xiàn)階段的教學(xué)話語分析大多采用人工觀察、訪談、問卷調(diào)查等費時費力的方法,如何改善傳統(tǒng)教學(xué)分析方法,輔助教育工作者高效掌握和分析教師授課特征是亟需解決的問題。針對目前該領(lǐng)域內(nèi)缺乏中文教育文本的智能化分析方法的問題,本文提出了一種基于改進的主題分割模型的教師話語分析方法,利用該模型對教師話語文本進行主題分割,并且對各子主題段落進行內(nèi)容結(jié)構(gòu)分析及可視化呈現(xiàn)。實驗結(jié)果表明,該方法在面向授課話語文本的主題分割任務(wù)中相較于其他傳統(tǒng)方法更具有效性,并且實現(xiàn)了課堂話語文本主題分割及結(jié)構(gòu)分析的智能化處理,可以有效應(yīng)用于課堂教學(xué)文本的分析任務(wù)中。在本文面向課堂話語文本分析的技術(shù)研究中,主要包含以下三個方面的研究內(nèi)容:首先,鑒于傳統(tǒng)的LDA主題模型對于詞語相關(guān)性的表達不夠準確的問題,本文提出利用word2vec詞嵌入模型獲取詞語上下文信息,將全局的主題分布特征和局部上下...
【文章來源】:華中師范大學(xué)湖北省 211工程院校 教育部直屬院校
【文章頁數(shù)】:71 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖3.1教師話語文本分析模型架構(gòu)圖??3.2主題分割??主題分割算法的核心內(nèi)容是判斷各文本單元之間的主題相關(guān)度,按照一定規(guī)??則確定分割邊界,文本單元之間相似性度量的準確度很大程度上受到文本內(nèi)容表??
?碩士學(xué)位論文??MASTER'S?THESIS??Similarity?between?adjacent?sentences??095?—??:??i:?\rWj\fri??0.70-??0?20?40?60?80??Split?gap??圖3.2相似度曲線圖??(3)邊界識別和文本分割??圖3.2顯示了在相鄰文本單元之間余弦相似度的變化,由于局部極小值能夠??表明相似性得分顯著降低,這意味著主題分布也在這些間隔點處發(fā)生了實質(zhì)性的??變化,因此我們使用這些來標(biāo)識子主題的邊界。圖中較大相似度的值代表相鄰文??本單元非常相似,相反,局部極小值表明兩個相鄰片段的文本關(guān)系明顯不同,如??圖中紅色分隔豎線所示,第41行和第42行中的間隙出現(xiàn)了明顯的語義轉(zhuǎn)換現(xiàn)象,??于是我們將此間隔點識別為邊界,即最終分割點。??3.3內(nèi)容結(jié)構(gòu)特征可視化??將劃分好子主題的語義段落集合分別進行topK個主題詞提取,這里本研宄應(yīng)??用的方法是TFIDF算法,其基本原理及應(yīng)用優(yōu)勢在2.5節(jié)中進行了詳細介紹。在??獲取到topK個主題詞之后,分別進行主題詞的位置分布信息統(tǒng)計,得到一個主題??詞分布序列,例如對于主題詞集合,其位置分布序列可表示??為Seq?=?{w;,Wy,?WZ,W;,?該序列表示在主題詞Wi后緊跟出現(xiàn)的是主題詞Wy。??通過這種方法我們可以獲取各主題詞之間的位置分布特征,進而分析詞與詞之間??的關(guān)聯(lián)關(guān)系。??本文提出采用滯后序列分析法來進行主題詞的關(guān)聯(lián)分析。滯后序列分析法??(Lag?sequential?analysis,簡稱LSA)是由Sackett等人于1789年提出的算法,主??34??
住事建.is笸紀初期英匡對中3的茶葉、生絲等商品的差求不飫堵長...'???作品,寒又”:?費了,不K琴盡3L?貧春、胥夜婷、楊囯呈、徐興堂在香淹狖趕了_b王:十多年的芙國朱字旗最后一次在這呈降茗后...",??”結(jié)檢內(nèi)容”:”(一)#語這篇通語的導(dǎo)語菡分有三:.個重點?一個是點垤,點明了莢國匡續(xù)降落后??”寫作技巧":"a)以時閭閃叵的方式鉭織封料■第一s在寫港備兩告梨&式中的雋三a,如注對港苫翁思史的迻述...?”,??■獲獎":”第八浥中匡費聞獎評選中榮獲一等獎?"??>r??圖4.1百科文本格式??由于并不是所有的課文在百科內(nèi)都有錄入,并且有些標(biāo)題對應(yīng)多個義項,例??如“口技”?一詞,包含四個義項,默認搜索“口技”一詞對應(yīng)著“民間表演技藝”義??項,而我們需要的是“清代林嗣環(huán)文章”義項,因此需要經(jīng)過人工的反復(fù)整理篩選,??按照這種方法我們最終獲得972篇百科文本。??統(tǒng)計整理出這些百科文本正文中涉及的所有小標(biāo)題,根據(jù)語料庫所需要的文??本特征進行人工篩選,最終確定需要的小標(biāo)題共有301個,舉例如表4.1所示:??表4_?1??敘述角度意象運用情節(jié)結(jié)構(gòu)主旨感悟內(nèi)涵精神思想內(nèi)容寫作特征敘事藝術(shù)??本文中心語言風(fēng)格形式自由課文感受修辭手法思想主題文章屬性寫作技巧??表現(xiàn)手法課文結(jié)構(gòu)中心思想藝術(shù)特色中心論點文章啟示文章思路學(xué)習(xí)目標(biāo)??表達技巧分析質(zhì)疑層次結(jié)構(gòu)課文結(jié)構(gòu)內(nèi)容賞析特殊句式文章小結(jié)主題歸納??層次大意文章脈絡(luò)教學(xué)難點段落層次篇章研究拓展升華文章主題?...??>根據(jù)這些子標(biāo)題從己獲取的文本中摘取出對應(yīng)文本項,一個子標(biāo)題所包含的??內(nèi)容作為一行,例如上文舉例的《別了,不列顛尼亞》一文,我們將摘取出“結(jié)構(gòu)??
【參考文獻】:
期刊論文
[1]結(jié)合語義相似度改進LDA的文本主題分析[J]. 趙林靜. 計算機工程與設(shè)計. 2019(12)
[2]基于深度學(xué)習(xí)的主題模型研究[J]. 黃佳佳,李鵬偉,彭敏,謝倩倩,徐超. 計算機學(xué)報. 2020(05)
[3]基于動態(tài)權(quán)重的LDA算法[J]. 居亞亞,楊璐,嚴建峰. 計算機科學(xué). 2019(08)
[4]基于學(xué)科核心素養(yǎng)的初中生物學(xué)“主線教學(xué)”——以蘇科版“植物的生殖(第一課時)”教學(xué)為例[J]. 張桂梅. 基礎(chǔ)教育課程. 2019(Z1)
[5]怎樣利用語言知識資源進行語義理解和常識推理[J]. 袁毓林,盧達威. 中文信息學(xué)報. 2018(12)
[6]基于詞語相關(guān)性的對話系統(tǒng)話題分割[J]. 何天文,王紅,劉海燕. 計算機應(yīng)用研究. 2019(04)
[7]基于領(lǐng)域本體的文本分割方法研究[J]. 劉耀,帥遠華,龔幸偉,黃毅. 計算機科學(xué). 2018(01)
[8]基于核心素養(yǎng)的初中生物課堂教學(xué)改進探討[J]. 胡玉華. 課程.教材.教法. 2017(08)
[9]長度分布約束下的摘要文本無監(jiān)督分割算法[J]. 駱俊帆,陳黎,于中華,丁革建,羅謙. 中文信息學(xué)報. 2017(04)
[10]主題模型中的參數(shù)估計方法綜述[J]. 杜慧,陳云芳,張偉. 計算機科學(xué). 2017(S1)
碩士論文
[1]文本分割關(guān)鍵技術(shù)研究[D]. 鄧一平.哈爾濱工業(yè)大學(xué) 2019
[2]高中物理課堂教學(xué)結(jié)構(gòu)研究[D]. 付馨媛.南京師范大學(xué) 2018
[3]基于在線主題模型的追蹤與檢測技術(shù)[D]. 杜慧.南京郵電大學(xué) 2017
[4]面向?qū)υ捨谋镜闹黝}分割技術(shù)研究[D]. 王炳浩.哈爾濱工業(yè)大學(xué) 2016
[5]基于統(tǒng)計模型的文本分割方法及其改進[D]. 李效晉.山東大學(xué) 2014
本文編號:3208083
【文章來源】:華中師范大學(xué)湖北省 211工程院校 教育部直屬院校
【文章頁數(shù)】:71 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖3.1教師話語文本分析模型架構(gòu)圖??3.2主題分割??主題分割算法的核心內(nèi)容是判斷各文本單元之間的主題相關(guān)度,按照一定規(guī)??則確定分割邊界,文本單元之間相似性度量的準確度很大程度上受到文本內(nèi)容表??
?碩士學(xué)位論文??MASTER'S?THESIS??Similarity?between?adjacent?sentences??095?—??:??i:?\rWj\fri??0.70-??0?20?40?60?80??Split?gap??圖3.2相似度曲線圖??(3)邊界識別和文本分割??圖3.2顯示了在相鄰文本單元之間余弦相似度的變化,由于局部極小值能夠??表明相似性得分顯著降低,這意味著主題分布也在這些間隔點處發(fā)生了實質(zhì)性的??變化,因此我們使用這些來標(biāo)識子主題的邊界。圖中較大相似度的值代表相鄰文??本單元非常相似,相反,局部極小值表明兩個相鄰片段的文本關(guān)系明顯不同,如??圖中紅色分隔豎線所示,第41行和第42行中的間隙出現(xiàn)了明顯的語義轉(zhuǎn)換現(xiàn)象,??于是我們將此間隔點識別為邊界,即最終分割點。??3.3內(nèi)容結(jié)構(gòu)特征可視化??將劃分好子主題的語義段落集合分別進行topK個主題詞提取,這里本研宄應(yīng)??用的方法是TFIDF算法,其基本原理及應(yīng)用優(yōu)勢在2.5節(jié)中進行了詳細介紹。在??獲取到topK個主題詞之后,分別進行主題詞的位置分布信息統(tǒng)計,得到一個主題??詞分布序列,例如對于主題詞集合,其位置分布序列可表示??為Seq?=?{w;,Wy,?WZ,W;,?該序列表示在主題詞Wi后緊跟出現(xiàn)的是主題詞Wy。??通過這種方法我們可以獲取各主題詞之間的位置分布特征,進而分析詞與詞之間??的關(guān)聯(lián)關(guān)系。??本文提出采用滯后序列分析法來進行主題詞的關(guān)聯(lián)分析。滯后序列分析法??(Lag?sequential?analysis,簡稱LSA)是由Sackett等人于1789年提出的算法,主??34??
住事建.is笸紀初期英匡對中3的茶葉、生絲等商品的差求不飫堵長...'???作品,寒又”:?費了,不K琴盡3L?貧春、胥夜婷、楊囯呈、徐興堂在香淹狖趕了_b王:十多年的芙國朱字旗最后一次在這呈降茗后...",??”結(jié)檢內(nèi)容”:”(一)#語這篇通語的導(dǎo)語菡分有三:.個重點?一個是點垤,點明了莢國匡續(xù)降落后??”寫作技巧":"a)以時閭閃叵的方式鉭織封料■第一s在寫港備兩告梨&式中的雋三a,如注對港苫翁思史的迻述...?”,??■獲獎":”第八浥中匡費聞獎評選中榮獲一等獎?"??>r??圖4.1百科文本格式??由于并不是所有的課文在百科內(nèi)都有錄入,并且有些標(biāo)題對應(yīng)多個義項,例??如“口技”?一詞,包含四個義項,默認搜索“口技”一詞對應(yīng)著“民間表演技藝”義??項,而我們需要的是“清代林嗣環(huán)文章”義項,因此需要經(jīng)過人工的反復(fù)整理篩選,??按照這種方法我們最終獲得972篇百科文本。??統(tǒng)計整理出這些百科文本正文中涉及的所有小標(biāo)題,根據(jù)語料庫所需要的文??本特征進行人工篩選,最終確定需要的小標(biāo)題共有301個,舉例如表4.1所示:??表4_?1??敘述角度意象運用情節(jié)結(jié)構(gòu)主旨感悟內(nèi)涵精神思想內(nèi)容寫作特征敘事藝術(shù)??本文中心語言風(fēng)格形式自由課文感受修辭手法思想主題文章屬性寫作技巧??表現(xiàn)手法課文結(jié)構(gòu)中心思想藝術(shù)特色中心論點文章啟示文章思路學(xué)習(xí)目標(biāo)??表達技巧分析質(zhì)疑層次結(jié)構(gòu)課文結(jié)構(gòu)內(nèi)容賞析特殊句式文章小結(jié)主題歸納??層次大意文章脈絡(luò)教學(xué)難點段落層次篇章研究拓展升華文章主題?...??>根據(jù)這些子標(biāo)題從己獲取的文本中摘取出對應(yīng)文本項,一個子標(biāo)題所包含的??內(nèi)容作為一行,例如上文舉例的《別了,不列顛尼亞》一文,我們將摘取出“結(jié)構(gòu)??
【參考文獻】:
期刊論文
[1]結(jié)合語義相似度改進LDA的文本主題分析[J]. 趙林靜. 計算機工程與設(shè)計. 2019(12)
[2]基于深度學(xué)習(xí)的主題模型研究[J]. 黃佳佳,李鵬偉,彭敏,謝倩倩,徐超. 計算機學(xué)報. 2020(05)
[3]基于動態(tài)權(quán)重的LDA算法[J]. 居亞亞,楊璐,嚴建峰. 計算機科學(xué). 2019(08)
[4]基于學(xué)科核心素養(yǎng)的初中生物學(xué)“主線教學(xué)”——以蘇科版“植物的生殖(第一課時)”教學(xué)為例[J]. 張桂梅. 基礎(chǔ)教育課程. 2019(Z1)
[5]怎樣利用語言知識資源進行語義理解和常識推理[J]. 袁毓林,盧達威. 中文信息學(xué)報. 2018(12)
[6]基于詞語相關(guān)性的對話系統(tǒng)話題分割[J]. 何天文,王紅,劉海燕. 計算機應(yīng)用研究. 2019(04)
[7]基于領(lǐng)域本體的文本分割方法研究[J]. 劉耀,帥遠華,龔幸偉,黃毅. 計算機科學(xué). 2018(01)
[8]基于核心素養(yǎng)的初中生物課堂教學(xué)改進探討[J]. 胡玉華. 課程.教材.教法. 2017(08)
[9]長度分布約束下的摘要文本無監(jiān)督分割算法[J]. 駱俊帆,陳黎,于中華,丁革建,羅謙. 中文信息學(xué)報. 2017(04)
[10]主題模型中的參數(shù)估計方法綜述[J]. 杜慧,陳云芳,張偉. 計算機科學(xué). 2017(S1)
碩士論文
[1]文本分割關(guān)鍵技術(shù)研究[D]. 鄧一平.哈爾濱工業(yè)大學(xué) 2019
[2]高中物理課堂教學(xué)結(jié)構(gòu)研究[D]. 付馨媛.南京師范大學(xué) 2018
[3]基于在線主題模型的追蹤與檢測技術(shù)[D]. 杜慧.南京郵電大學(xué) 2017
[4]面向?qū)υ捨谋镜闹黝}分割技術(shù)研究[D]. 王炳浩.哈爾濱工業(yè)大學(xué) 2016
[5]基于統(tǒng)計模型的文本分割方法及其改進[D]. 李效晉.山東大學(xué) 2014
本文編號:3208083
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3208083.html
最近更新
教材專著