基于語(yǔ)義網(wǎng)絡(luò)和BOW模型的中文議題框架量化分析
發(fā)布時(shí)間:2021-08-06 21:02
【目的/意義】在大數(shù)據(jù)和信息爆炸的背景下,為改善傳統(tǒng)中文議題框架分析方法中信效度難以保證、分析效率低下等問(wèn)題,本文提出基于語(yǔ)義網(wǎng)絡(luò)和Bag-of–words(BOW)模型兩種方法結(jié)合的量化模型。【方法/過(guò)程】該模型首先利用語(yǔ)義網(wǎng)絡(luò)分析提取樣本的議題框架種類(lèi)和整體集群分布,然后利用BOW模型對(duì)每個(gè)分析單元進(jìn)行議題量化統(tǒng)計(jì)分析。最后,以《人民日?qǐng)?bào)》轉(zhuǎn)基因相關(guān)報(bào)道文本為例,驗(yàn)證量化模型議題分析的可行性和有效性!窘Y(jié)果/結(jié)論】結(jié)果表明,該方法可高效完成分析,同時(shí)保證了議題框架分析的客觀(guān)性。
【文章來(lái)源】:情報(bào)科學(xué). 2017,35(05)北大核心CSSCI
【文章頁(yè)數(shù)】:6 頁(yè)
【部分圖文】:
語(yǔ)義網(wǎng)絡(luò)分析邏輯基于恩特曼的觀(guān)點(diǎn)——框架通過(guò)使用一系列特定的詞【2】
,不考慮語(yǔ)法結(jié)構(gòu)和詞序【14】。但是,在中文語(yǔ)境下,統(tǒng)計(jì)詞頻時(shí)要特別注意分詞的精準(zhǔn)性,因?yàn)橹形脑~語(yǔ)由可獨(dú)立存在的單字組成。本文將介紹如何利用語(yǔ)義網(wǎng)絡(luò)分析提取框架、BOW模型對(duì)議題框架進(jìn)行量化分析。2議題框架量化模型建構(gòu)本文提出的議題框架量化模型(Quantitativemodelofissueframeanalysis)主要基于語(yǔ)義網(wǎng)絡(luò)分析和BOW模型,是各階段數(shù)據(jù)分析的定性和定量的結(jié)合,如圖2所示。第一部分為基于語(yǔ)義網(wǎng)絡(luò)提取整體樣本的框架,第二部分利用BOW模型是提取每篇文本的框架,并進(jìn)行統(tǒng)計(jì)。圖2議題框架量化分析模型情報(bào)科學(xué)第35卷第5期2017年5月·業(yè)務(wù)研究·-101-
拿芏齲???到裘艿慕詰慊?治??一集群,從而集群內(nèi)的節(jié)點(diǎn)之間聯(lián)系緊密程度要比與網(wǎng)絡(luò)中其他節(jié)點(diǎn)的聯(lián)系緊密程度要強(qiáng)【18】。最后,對(duì)每個(gè)集群的議題,進(jìn)行編碼,即可得整體樣本的議題框架以及分布。2.2基于BOW模型的議題框架作為一個(gè)分析單元的文本可能同時(shí)包含幾個(gè)議題框架,傳統(tǒng)的框架分析傾向于給每個(gè)單元賦予一個(gè)議題,即使賦予同一篇單元多個(gè)議題框架,也無(wú)法精確到不同議題在同一單元中的比重。此處采用擴(kuò)展的BOW模型【14】,對(duì)每個(gè)單元所含的議題框架進(jìn)行精確統(tǒng)計(jì),并大大提高分析效率。圖3年份——詞語(yǔ)矩陣示意圖注:Y1到Y(jié)l表示年份(year);D1到Dm表示每篇文檔(document);T1到Tn表示BOW模型中詞語(yǔ)(term);C1到Ck表示聚類(lèi)分析后有意義的集群(community);大括號(hào)表示包含的意思本研究中,我們?cè)贐OW模型基礎(chǔ)上進(jìn)行了改進(jìn)和擴(kuò)展,圖3描述了此擴(kuò)展的BOW模型。其中,T(term)表示語(yǔ)義網(wǎng)絡(luò)中的詞語(yǔ),D(document)表示每篇文檔,并定義在第i篇文章(Di)中第j個(gè)詞(Tj)的值fij(Termscore):fij=wjFijNi(1)此處,wj(weightfactor,權(quán)重)表示Tj的權(quán)重(本研究中,所有語(yǔ)意網(wǎng)絡(luò)中的詞語(yǔ)經(jīng)過(guò)詞頻篩選,權(quán)重設(shè)定為1);Fij表示Tj在Di中的詞頻;Ni表示Di的詞數(shù)目;谖臋n——詞語(yǔ)矩陣以及年份與文檔的從屬關(guān)系,通過(guò)求和即可得到每年中不同議題的報(bào)道量。同樣的思路,基于文檔——詞語(yǔ)矩陣以及集群與詞語(yǔ)的從屬關(guān)系,通過(guò)求和計(jì)算可得到每個(gè)集群中不同年份的報(bào)道量Spq,Spq=∑k=0nfij,Di∈Y
【參考文獻(xiàn)】:
期刊論文
[1]微信公眾平臺(tái)的轉(zhuǎn)基因新聞報(bào)道框架偏向性研究[J]. 褚建勛,紀(jì)嬌嬌,黃晟鵬. 情報(bào)科學(xué). 2016(11)
[2]內(nèi)容分析法在公共管理學(xué)研究中的應(yīng)用[J]. 劉偉. 中國(guó)行政管理. 2014(06)
[3]社會(huì)網(wǎng)絡(luò)分析在組織管理研究中的應(yīng)用與展望[J]. 黎耀奇,謝禮珊. 管理學(xué)報(bào). 2013(01)
[4]內(nèi)容分析法在網(wǎng)絡(luò)傳播研究中的應(yīng)用[J]. 范龍. 情報(bào)科學(xué). 2010(06)
本文編號(hào):3326483
【文章來(lái)源】:情報(bào)科學(xué). 2017,35(05)北大核心CSSCI
【文章頁(yè)數(shù)】:6 頁(yè)
【部分圖文】:
語(yǔ)義網(wǎng)絡(luò)分析邏輯基于恩特曼的觀(guān)點(diǎn)——框架通過(guò)使用一系列特定的詞【2】
,不考慮語(yǔ)法結(jié)構(gòu)和詞序【14】。但是,在中文語(yǔ)境下,統(tǒng)計(jì)詞頻時(shí)要特別注意分詞的精準(zhǔn)性,因?yàn)橹形脑~語(yǔ)由可獨(dú)立存在的單字組成。本文將介紹如何利用語(yǔ)義網(wǎng)絡(luò)分析提取框架、BOW模型對(duì)議題框架進(jìn)行量化分析。2議題框架量化模型建構(gòu)本文提出的議題框架量化模型(Quantitativemodelofissueframeanalysis)主要基于語(yǔ)義網(wǎng)絡(luò)分析和BOW模型,是各階段數(shù)據(jù)分析的定性和定量的結(jié)合,如圖2所示。第一部分為基于語(yǔ)義網(wǎng)絡(luò)提取整體樣本的框架,第二部分利用BOW模型是提取每篇文本的框架,并進(jìn)行統(tǒng)計(jì)。圖2議題框架量化分析模型情報(bào)科學(xué)第35卷第5期2017年5月·業(yè)務(wù)研究·-101-
拿芏齲???到裘艿慕詰慊?治??一集群,從而集群內(nèi)的節(jié)點(diǎn)之間聯(lián)系緊密程度要比與網(wǎng)絡(luò)中其他節(jié)點(diǎn)的聯(lián)系緊密程度要強(qiáng)【18】。最后,對(duì)每個(gè)集群的議題,進(jìn)行編碼,即可得整體樣本的議題框架以及分布。2.2基于BOW模型的議題框架作為一個(gè)分析單元的文本可能同時(shí)包含幾個(gè)議題框架,傳統(tǒng)的框架分析傾向于給每個(gè)單元賦予一個(gè)議題,即使賦予同一篇單元多個(gè)議題框架,也無(wú)法精確到不同議題在同一單元中的比重。此處采用擴(kuò)展的BOW模型【14】,對(duì)每個(gè)單元所含的議題框架進(jìn)行精確統(tǒng)計(jì),并大大提高分析效率。圖3年份——詞語(yǔ)矩陣示意圖注:Y1到Y(jié)l表示年份(year);D1到Dm表示每篇文檔(document);T1到Tn表示BOW模型中詞語(yǔ)(term);C1到Ck表示聚類(lèi)分析后有意義的集群(community);大括號(hào)表示包含的意思本研究中,我們?cè)贐OW模型基礎(chǔ)上進(jìn)行了改進(jìn)和擴(kuò)展,圖3描述了此擴(kuò)展的BOW模型。其中,T(term)表示語(yǔ)義網(wǎng)絡(luò)中的詞語(yǔ),D(document)表示每篇文檔,并定義在第i篇文章(Di)中第j個(gè)詞(Tj)的值fij(Termscore):fij=wjFijNi(1)此處,wj(weightfactor,權(quán)重)表示Tj的權(quán)重(本研究中,所有語(yǔ)意網(wǎng)絡(luò)中的詞語(yǔ)經(jīng)過(guò)詞頻篩選,權(quán)重設(shè)定為1);Fij表示Tj在Di中的詞頻;Ni表示Di的詞數(shù)目;谖臋n——詞語(yǔ)矩陣以及年份與文檔的從屬關(guān)系,通過(guò)求和即可得到每年中不同議題的報(bào)道量。同樣的思路,基于文檔——詞語(yǔ)矩陣以及集群與詞語(yǔ)的從屬關(guān)系,通過(guò)求和計(jì)算可得到每個(gè)集群中不同年份的報(bào)道量Spq,Spq=∑k=0nfij,Di∈Y
【參考文獻(xiàn)】:
期刊論文
[1]微信公眾平臺(tái)的轉(zhuǎn)基因新聞報(bào)道框架偏向性研究[J]. 褚建勛,紀(jì)嬌嬌,黃晟鵬. 情報(bào)科學(xué). 2016(11)
[2]內(nèi)容分析法在公共管理學(xué)研究中的應(yīng)用[J]. 劉偉. 中國(guó)行政管理. 2014(06)
[3]社會(huì)網(wǎng)絡(luò)分析在組織管理研究中的應(yīng)用與展望[J]. 黎耀奇,謝禮珊. 管理學(xué)報(bào). 2013(01)
[4]內(nèi)容分析法在網(wǎng)絡(luò)傳播研究中的應(yīng)用[J]. 范龍. 情報(bào)科學(xué). 2010(06)
本文編號(hào):3326483
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3326483.html
最近更新
教材專(zhuān)著