基于主觀強(qiáng)度Bootstrapping優(yōu)化的微博觀點(diǎn)句識(shí)別
發(fā)布時(shí)間:2017-11-05 10:15
本文關(guān)鍵詞:基于主觀強(qiáng)度Bootstrapping優(yōu)化的微博觀點(diǎn)句識(shí)別
更多相關(guān)文章: 觀點(diǎn)句識(shí)別 主觀性特征 主觀強(qiáng)度 Bootstrapping優(yōu)化
【摘要】:微博觀點(diǎn)句識(shí)別對(duì)于情感分類、輿情調(diào)查等具有重要的作用,為了盡量減少訓(xùn)練語料的標(biāo)注工作,文章提出一種主觀強(qiáng)度Bootstrapping優(yōu)化的方法來識(shí)別微博觀點(diǎn)句。首先,采用優(yōu)勢(shì)率和獨(dú)立主觀表達(dá)能力計(jì)算主觀性特征的主觀強(qiáng)度,再結(jié)合其在測(cè)試集微博句子中的權(quán)重信息計(jì)算微博句子的主觀強(qiáng)度并進(jìn)行排序;然后,進(jìn)行Bootstrapping優(yōu)化,以訓(xùn)練集中主客觀句子特征分布的相對(duì)熵作為閾值將排序序列中置信度高的主客觀句子分別加入到訓(xùn)練集中,重新訓(xùn)練主觀性特征的主觀強(qiáng)度,迭代進(jìn)行直至不再有新句子加入。實(shí)驗(yàn)結(jié)果表明,本方法具有一定的可行性和有效性,Bootstrapping過程的引入可以極大優(yōu)化觀點(diǎn)句識(shí)別的結(jié)果。
【作者單位】: 山東師范大學(xué)信息科學(xué)與工程學(xué)院;山東省分布式計(jì)算機(jī)軟件新技術(shù)重點(diǎn)實(shí)驗(yàn)室;山東交通學(xué)院信息科學(xué)與電氣工程學(xué)院;
【基金】:國家自然科學(xué)基金(61373148) 國家社科基金(12BXW040) 教育部人文社科基金(14YJC860042) 山東省自然科學(xué)基金(ZR2012FM038,ZR2014FL010) 山東省優(yōu)秀中青年科學(xué)家獎(jiǎng)勵(lì)基金(BS2013DX033) 山東省高等學(xué)校科技計(jì)劃(J12LN21) 山東省社科規(guī)劃項(xiàng)目(12BXWJ01)
【分類號(hào)】:TP393.092;TP391.1
【正文快照】: 0引言由于微博具有消息發(fā)布迅速、發(fā)布手段多樣、內(nèi)容結(jié)構(gòu)自由、便捷交互等特點(diǎn),受到越來越多人的青睞,用戶每天更新并傳播的微博高達(dá)數(shù)千萬條,微博正日益成為信息傳播、意見共享、觀點(diǎn)交流的實(shí)時(shí)性平臺(tái)。微博平臺(tái)經(jīng)常占據(jù)信息發(fā)布的起源點(diǎn)和信息傳播的制高點(diǎn),許多備受人們關(guān),
本文編號(hào):1143753
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/1143753.html
最近更新
教材專著