面向新媒體的新聞縮寫關(guān)鍵技術(shù)研究
本文關(guān)鍵詞:面向新媒體的新聞縮寫關(guān)鍵技術(shù)研究
更多相關(guān)文章: 特征 句子壓縮 啟發(fā)式規(guī)則 句子選擇
【摘要】:隨著新媒體的快速發(fā)展,網(wǎng)絡(luò)新聞呈現(xiàn)出雨后春筍的態(tài)勢,人們面臨信息選擇困難、信息超載等問題。大量的冗余信息一方面增加了用戶閱讀信息的時間,另一方面還增加了用戶發(fā)現(xiàn)和理解熱點話題的困難。移動設(shè)備的普及更是帶動了新聞客戶端的大量產(chǎn)生,這些移動設(shè)備的特點是屏幕小,信息量過大時不能單屏顯示,分屏又會導(dǎo)致閱讀的不便。因此,新聞自動縮寫技術(shù)應(yīng)運(yùn)而生,新聞縮寫不僅可以獲得簡約而明了、有深度且有態(tài)度的內(nèi)容資源,而且能提升網(wǎng)絡(luò)新聞的品質(zhì),實現(xiàn)網(wǎng)絡(luò)新聞的增值閱讀。本文對新聞標(biāo)題和新聞?wù)牡目s寫技術(shù)展開一系列研究。針對新聞標(biāo)題,借助于詞對齊技術(shù)應(yīng)用規(guī)則與統(tǒng)計結(jié)合的方法進(jìn)行壓縮。針對新聞?wù)膬?nèi)容,提出句子壓縮與句子選擇結(jié)合的框架來生成新聞?wù)牡膲嚎s結(jié)果。該框架中,首先應(yīng)用句子多特征融合的方法進(jìn)行摘要句子預(yù)選擇,根據(jù)句子多特征權(quán)重排序抽取最具有代表性的句子。然后針對預(yù)選擇的摘要句子,提出一種基于關(guān)鍵詞的啟發(fā)式句子壓縮算法,該算法作為中間階段被應(yīng)用于生成原句子的壓縮變體。最后通過整數(shù)線性規(guī)劃算法去除冗余,選取出信息量最大的最終新聞?wù)。在評測方面,本文提出一種句子壓縮基礎(chǔ)上的自動摘要評測方法。該方法通過信息的重要性、語法規(guī)范性和壓縮比對壓縮后的句子進(jìn)行打分,隨后在摘要的評測中結(jié)合句子壓縮分?jǐn)?shù)計算出準(zhǔn)確率、召回率以及F值分別為79.26%、76.32%和77.76%。實驗結(jié)果表明,本文提出的新聞縮寫算法切實可行,能對給定的新聞文章自動生成一段連貫且具有象征性的高密度新聞?wù)?br/> 【關(guān)鍵詞】:特征 句子壓縮 啟發(fā)式規(guī)則 句子選擇
【學(xué)位授予單位】:北京理工大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:G210.7;TP391.1
【目錄】:
- 摘要5-6
- Abstract6-10
- 第1章 緒論10-17
- 1.1 研究背景和意義10-11
- 1.2 國內(nèi)外研究現(xiàn)狀11-14
- 1.3 論文的主要工作14-15
- 1.4 論文的組織形式15-17
- 第2章 相關(guān)理論及方法17-28
- 2.1 新聞縮寫的預(yù)處理技術(shù)17-20
- 2.1.1 中文分詞17
- 2.1.2 命名實體識別17-18
- 2.1.3 句法分析18-20
- 2.2 縮寫常用算法模型20-23
- 2.2.1 噪聲信道模型20-21
- 2.2.2 剪枝模型21-22
- 2.2.3 同步樹替代文法模型22-23
- 2.3 摘要提取相關(guān)算法23-27
- 2.3.1 整數(shù)線性規(guī)劃23-25
- 2.3.2 句子增強(qiáng)技術(shù)25-26
- 2.3.3 社交網(wǎng)絡(luò)打分機(jī)制26-27
- 2.4 本章小結(jié)27-28
- 第3章 新聞內(nèi)容單句縮寫算法28-43
- 3.1 研究概述28
- 3.2 新聞標(biāo)題縮寫算法28-36
- 3.2.1 詞對齊技術(shù)30
- 3.2.2 基于GIZA++的詞對齊30-33
- 3.2.3 基于同義詞林的詞對齊33-35
- 3.2.4 基于規(guī)則與統(tǒng)計的句子壓縮算法35-36
- 3.3 基于關(guān)鍵詞的啟發(fā)式句子壓縮算法36-42
- 3.3.1 關(guān)鍵詞提取36-38
- 3.3.2 啟發(fā)式的語言學(xué)規(guī)則38-41
- 3.3.3 壓縮結(jié)果修復(fù)41-42
- 3.4 本章小結(jié)42-43
- 第4章 基于句子多特征與冗余處理的新聞?wù)膲嚎s算法43-49
- 4.1 研究概述43-44
- 4.2 句子權(quán)重計算44-46
- 4.2.1 基于特征融合的詞語權(quán)重44-45
- 4.2.2 句子多特征45-46
- 4.2.3 句子權(quán)重值46
- 4.3 句子相似度計算46-47
- 4.4 基于整數(shù)線性規(guī)劃的句子選擇算法47-48
- 4.5 本章小結(jié)48-49
- 第5章 實驗系統(tǒng)原型設(shè)計與結(jié)果分析49-58
- 5.1 實驗環(huán)境49
- 5.2 實驗系統(tǒng)原型設(shè)計49-50
- 5.3 實驗結(jié)果分析50-56
- 5.3.1 新聞標(biāo)題縮寫算法實驗分析50-52
- 5.3.2 新聞?wù)恼槿〖翱s寫實驗分析52-56
- 5.4 本章小結(jié)56-58
- 結(jié)論58-60
- 參考文獻(xiàn)60-64
- 附錄 新聞縮寫示例原文64-66
- 攻讀學(xué)位期間發(fā)表的論文與研究成果清單66-67
- 致謝67
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 范洪濤;新聞標(biāo)題專著《美國盼兮》出版[J];新聞與寫作;2000年01期
2 盛書剛;一條有誤導(dǎo)傾向的新聞標(biāo)題[J];語文建設(shè);2000年02期
3 郭銀土;“畫龍點睛”──淺議新聞標(biāo)題的作用和制作[J];福建商業(yè)高等?茖W(xué)校學(xué)報;2000年03期
4 王同倫;報刊新聞標(biāo)題中潛性語言開發(fā)和應(yīng)用分析[J];連云港教育學(xué)院學(xué)報;2000年01期
5 程躍慧;報紙新聞標(biāo)題的形式美[J];新聞前哨;2000年03期
6 張澤勇;新聞標(biāo)題的魅力[J];新聞前哨;2000年06期
7 程金太;準(zhǔn)確是新聞標(biāo)題的生命[J];采.寫.編;2000年01期
8 黃頌明;報紙口語化新聞標(biāo)題的傳播優(yōu)勢[J];新聞通訊;2000年09期
9 張保田;;新聞的制題藝術(shù)[J];記者搖籃;2000年11期
10 侯恩貴;;讓新聞標(biāo)題“跳起來”[J];記者搖籃;2000年06期
中國重要會議論文全文數(shù)據(jù)庫 前9條
1 陳麗昭;;漢英新聞標(biāo)題的語法特點對比[A];福建省外國語文學(xué)會2002年會論文集[C];2002年
2 李娜;;俄語報刊中新聞標(biāo)題的修辭手法趣談—以Русская газета為例[A];福建省外國語文學(xué)會2013年年會暨海峽兩岸翻譯學(xué)術(shù)研討會論文集[C];2013年
3 劉稟誠;;新聞標(biāo)題的分句隱含[A];江西省語言學(xué)會2008年年會論文集[C];2008年
4 朱思;丁浩;;自然災(zāi)難新聞標(biāo)題的翻譯[A];福建省外國語文學(xué)會2009年年會暨學(xué)術(shù)研討會論文集[C];2009年
5 衛(wèi)曉莉;;《今日氣象》氣象新聞分析[A];中國氣象學(xué)會2005年年會論文集[C];2005年
6 姚紅衛(wèi);;談?wù)劗?dāng)代體育新聞標(biāo)題的語言藝術(shù)[A];第八屆全國體育科學(xué)大會論文摘要匯編(二)[C];2007年
7 陳朝暉;;有關(guān)法制新聞標(biāo)題的質(zhì)疑與思考[A];中國傳媒大學(xué)第五屆全國新聞學(xué)與傳播學(xué)博士生學(xué)術(shù)研討會論文集[C];2011年
8 彭建武;季英奎;;新聞標(biāo)題中的冒號在心理空間建構(gòu)中的作用[A];第四屆全國認(rèn)知語言學(xué)研討會論文摘要匯編[C];2006年
9 彭建武;季英奎;;新聞標(biāo)題中的冒號在心理空間建構(gòu)中的作用[A];中國英漢語比較研究會第七次全國學(xué)術(shù)研討會論文集[C];2006年
中國重要報紙全文數(shù)據(jù)庫 前10條
1 靜秀麗;淺談新聞標(biāo)題如何出新[N];赤峰日報;2007年
2 尉穎穎;災(zāi)難新聞標(biāo)題小議[N];中國新聞出版報;2006年
3 劉海賢邋原《北海晚報》副總編輯,現(xiàn)《北海日報》新聞研究室主任;新聞標(biāo)題:要解讀新聞的“核”[N];中華新聞報;2008年
4 馬凡德;淺談新聞標(biāo)題的制作[N];中華新聞報;2008年
5 王元中南財經(jīng)政法大學(xué)公安學(xué)院;淺談公安新聞標(biāo)題要注意的問題[N];今日信息報;2009年
6 喀什日報社 王文博;淺談電視與報紙的新聞標(biāo)題差異性[N];喀什日報(漢);2010年
7 駐馬店電視臺 張淑貞;藝術(shù)化新聞標(biāo)題特色[N];駐馬店日報;2011年
8 長治日報社 曹云;精心打造吸人眼球的新聞標(biāo)題[N];山西黨校報;2012年
9 鄭旭輝;新舊媒體新聞標(biāo)題的“合”與“離”[N];中國新聞出版報;2013年
10 劉輝;淺談如何做好新聞標(biāo)題[N];安徽經(jīng)濟(jì)報;2004年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前3條
1 白麗娜;空間的制約與語言的表達(dá)[D];華東師范大學(xué);2013年
2 王燕;新聞?wù)Z體研究[D];復(fù)旦大學(xué);2003年
3 黃裕\,
本文編號:956273
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/956273.html