基于文本特征與關(guān)聯(lián)分析的新聞主題句提取研究
發(fā)布時(shí)間:2024-11-14 20:36
隨著互聯(lián)網(wǎng)技術(shù)飛速發(fā)展,新聞信息數(shù)量快速增長(zhǎng)和傳播。海量新聞信息的產(chǎn)生和迅速傳播豐富了人們的生活,但是也會(huì)帶來(lái)信息過(guò)載問(wèn)題,人們?cè)讷@取信息過(guò)程中浪費(fèi)了大量的時(shí)間。隨著人工智能及自然語(yǔ)言處理技術(shù)的發(fā)展,新聞主題句提取研究和應(yīng)用很好的解決了這一問(wèn)題。新聞主題句提取是自動(dòng)文本摘要等文本自動(dòng)處理應(yīng)用的基礎(chǔ)工作,是自然語(yǔ)言處理領(lǐng)域中重要研究課題,其旨在提取出能夠精簡(jiǎn)、準(zhǔn)確的描述新聞文檔主旨內(nèi)容的句子,F(xiàn)有的主題句提取研究,大多都基于句子或詞的特征分析提取主題句,僅考慮文本統(tǒng)計(jì)特征或者位置特征而忽視文本的語(yǔ)義信息及主題信息,也沒(méi)有充分考慮到文本的上下文背景信息,影響了主題句提取的效果;蛘呋趫D模型分析文檔內(nèi)部句子和詞的關(guān)聯(lián)關(guān)系,以迭代的方式對(duì)語(yǔ)句的重要度進(jìn)行排序。普通的圖模型僅表示了句子和詞的二元關(guān)系而忽視了文檔中句子和句子、詞和詞、詞和句子之間存在多元關(guān)系。新聞的主題句不僅是準(zhǔn)確表示新聞主題內(nèi)容的語(yǔ)句,還是新聞文檔中重要的語(yǔ)句;诂F(xiàn)有研究的局限以及新聞主題句的特點(diǎn),本文提出基于文本特征與關(guān)聯(lián)分析的新聞主題句提取研究方法,將主要從以下兩個(gè)方面進(jìn)行研究:1)文本特征提取的研究。從新聞文本向量表示入...
【文章頁(yè)數(shù)】:55 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
本文編號(hào):4012071
【文章頁(yè)數(shù)】:55 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
基于文本特征與關(guān)聯(lián)分析的新聞主題句提取研究102)Φ作為每個(gè)主題與詞先驗(yàn)參數(shù)服從Dirichlet(β)分布,即Φ<sup>D</sup>irichlet(β),即表示主題~詞分布,總共抽取K個(gè)主題詞。3)對(duì)于文本集中的每個(gè)文檔d以及每個(gè)詞w進(jìn)行如下處理:a)生成一個(gè)主題z服從參....
本文編號(hào):4012071
本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/4012071.html
上一篇:基于人工智能的課程答疑系統(tǒng)的研究
下一篇:沒(méi)有了
下一篇:沒(méi)有了
最近更新
教材專(zhuān)著