基于滑動窗口的動態(tài)摘要算法
本文選題:動態(tài)摘要 + 文本摘要; 參考:《計算機工程》2007年06期
【摘要】:動態(tài)摘要是根據(jù)查詢檢索詞從文章中動態(tài)提取的摘要。用戶僅僅瀏覽動態(tài)摘要之后就能了解文章中與查詢相關(guān)的部分,進而判斷是否值得詳細閱讀整篇文章。該文根據(jù)搜索引擎對摘要速度和質(zhì)量的要求,提出了一種使用滑動窗口抽取片斷的算法,接著構(gòu)造了摘要評測模型,使用同一個測試集對新動態(tài)摘要算法和Google、百度作對比實驗。結(jié)果證明使用新方法生成的摘要能夠言簡意賅地概括文章的相關(guān)內(nèi)容,在摘要指標的分項測試中取得了和Google基本相同的效果,但明顯要比百度好,綜合評價分別提高了5%和11%。
[Abstract]:Dynamic summary is a summary that is extracted dynamically from the article according to the query key word. After browsing the dynamic summary, the user can understand the query-related part of the article, and then determine whether it is worth reading the whole article. According to the requirements of search engines for the speed and quality of abstracts, this paper proposes an algorithm for extracting segments by sliding windows, and then constructs a model of summary evaluation, and uses the same test set to compare the new dynamic summary algorithm with Google and Baidu. The results show that the abstracts generated by the new method can generalize the relevant contents of the article concisely, and the results are basically the same as those obtained by Google in the itemized test of the summary index, but obviously better than that of Baidu, and the comprehensive evaluation increases by 5% and 11% respectively.
【作者單位】: 鞍山科技大學計算機科學與技術(shù)學院 鞍山科技大學計算機科學與技術(shù)學院 鞍山科技大學計算機科學與技術(shù)學院 鞍山科技大學計算機科學與技術(shù)學院
【基金】:遼寧省自然科學基金資助項目(2004D110)
【分類號】:TP301.6
【參考文獻】
相關(guān)期刊論文 前2條
1 孫春葵,李蕾,楊曉蘭,鐘義信;基于知識的文本摘要系統(tǒng)研究與實現(xiàn)[J];計算機研究與發(fā)展;2000年07期
2 劉挺,吳巖,王開鑄;自動文摘綜述[J];情報科學;1998年01期
【共引文獻】
相關(guān)期刊論文 前7條
1 王繼成 ,武港山 ,周源遠 ,張福炎;一種篇章結(jié)構(gòu)指導的中文Web文檔自動摘要方法[J];計算機研究與發(fā)展;2003年03期
2 晉耀紅,苗傳江;一個基于語境框架的文本特征提取算法[J];計算機研究與發(fā)展;2004年04期
3 胡俊華,楊波,李金屏;自然語言理解研究略述[J];濟南大學學報(社會科學版);2001年05期
4 王萌,何婷婷,張偉;基于概念向量空間模型的中文自動文摘系統(tǒng)[J];計算機工程與應用;2005年01期
5 劉功申,王永成,許一震;小標題識別的意義和方法[J];計算機工程;2002年06期
6 徐曉丹;;中文網(wǎng)頁自動摘要系統(tǒng)的研究[J];計算機與現(xiàn)代化;2006年09期
7 王萌,何婷婷,姬東鴻,王曉榮;基于HowNet概念獲取的中文自動文摘系統(tǒng)[J];中文信息學報;2005年03期
相關(guān)博士學位論文 前4條
1 耿煥同;范例推理與互聯(lián)網(wǎng)文本信息處理研究[D];中國科學技術(shù)大學;2006年
2 何清;機器學習與文本挖掘若干算法研究[D];中國科學院研究生院(計算技術(shù)研究所);2002年
3 周文;基于概念的若干知識表示模型及相關(guān)方法研究[D];上海大學;2007年
4 常娥;古籍智能處理技術(shù)研究[D];南京農(nóng)業(yè)大學;2007年
相關(guān)碩士學位論文 前10條
1 王萌;基于概念向量空間模型的中文自動文摘研究[D];華中師范大學;2005年
2 馬長林;中文自動文摘技術(shù)若干問題的研究[D];華中師范大學;2002年
3 管冬根;Web文檔中信息的獲取與表示研究[D];重慶大學;2003年
4 陳策;基于WEB技術(shù)的競爭情報系統(tǒng)的開發(fā)與研究[D];華北電力大學(河北);2004年
5 李輝;基于語義關(guān)系的摘要提取[D];南京理工大學;2004年
6 關(guān)真珍;基于半督導機器學習的分詞算法的設(shè)計與實現(xiàn)[D];華中科技大學;2004年
7 王江偉;基于最大熵模型的中文命名實體識別[D];南京理工大學;2005年
8 陳志敏;基于主題劃分的Web文檔自動摘要研究[D];揚州大學;2006年
9 李康;自然語言理解中的語義形式化研究[D];西北工業(yè)大學;2007年
10 柴曉麗;自動文摘技術(shù)的研究與應用[D];長春理工大學;2007年
【二級參考文獻】
相關(guān)期刊論文 前1條
1 姜賢塔,陳根才;利用字頻統(tǒng)計及機器學習的自動文摘方法[J];浙江大學學報(理學版);1997年03期
【相似文獻】
相關(guān)期刊論文 前10條
1 孫春葵,李蕾,楊曉蘭,鐘義信;基于知識的文本摘要系統(tǒng)研究與實現(xiàn)[J];計算機研究與發(fā)展;2000年07期
2 王文欣,黃萱菁,吳立德;基于統(tǒng)計方法的漢語自動文摘系統(tǒng)研究[J];計算機應用與軟件;2000年09期
3 鄒劍章;周經(jīng)野;陳益強;胡明清;;基于事件框架的移動摘要方法研究[J];微計算機信息;2010年12期
4 李建鋒;陳佳良;張美華;;一種基于聚類-遺傳算法的文摘提取方法研究[J];計算技術(shù)與自動化;2007年03期
5 張培穎;;基于句子特征和語義距離的文本摘要技術(shù)[J];微計算機應用;2009年07期
6 趙晶;林鴻飛;盧冶;;可視化文本分類樹瀏覽機制[J];小型微型計算機系統(tǒng);2006年03期
7 樹柏涵;閆宏飛;;搜索引擎動態(tài)摘要算法[J];鄭州大學學報(理學版);2009年02期
8 劉茵;李弼程;;基于模糊決策的主旨句生成算法[J];計算機工程與設(shè)計;2007年04期
9 宋人杰;曹振麗;顧寧;;站內(nèi)搜索系統(tǒng)動態(tài)摘要算法的研究[J];計算機工程與設(shè)計;2008年05期
10 周強;施水才;李渝勤;呂學強;;句子重述技術(shù)在中文文本摘要中的應用[J];情報學報;2008年06期
相關(guān)會議論文 前10條
1 伊力亞爾·加爾木哈買提;尼亞子別克·阿不都加勒力;;哈薩克文自動文本摘要方法淺談[A];少數(shù)民族青年自然語言處理技術(shù)研究與進展——第三屆全國少數(shù)民族青年自然語言信息處理、第二屆全國多語言知識庫建設(shè)聯(lián)合學術(shù)研討會論文集[C];2010年
2 王慧芳;張勇;邢春曉;張文珂;楊吉江;;文本摘要算法集成與實現(xiàn)[A];第二十五屆中國數(shù)據(jù)庫學術(shù)會議論文集(二)[C];2008年
3 張龍凱;王厚峰;;文本摘要中的句子抽取方法研究[A];中國計算語言學研究前沿進展(2009-2011)[C];2011年
4 蔣永鍇;葉東毅;;基于稀疏非負矩陣分解的自動多文摘方法[A];中國計算機語言學研究前沿進展(2007-2009)[C];2009年
5 李立燕;楊國緯;;中文自動文摘系統(tǒng)研究[A];第二屆全國信息檢索與內(nèi)容安全學術(shù)會議(NCIRCS-2005)論文集[C];2005年
6 趙國榮;楊爾弘;;事件類時間短語識別[A];全國第八屆計算語言學聯(lián)合學術(shù)會議(JSCL-2005)論文集[C];2005年
7 劉建毅;王菁華;王樅;;基于語言網(wǎng)絡(luò)的關(guān)鍵詞抽取[A];第三屆全國信息檢索與內(nèi)容安全學術(shù)會議論文集[C];2007年
8 武洪萍;周國祥;;Web文本挖掘研究[A];計算機技術(shù)與應用進展·2007——全國第18屆計算機技術(shù)與應用(CACIS)學術(shù)會議論文集[C];2007年
9 王萌;王曉榮;李春貴;唐培和;;基于局部與全局信息的自動文摘算法[A];廣西計算機學會2007年年會論文集[C];2007年
10 周國棟;孔芳;朱巧明;;指代消解:國內(nèi)外研究現(xiàn)狀及趨勢[A];內(nèi)容計算的研究與應用前沿——第九屆全國計算語言學學術(shù)會議論文集[C];2007年
相關(guān)博士學位論文 前4條
1 李莎莎;面向搜索引擎的自然語言處理關(guān)鍵技術(shù)研究[D];國防科學技術(shù)大學;2011年
2 劉娜;文本自動摘要和信息抽取方法及其應用研究[D];大連海事大學;2012年
3 徐昊;基于跨媒體信息和高效圖像編碼算法的圖像搜索關(guān)鍵技術(shù)[D];中國科學技術(shù)大學;2011年
4 韋福如;基于圖模型多文檔自動文摘研究[D];武漢大學;2009年
相關(guān)碩士學位論文 前10條
1 尹顯貴;基于Web的企業(yè)競爭情報服務(wù)平臺中多文本摘要技術(shù)研究[D];昆明理工大學;2012年
2 叢艷;自動文本摘要方法的研究及應用[D];華北電力大學(北京);2004年
3 吳世漢;面向查詢的XML文本摘要技術(shù)[D];江西財經(jīng)大學;2010年
4 苗家;Blog文檔的自動文摘方法研究[D];山東大學;2011年
5 劉霞;基于潛在語義分析的單文本自動摘要方法研究[D];南京郵電大學;2011年
6 王舟;面向論壇信息文本的有效數(shù)據(jù)抽取研究[D];華中科技大學;2011年
7 梁旭;評論文本的對立觀點摘要的研究[D];北京交通大學;2013年
8 王丫;網(wǎng)絡(luò)新聞流中熱點事件識別與跟蹤算法的改進與驗證[D];燕山大學;2007年
9 薛靜;中文信息檢索中相關(guān)算法的研究[D];遼寧科技大學;2007年
10 閆英杰;偏重摘要技術(shù)及其應用研究[D];大連理工大學;2007年
,本文編號:2079220
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2079220.html