天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 軟件論文 >

基于自動(dòng)摘要的無障礙移動(dòng)新聞系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)

發(fā)布時(shí)間:2018-08-06 09:49
【摘要】:隨著移動(dòng)互聯(lián)網(wǎng)的飛速發(fā)展和移動(dòng)智能設(shè)備的大規(guī)模普及,人們獲取新聞信息的渠道也越來越多。視障群體由于在視力方面的缺陷,僅能依靠聽覺和觸覺從外界獲取信息,不能像健全人一樣便捷地使用手機(jī)、平板電腦等智能設(shè)備,獲取新聞信息的途徑較為匱乏,選擇性極少,F(xiàn)有的新聞?lì)悜?yīng)用軟件很少有針對(duì)視障群體做過適配和優(yōu)化,視障人士幾乎無法使用,閱讀效率非常低。因此,開發(fā)一款面向視障群體的無障礙新聞?lì)愜浖哂惺种匾囊饬x。在此背景下,實(shí)驗(yàn)室與中國盲文出版社合作希望能開發(fā)一款適合視障群體使用的無障礙移動(dòng)新聞系統(tǒng)。本文首先從保證新聞數(shù)據(jù)的全面性和多樣性出發(fā),提出并實(shí)現(xiàn)了一種支持動(dòng)態(tài)頁面爬取的新聞網(wǎng)絡(luò)爬蟲。在URL爬取方面,該爬蟲以無界面瀏覽器Htm1Unit為基礎(chǔ),通過模擬用戶點(diǎn)擊或滑動(dòng)等行為觸發(fā)動(dòng)態(tài)網(wǎng)頁的腳本事件,從而解決了動(dòng)態(tài)頁面中URL難以獲取的問題。然后,在URL去噪方面,本文設(shè)計(jì)了一種基于正則表達(dá)式的去噪方法,可以有效去除非新聞鏈接,從而提高新聞網(wǎng)絡(luò)爬蟲的效率,避免資源浪費(fèi)。在最后新聞數(shù)據(jù)提取方面,采集并定制模版,實(shí)現(xiàn)了高準(zhǔn)確率的基于模版的新聞信息提取方法。其次,為了提高視障群體閱覽新聞的效率,提出并實(shí)現(xiàn)了一種基于TextRank改進(jìn)的自動(dòng)摘要方法。本文首先采用BM25相似度計(jì)算方法實(shí)現(xiàn)了經(jīng)典的TextRank算法,然后將新聞標(biāo)題和小標(biāo)題的結(jié)構(gòu)作用考慮進(jìn)來,通過計(jì)算新聞標(biāo)題、小標(biāo)題與各句子間的相似度得到調(diào)整向量,最后通過調(diào)整向量影響各句子收斂后的TextRank得分,經(jīng)過實(shí)驗(yàn)分析改進(jìn)后的方法優(yōu)于經(jīng)典的TextRank方法。最后,本文在以上研究的基礎(chǔ)上設(shè)計(jì)并實(shí)現(xiàn)了面向Android平臺(tái)的基于自動(dòng)摘要的無障礙移動(dòng)新聞系統(tǒng),視障群體通過無障礙客戶端可以更便捷更高效地獲取新聞信息。
[Abstract]:With the rapid development of mobile Internet and the large-scale popularization of mobile intelligent equipment, there are more and more channels for people to obtain news information. The Visual Handicapped groups can only rely on hearing and touch to obtain information from the outside world because of their defects in vision. They can not use mobile phones, tablet computers and other intelligent devices as conveniently as the sound people. The ways of news information are scarce and less selective. There are few existing news applications that have been adapted and optimized for the visually impaired group, the visually impaired people are almost impossible to use, and the reading efficiency is very low. Therefore, it is of great significance to develop an obstacle free news software oriented to the visually impaired group. In cooperation with the Chinese Braille Press, we hope to develop an obstacle free mobile news system suitable for the visually impaired group. This paper first proposes and implements a news network crawler that supports dynamic page crawling from the integrity and diversity of the news data. In the URL crawling, the crawler is with no interface browser Htm1Unit. On the basis of simulating the script events of dynamic web pages by simulating the behavior of user clicking or sliding, the problem that URL is difficult to obtain in the dynamic page is solved. Then, in the aspect of URL denoising, this paper designs a denoising method based on regular expression, which can effectively remove non news links and thus improve the efficiency of the news network crawler. Avoid the waste of resources. In the end of the news data extraction, collect and customize the template to achieve a high accurate template based news information extraction method. Secondly, in order to improve the efficiency of the visual barrier group reading news, a new automatic summary method based on TextRank is proposed and implemented. This paper first uses the BM25 similarity computing party. The classical TextRank algorithm is realized by the method, and then the structure of news headlines and small headlines is taken into account. By calculating the news headlines and the similarity between the small headlines and each sentence, the adjustment vector is obtained. Finally, the TextRank score after the convergence of each sentence is influenced by the adjustment vector, and the improved method is superior to the classic TextR after the experimental analysis. Ank method. Finally, on the basis of the above research, this paper designs and implements an obstacle free mobile news system based on automatic summary based on the Android platform. The visual barrier group can obtain news information more conveniently and efficiently through the barrier free client.
【學(xué)位授予單位】:浙江大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2017
【分類號(hào)】:TP391.1

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 ;中英文自動(dòng)摘要系統(tǒng)軟件問世[J];情報(bào)理論與實(shí)踐;2001年01期

2 沈洲,王永成,許一震,吳芳芳;一種面向新聞文獻(xiàn)的自動(dòng)摘要系統(tǒng)的研究與實(shí)踐[J];計(jì)算機(jī)工程;2000年09期

3 李愛紅;試論自動(dòng)摘要技術(shù)[J];圖書情報(bào)工作;2000年04期

4 沈洲,王永成,韓客松;一種基于主題敏感辭分析的新聞文獻(xiàn)自動(dòng)摘要系統(tǒng)的研究與實(shí)踐[J];高技術(shù)通訊;2001年09期

5 王彩霞;試論自動(dòng)摘要技術(shù)[J];晉圖學(xué)刊;2003年02期

6 張雷生,萬紹俊,許鵬文;簡單中文自動(dòng)摘要系統(tǒng)研究[J];裝備指揮技術(shù)學(xué)院學(xué)報(bào);2004年03期

7 王建會(huì);周水庚;胡運(yùn)發(fā);;基于聚類的自動(dòng)摘要[J];模式識(shí)別與人工智能;2004年03期

8 黃水清;李志燕;梁剛;;面向計(jì)算機(jī)類文獻(xiàn)的自動(dòng)摘要系統(tǒng)的研究與實(shí)現(xiàn)[J];圖書與情報(bào);2006年03期

9 陳珂;殷凡;;中文自動(dòng)摘要綜述[J];福建電腦;2007年02期

10 李念峰;;基于自動(dòng)摘要的網(wǎng)絡(luò)情報(bào)收集系統(tǒng)研究[J];現(xiàn)代情報(bào);2007年11期

相關(guān)會(huì)議論文 前8條

1 章彥星;張銘;鄧志鴻;;基于特征的用戶評(píng)論自動(dòng)摘要[A];第26屆中國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(B輯)[C];2009年

2 吳中勤;黃萱菁;吳立德;;基于有監(jiān)督分類技術(shù)的文本自動(dòng)摘要研究[A];第二屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議(NCIRCS-2005)論文集[C];2005年

3 王暉;馬軍;;面向Web論壇的多文檔摘要方法[A];第五屆全國信息檢索學(xué)術(shù)會(huì)議論文集[C];2009年

4 張奇;黃萱菁;吳立德;;一種新的句子相似度度量及其在文本自動(dòng)摘要中的應(yīng)用[A];NCIRCS2004第一屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2004年

5 李芳;何婷婷;;面向查詢的多模式自動(dòng)摘要研究[A];第五屆全國青年計(jì)算語言學(xué)研討會(huì)論文集[C];2010年

6 劉娜;肖智博;路瑩;唐曉君;肖鵬;;自適應(yīng)主題融合的多文檔自動(dòng)摘要算法[A];2013年中國智能自動(dòng)化學(xué)術(shù)會(huì)議論文集(第五分冊)[C];2013年

7 王荀;李素建;宋濤;姜伯平;;服務(wù)于內(nèi)容側(cè)面發(fā)現(xiàn)的框架識(shí)別[A];中國計(jì)算語言學(xué)研究前沿進(jìn)展(2009-2011)[C];2011年

8 楊瀟;馬軍;楊同峰;杜言琦;邵海敏;;基于主題模型LDA的多文檔自動(dòng)摘要[A];第五屆全國信息檢索學(xué)術(shù)會(huì)議論文集[C];2009年

相關(guān)博士學(xué)位論文 前2條

1 劉娜;文本自動(dòng)摘要和信息抽取方法及其應(yīng)用研究[D];大連海事大學(xué);2012年

2 耿煥同;范例推理與互聯(lián)網(wǎng)文本信息處理研究[D];中國科學(xué)技術(shù)大學(xué);2006年

相關(guān)碩士學(xué)位論文 前10條

1 王馨;網(wǎng)絡(luò)新聞熱點(diǎn)發(fā)現(xiàn)研究[D];河北大學(xué);2015年

2 李子健;專題摘要自動(dòng)生成技術(shù)研究[D];浙江大學(xué);2015年

3 熊嬌;基于詞項(xiàng)—句子—文檔三層圖模型的多文檔自動(dòng)摘要[D];江西師范大學(xué);2015年

4 程園;輿情分析中維吾爾文文本自動(dòng)摘要研究[D];新疆大學(xué);2015年

5 梁入文;基于文本意見挖掘的煙臺(tái)大學(xué)教學(xué)評(píng)價(jià)系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D];電子科技大學(xué);2015年

6 楊瑞;在線網(wǎng)絡(luò)中文本自動(dòng)摘要系統(tǒng)研究和實(shí)現(xiàn)[D];南京航空航天大學(xué);2014年

7 唐亞娟;基于文本挖掘的糧食情報(bào)分析技術(shù)與系統(tǒng)實(shí)現(xiàn)[D];河南工業(yè)大學(xué);2015年

8 董非;基于圖的主觀性多文本自動(dòng)摘要方法研究和實(shí)現(xiàn)[D];上海交通大學(xué);2015年

9 吳燦麗;基于改進(jìn)HMM下自動(dòng)摘要的生成[D];浙江理工大學(xué);2017年

10 官宸宇;面向事件的社交媒體文本自動(dòng)摘要研究[D];武漢大學(xué);2017年

,

本文編號(hào):2167352

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2167352.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶f3f1d***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com