天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 搜索引擎論文 >

基于本體的視頻服務網(wǎng)站監(jiān)管技術研究

發(fā)布時間:2018-04-24 23:23

  本文選題:本體 + 本體自動構建; 參考:《中國科學技術大學》2013年博士論文


【摘要】:隨著網(wǎng)絡帶寬的提高、網(wǎng)絡用戶的增加,以及數(shù)碼產品的普及,網(wǎng)上視頻內容日益豐富,收看網(wǎng)絡視頻的用戶急劇增多,視頻服務網(wǎng)站也不斷涌現(xiàn)。然而由于開放性、匿名性以及資源缺乏統(tǒng)一管理的特點,互聯(lián)網(wǎng)在帶給人們便利的同時,許多不良視頻服務網(wǎng)站也混入其中。這些不良視頻服務網(wǎng)站對青少年的健康成長和社會的穩(wěn)定有著非常不利的影響。盡管國家已加大了打擊力度,然而事實上不良視頻服務網(wǎng)站仍然存在,且通過搜索引擎的幫助獲取的難度很低。因此如何自動發(fā)現(xiàn)和準確識別不良視頻服務網(wǎng)站從而對其進行有效監(jiān)管成為了值得研究的問題。 目前視頻服務網(wǎng)站監(jiān)管主要存在的難點和問題包括:(1)視頻服務網(wǎng)站的自動發(fā)現(xiàn),目前僅中國的網(wǎng)站數(shù)量就已經(jīng)達到230萬之多,如何從互聯(lián)網(wǎng)的海洋中自動發(fā)現(xiàn)視頻服務網(wǎng)站成為了視頻服務網(wǎng)站監(jiān)管的重要問題;(2)支持網(wǎng)站健康性評估的領域本體自動構建技術,不良視頻領域本體可以提供計算機可理解的不良視頻的語義描述,從而為后續(xù)的不良視頻網(wǎng)頁識別以及網(wǎng)站的健康性評估提供語義基礎,傳統(tǒng)的領域本體自動構建方法多依賴于自然語言處理技術,受限于自然語言處理工具的性能,構建出的領域本體的質量往往不高;(3)基于領域本體的網(wǎng)站健康性分析評估技術,在擁有了不良視頻領域本體之后,如何設計出一種可以利用本體中的文字和結構信息的網(wǎng)頁相關度計算方法從而準確地計算出網(wǎng)站的健康性,就成為了值得研究的問題。針對這三個問題,本論文的主要研究工作和創(chuàng)新點如下: 1.提出了視頻服務網(wǎng)站的自動發(fā)現(xiàn)方法。 針對視頻服務網(wǎng)站自動發(fā)現(xiàn)的問題,本文首先提出了一種基于元搜索的視頻服務網(wǎng)站的自動發(fā)現(xiàn)方法,該方法設計了一種關鍵詞更新和評價機制用以向元搜索系統(tǒng)提供高質量的搜索關鍵詞,元搜索的結果將作為初始網(wǎng)站列表提供給主題爬行模塊以進一步發(fā)現(xiàn)更多的視頻服務網(wǎng)站。通過分析網(wǎng)頁的標簽特征和候選播放器的視覺特征,本文提出了一種基于多特征多策略的視頻播放頁識別方法。在確定一個視頻播放頁后,將該頁面存為播放頁模板,后續(xù)視頻播放頁的識別利用其與播放頁模板的相似性來判定。在對搜索過程所遇到的網(wǎng)頁及鏈接主題相關度的分析基礎上,本文提出了一種URL的預期剩余能量模型用以計算每個方向的搜索能量,進而決定主題爬蟲的搜索方向和步長。實驗中,基于多特征多策略的視頻播放頁識別準確率和召回率分別達到了99.21%和99.24%,而基于預期剩余能量模型的主題爬行算法則明顯優(yōu)于對比算法的性能。 2.提出了基于超鏈接結構圖聚類的領域本體自動構建方法。 針對領域本體自動構建的問題,著重研究了領域概念的自動識別和領域概念間同義/近義關系的自動構建方法。首先,本文提出了基于超鏈接結構圖聚類的領域概念識別方法,該方法首先利用網(wǎng)絡爬蟲從指定的入口地址處深度受限廣度優(yōu)先遍歷Wiki頁面,構建關于某特定領域的無向超鏈接結構圖。然后利用得到的網(wǎng)頁數(shù)據(jù)庫和詞匯表構建詞匯-文檔矩陣,使用潛在語義索引算法和余弦相似度計算節(jié)點間的相似度,將該相似度作為相應邊的權重,再利用有權圖滲濾算法對有權無向鏈接結構圖進行聚類,并對聚類結果進行評估,進而得到相應的領域概念。針對概念間同義/近義關系的自動構建,本文首先構建鏈接-詞語的共現(xiàn)矩陣,使用余弦相似度度量,再使用自底向上的凝聚型層次聚類算法對詞語進行聚類,從而得到詞語間的同義/近義關系。實驗結果顯示,領域概念識別的準確率在top-10階段接近96%,而同義/近義聯(lián)系的識別準確率則接近90%。 3.提出了基于領域本體的網(wǎng)站健康性評估方法。 針對網(wǎng)站健康性的計算問題,本文提出了一種基于領域本體的網(wǎng)站健康性計算方法。傳統(tǒng)的網(wǎng)頁分類和相關性計算方法使用的文檔表示模型通常假設特征項之間是相互獨立的,并且特征詞的權值大都基于詞頻信息,忽略了詞的位置及上下文信息,而已有的本體分類系統(tǒng)只是將本體用于輔助分類的過程,無法有效利用到本體自身的結構和文字信息。針對這些問題,本文提出了一種基于網(wǎng)頁概念樹和領域本體樹匹配的網(wǎng)頁健康性計算方法。該方法首先提出了一種可以不依賴于獨立性假設的新的網(wǎng)頁文檔表示模型,并在該模型的基礎上使用了一種可以利用到詞語的位置及上下文信息的詞語加權算法,最后在新的網(wǎng)頁表示模型的基礎上,提出了一種可以有效利用領域本體的結構及文字信息的網(wǎng)頁健康性計算方法。實驗結果顯示,該方法的不良網(wǎng)頁識別準確率、召回率和F1值分別為96%、95.7%和95.8%,視頻服務網(wǎng)站健康性評估的準確率則達到了95%。 上述方法已部分應用于國家863項目“結合語義的視頻網(wǎng)站自動發(fā)現(xiàn)與分析評估服務”課題中的主題聚集搜索和網(wǎng)站內容分析評估部分,并將應用于國家科技支撐計劃“增強型搜索系統(tǒng)架構、關鍵技術及測試規(guī)范的研究”以及公安部重點研究計劃項目“多媒體服務網(wǎng)站監(jiān)管技術研究”之中。
[Abstract]:With the increase of network bandwidth , the increase of network users , and the popularization of digital products , the online video content is increasingly rich , and the users of network video are increasing rapidly , and the website of video service is also emerging . However , because of the openness , anonymity and lack of uniform management of resources , many poor video service websites have been mixed . However , the website of poor video service is still in existence , and the difficulty of getting through the help of the search engine is very low . Therefore , it is worth studying how to automatically discover and accurately identify the website of poor video service so as to effectively supervise it .

At present , the difficulties and problems existing in the video service website supervision include : ( 1 ) the automatic discovery of the video service website , the number of websites in China is now more than 2.3 million , and how to automatically discover the video service website from the sea of the Internet becomes an important issue of the video service website supervision ;
( 2 ) Support website health evaluation field ontology automatic construction technology , the poor video field ontology can provide the semantic description of the computer - understandable poor video , thus providing the semantic foundation for the subsequent poor video webpage recognition and the health evaluation of the website , the traditional domain ontology automatic construction method relies on natural language processing technology , is limited by the performance of the natural language processing tool , and the quality of the constructed field ontology is often not high ;
( 3 ) Based on the field ontology ' s website health analysis and evaluation technology , how to design a web page affinity calculation method which can utilize the text and the structure information in the ontology to calculate the health of the website accurately after having the main body of the poor video , has become a question worth studying . For these three problems , the main research and innovation points of this paper are as follows :

1 . The automatic discovery method of video service website is proposed .

This paper presents a method for automatically discovering video service websites based on meta - search . The method designs a keyword updating and evaluation mechanism to provide high - quality search keywords to the meta - search system .

2 . The automatic construction method of domain ontology based on hyperlink structure clustering is proposed .

In order to solve the problem of auto - construction of domain ontology , we focus on the automatic identification of domain concept and the automatic construction method of the same meaning / near - meaning relationship between domain concepts . First of all , this paper proposes a domain concept recognition method based on hyperlink structure clustering . Firstly , we construct vocabulary - document matrix from the depth - limited breadth of the specified portal address . Then , we use the obtained web page database and vocabulary to construct vocabulary - document matrix . Then , we use the right - graph percolation algorithm to cluster the words . The results show that the accuracy rate of domain concept recognition is close to 96 % in top - 10 stage , while the accuracy rate of synonymous / near - sense contact is close to 90 % .

3 . A health evaluation method based on domain ontology is proposed .

This paper presents a method for calculating the health of a website based on the domain ontology . A new method for calculating the health of the web page based on the concept tree of the web page and the contextual information is presented in this paper .

The above - mentioned methods have been applied to the topic aggregation search and website content analysis and evaluation part of the project " Automatic Discovery and Analysis Evaluation Service " of the National 863 Project , and will be applied to the National Science and Technology Support Plan " Enhanced Search System Architecture , Key Technologies and Test Specifications " and the " Research on Supervision Technology of Multimedia Service Website " of the key research program of the Ministry of Public Security .

【學位授予單位】:中國科學技術大學
【學位級別】:博士
【學位授予年份】:2013
【分類號】:TP391.1

【參考文獻】

相關期刊論文 前5條

1 鄧志鴻,唐世渭,張銘,楊冬青,陳捷;Ontology研究綜述[J];北京大學學報(自然科學版);2002年05期

2 樊小輝;石晨光;;本體構建研究綜述[J];艦船電子工程;2011年06期

3 楊博;劉大有;金弟;馬海賓;;復雜網(wǎng)絡聚類方法[J];軟件學報;2009年01期

4 黃芳;劉友華;張克狀;李寅;;結合鏈接結構和共現(xiàn)分析的同義詞自動識別方法[J];現(xiàn)代情報;2009年08期

5 易榮鋒;朱六璋;尹文科;;互聯(lián)網(wǎng)視頻摘要信息自動抽取[J];計算機系統(tǒng)應用;2010年10期

相關博士學位論文 前2條

1 杜文華;本體的構建及其在數(shù)字圖書館中的應用研究[D];武漢大學;2005年

2 鐘美;基于Web的空間本體構建方法研究[D];武漢大學;2010年

相關碩士學位論文 前1條

1 易榮鋒;互聯(lián)網(wǎng)視頻信息獲取技術研究與實現(xiàn)[D];中國科學技術大學;2010年

,

本文編號:1798730

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1798730.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶8e4cd***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com
五月婷婷欧美中文字幕| 国产午夜福利不卡片在线观看| 日本一级特黄大片国产| 日本美国三级黄色aa| 中文字幕日韩欧美亚洲午夜| 亚洲综合色婷婷七月丁香| 亚洲综合精品天堂夜夜| 日韩综合国产欧美一区| 久久热麻豆国产精品视频| 日韩专区欧美中文字幕| 精品人妻一区二区三区四区久久| 99久久精品一区二区国产| 三级理论午夜福利在线看| 我想看亚洲一级黄色录像| 精品国产一区二区欧美| 加勒比系列一区二区在线观看 | 国产色一区二区三区精品视频| 在线观看国产成人av天堂野外| 亚洲最新一区二区三区| 老熟妇2久久国内精品| 日韩精品一区二区一牛| 日韩精品免费一区二区三区| 国产精品免费精品一区二区| 国内精品偷拍视频久久| 男女午夜在线免费观看视频 | 精品伊人久久大香线蕉综合| 欧美精品一区久久精品| 午夜精品一区二区三区国产| 高潮日韩福利在线观看| 亚洲精品高清国产一线久久| 好吊日在线观看免费视频| 99精品国产自在现线观看| 国产日韩中文视频一区| 国产亚洲不卡一区二区| 中文字幕一区二区熟女| 国产一区二区在线免费| 搡老熟女老女人一区二区| 国产欧美日韩一级小黄片| 爱在午夜降临前在线观看| 大香蕉伊人一区二区三区| 中文字幕高清免费日韩视频|