天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 社科論文 > 圖書檔案論文 >

基于中文UGC信息源的半自動應(yīng)用本體構(gòu)建研究

發(fā)布時間:2020-07-12 10:49
【摘要】:在社會化媒體成為最受歡迎的信息傳播和網(wǎng)絡(luò)互動方式的今天,UGC信息也如洪水般泛濫。UGC的信息爆炸與價值利用間的矛盾已經(jīng)成為了社會化媒體亟待解決的問題。UGC信息源中知識的管理和利用,既是情報學(xué)發(fā)展的機遇,亦是對情報學(xué)的挑戰(zhàn),因此對UGC信息源中知識的高效組織就顯得尤為重要。本體作為知識組織的方法和技術(shù),不但可以有效的實現(xiàn)對UGC信息源中知識的組織,更能為社會化媒體的語義檢索提供基礎(chǔ)支持。傳統(tǒng)的領(lǐng)域本體是針對學(xué)科領(lǐng)域知識進行構(gòu)建的,因而無法良好的支持基于用戶知識的社會化媒體;與此同時,由于UGC信息的獨特性質(zhì),傳統(tǒng)的本體構(gòu)建方法也無法直接的應(yīng)用到對UGC信息源中知識的組織,因此需要利用UGC信息源進行主題知識的應(yīng)用本體構(gòu)建,以滿足社會化媒體語義檢索的需要。本文在對現(xiàn)有本體構(gòu)建方法比較分析的基礎(chǔ)上,針對UGC信息源的分類和特征,對部分本體構(gòu)建方法進行了改進和擴展,提出了一套結(jié)合UGC信息源中半結(jié)構(gòu)化的維基百科信息和UGC信息源中非結(jié)構(gòu)化的文本資源信息為基礎(chǔ)的本體構(gòu)建方法體系并實現(xiàn)其原型系統(tǒng),不僅為構(gòu)建支持社會化媒體語義檢索的應(yīng)用本體一般方法提供了一定的參考價值,而且對后來的本體研究者具有一定的指導(dǎo)意義。 本論文的基本思路是圍繞UGC信息源的特點,找到適合進行應(yīng)用本體構(gòu)建的UGC信息源,通過對多種本體構(gòu)建方法在UGC信息源中的應(yīng)用進行比較,找到適合于UGC信息源的應(yīng)用本體構(gòu)建方法,并對部分方法進行改進,來實現(xiàn)基于UGC信息源的應(yīng)用本體構(gòu)建。關(guān)鍵內(nèi)容包括UGC信息源的特征分析與選擇、基于UGC信息源的本體概念獲取方法、基于UGC信息源的本體關(guān)系獲取方法、基于UGC信息源的本體維護方法等。文中附有圖56副,表33個。全文約16萬字,共分為7個部分,主要內(nèi)容如下: 第1部分探討本體及本體構(gòu)建的相關(guān)理論基礎(chǔ)。首先對信息科學(xué)領(lǐng)域中的本體論進行了討論,描述和界定了本體的概念,闡述了本體在知識描述、知識共享方面具備的特征,介紹本體的類型以及本體的基本元素;詳細論述了XML、RDF和OWL三種本體描述語言的規(guī)范;討論了本體構(gòu)建的原則、方法和工具。然后針對本體的構(gòu)建方法,闡述了在本體構(gòu)建中概念抽取、關(guān)系抽取和本體維護方法中所涉及的語言學(xué)、邏輯學(xué)和耗散結(jié)構(gòu)理論的基礎(chǔ)知識。 第2部分主要討論了UGC信息源的概念和界定,分析了UGC信息源的內(nèi)容形式和發(fā)布形式,然后從傳播學(xué)和心理學(xué)對其進行了分類,通過找到不同UGC信息源中概念的信息分布特征,選擇適宜進行應(yīng)用本體構(gòu)建的UGC信息源。 第3部分共分為兩個小節(jié),首先探討了基于維基百科的本體概念獲取方法,包括對維基百科中實體概念模型的分析和本體概念的抽取。接著探討了基于UGC信息源文本的本體概念獲取方法。在基于UGC信息源文本的本體概念獲取方法中,首先從宏觀上闡述了本文基于中文UGC信息源的本體概念獲取模型,分別討論了UGC語料庫的獲取與預(yù)處理和本文選用的中文分詞方法;運用維基百科抽取的本體概念與UGC文本的詞性規(guī)則組合建立詞性組合規(guī)則庫,并對UGC信息源文本中的本體概念進行抽;利用基于互信息和左右信息熵的概念過濾方法對本體概念的獨立性和完整性進行過濾,并針對過濾方法的不足,實施基于中心詞的概念補充方法對獲取的本體概念進行補充,最后運用領(lǐng)域相關(guān)度和一致度的篩選方法得到本體概念中的核心概念。 第4部分共分為兩個小節(jié),首先分析了維基百科中的分類關(guān)系,并采用中心詞匹配、共標(biāo)引和目錄表的方法對維基百科中的分類關(guān)系進行抽;接著通過對UGC信息源文本中分類關(guān)系獲取方法的分析,采用基于包含原理、基于模板匹配和基于層次聚類的方法對UGC信息源文本中存在的分類關(guān)系進行抽取。然后針對UGC信息源中存在的非分類關(guān)系,抽取維基百科抽取中出現(xiàn)的可能存在關(guān)系的概念對,利用關(guān)聯(lián)規(guī)則的方法提取UGC信息源文本中出現(xiàn)的可能存在關(guān)系的概念對,并抽取概念對之間的動詞,利用CVF*IVF方法對這些動詞進行過濾,找到合適的動詞作為概念對的謂詞,最后利用對數(shù)似然比的方法找到合適的本體三元組模型。 第5部分在基于前文研究內(nèi)容的基礎(chǔ)上,將本體概念和本體關(guān)系形式化后,依照本體維護的一般過程,提出了基于中文UGC信息源的本體變化捕捉框架,通過對本體維護操作方法和本體維護的一致性約束的分析,提出了基于UGC信息源的本體維護成本算法,并對UGC信息源中的維護需求進行了應(yīng)用舉例和分析。 第6部分構(gòu)建了基于中文UGC信息源的應(yīng)用本體構(gòu)建原型系統(tǒng),提出了系統(tǒng)在分詞、概念獲取、關(guān)系獲取方面的具體需求,并對系統(tǒng)進行了總體設(shè)計以及功能和界面的展示,本文把原型系統(tǒng)分為三大塊以及十小塊功能模塊并對每一功能模塊的系統(tǒng)界面和功能進行了詳細的闡述。 最后對全文進行了總結(jié),指出了研究中存在的不足之處,并對接下來的研究進行了展望,引出作者進一步研究的基礎(chǔ)和方向。
【學(xué)位授予單位】:武漢大學(xué)
【學(xué)位級別】:博士
【學(xué)位授予年份】:2014
【分類號】:G254
【圖文】:

形式化描述,“作者”,資源標(biāo)識符,資源標(biāo)識


圖1-1 RDF/XML形式化描述圖RDF數(shù)據(jù)模型包含3種類型的元素:(1)資源(Resource)和實體(Entities),用統(tǒng)一資源標(biāo)識符URI進行資源標(biāo)識。(2)屬性(Proporties),界定了網(wǎng)絡(luò)資源的各方面,包括特征(Characteristics)、性(Attributes)或關(guān)系。比如“作者”和“主頁”。

圖形描述,三元組,屬性值,資源


(3)屬性值或聲明,即已命名的屬性被賦予的特定資源就是RDF的屬性值或聲明。RDF聲明由3個組成部分,近似于漢語中的主謂賓結(jié)構(gòu):主體,一個特定的資源,用摘圓標(biāo)記;謂詞(Predicates),一個被命名的屬性,用箭頭標(biāo)記;對象(Objects),在該資源中屬性的取值,用矩形標(biāo)記。RDF的基本構(gòu)造就是<資源,屬性,屬性值>,總體也稱之為陳述(Statement)。每一個資源的RDF描述由許多條陳述構(gòu)成。由于陳述由三部分組成,所以也稱為三元組。三元組中的每個元素在RDF中都有明確的名稱定義。因此,RDF中描述資源的最小單元陳述的三元組模型為<主體,謂詞,對象>。

模型圖,實體概念,模型圖


圖3-1維基百科中實體概念模型圖圖3-1是對維基百科中實體“蘋果公司”的三種特征的概念模型簡圖,其中實體用“Entity”標(biāo)識出來,無標(biāo)識的白框內(nèi)的信息表示的是沒有被維基百科標(biāo)注的文本,連接線上的文字表示特征的類型,每個維基百科說明的事物都能夠用這種概念特征模型圖來表示。下文主要對同義詞特征和類型特征的抽取進行介紹,關(guān)系特征只介紹如何抽取與目標(biāo)事物相關(guān)的概念,而關(guān)系特征中關(guān)系的抽取將放在下一章中進行討論。維基百科通過WIKI代碼對維基百科中的條目進行描述,如圖3-2所示。這段代碼表示,手機并不是無繩電話,屬于IT類與通訊類,在IT類中與之相關(guān)的術(shù)語有“無繩電話”、“q!繩桘妐”等

【相似文獻】

相關(guān)期刊論文 前10條

1 王晶;;社會化媒體環(huán)境下下UGC質(zhì)量狀況的調(diào)查與分析[J];創(chuàng)新科技;2015年12期

2 王曉宇;鄭亞琴;;社會化商業(yè)情境下UGC對品牌態(tài)度的影響述評[J];鄭州航空工業(yè)管理學(xué)院學(xué)報;2014年03期

3 施夏珍;;UGC視角下的商業(yè)廣告--以微商廣告為例[J];農(nóng)村經(jīng)濟與科技;2017年02期

4 王瑤瑤;;企業(yè)如何利用UGC更好地進行品牌傳播[J];農(nóng)村經(jīng)濟與科技;2017年14期

5 楊豫玲;;UGC的表現(xiàn)形式對娛樂新聞報道的影響——以微博為例[J];東南傳播;2017年08期

6 王娜;張麗娟;;UGC社區(qū)中的信息過載防控機制研究[J];創(chuàng)新科技;2016年03期

7 王寧寧;;基于微博平臺UGC的魔彈效果分析——以“海底撈”人性化服務(wù)為例[J];新聞世界;2015年05期

8 張振宇;喻發(fā)勝;;公共性與商業(yè)性:UGC媒體發(fā)展的兩難境地——以媒介形態(tài)研究的視角[J];湖北社會科學(xué);2015年08期

9 廖雪娟;;互聯(lián)網(wǎng)背景下UGC網(wǎng)站著作權(quán)問題初探[J];智富時代;2017年03期

10 臧麗娜;;從“用戶產(chǎn)生內(nèi)容”(UGC)拓展在線廣告消費者研究的新方法[J];現(xiàn)代傳播(中國傳媒大學(xué)學(xué)報);2012年10期

相關(guān)會議論文 前10條

1 華迎;王永貴;李兵;;社會化媒體中用戶創(chuàng)造內(nèi)容(UGC)采納行為影響因素研究[A];2013中國信息經(jīng)濟學(xué)會學(xué)術(shù)年會暨博士生論壇論文集[C];2013年

2 蘇宇;;淺析UGC認(rèn)證技術(shù)在新聞報道中的應(yīng)用與實踐[A];中國新聞技術(shù)工作者聯(lián)合會2015年度“新聞科技論文”優(yōu)秀論文集[C];2015年

3 張曉瑩;張桂平;王裴巖;;領(lǐng)域本體構(gòu)建中關(guān)系輔助判斷技術(shù)研究[A];中國計算語言學(xué)研究前沿進展(2009-2011)[C];2011年

4 孫涌;韋小麗;;領(lǐng)域本體構(gòu)建研究及在專利信息服務(wù)中的應(yīng)用[A];江蘇省系統(tǒng)工程學(xué)會第十一屆學(xué)術(shù)年會論文集[C];2009年

5 唐晉韜;王挺;周會平;;面向中文文本的時間本體構(gòu)建和自動擴充[A];第二屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議(NCIRCS-2005)論文集[C];2005年

6 王茹;邢毓華;;古建筑領(lǐng)域本體構(gòu)建研究[A];首屆工程設(shè)計高性能計算(HPC)技術(shù)應(yīng)用論壇論文集[C];2007年

7 郗云峰;;新浪微博,Facebook和Twiteer三大社交媒體用戶生成內(nèi)容(UGC)議程設(shè)置研究[A];“傳播與中國·復(fù)旦論壇”(2013)——網(wǎng)絡(luò)化關(guān)系:新傳播與當(dāng)下中國論文集[C];2013年

8 林軼南;呂智慧;宋凡楨;封茗君;卞筱潔;;用戶生成內(nèi)容(UGC)支撐下的文化景觀遺產(chǎn)數(shù)字檔案系統(tǒng)適用性研究[A];中國風(fēng)景園林學(xué)會2018年會論文集[C];2018年

9 何鵬;張旭峰;;數(shù)字博物館網(wǎng)絡(luò)服務(wù)及虛擬現(xiàn)實技術(shù)應(yīng)用[A];創(chuàng)意科技助力數(shù)字博物館[C];2011年

10 諶貽榮;陸勤;李文捷;崔高穎;;一種基于共享后綴術(shù)語集改進中文核心領(lǐng)域本體構(gòu)建的方法[A];中國計算機語言學(xué)研究前沿進展(2007-2009)[C];2009年

相關(guān)重要報紙文章 前2條

1 山西日報工交部記者 杜鵑;UGC生產(chǎn)模式下“反轉(zhuǎn)新聞”的危害探究[N];山西經(jīng)濟日報;2017年

2 中國出版?zhèn)髅缴虉笥浾?王曉妍;彈幕:UGC藏巨大社交價值[N];中國出版?zhèn)髅缴虉?2014年

相關(guān)博士學(xué)位論文 前10條

1 胡華;基于中文UGC信息源的半自動應(yīng)用本體構(gòu)建研究[D];武漢大學(xué);2014年

2 肖健;軍事醫(yī)學(xué)本體構(gòu)建的理論與方法研究[D];中國人民解放軍軍事醫(yī)學(xué)科學(xué)院;2016年

3 陳云志;肝炎本體構(gòu)建及語義相似度研究[D];浙江大學(xué);2017年

4 蔡曉紅;基于輕度認(rèn)知功能障礙的中醫(yī)藥本體構(gòu)建及應(yīng)用研究[D];湖北中醫(yī)藥大學(xué);2015年

5 徐華林;領(lǐng)域UGC文本中話題-特征關(guān)系抽取及應(yīng)用研究[D];電子科技大學(xué);2016年

6 張亞軍;事件本體構(gòu)建中若干關(guān)鍵技術(shù)的研究[D];上海大學(xué);2017年

7 張旭潔;事件本體構(gòu)建中幾個關(guān)鍵問題的研究[D];上海大學(xué);2013年

8 鐘美;基于Web的空間本體構(gòu)建方法研究[D];武漢大學(xué);2010年

9 李蓉蓉;面向復(fù)雜語義的專利本體構(gòu)建方法研究[D];武漢大學(xué);2014年

10 董俊;基于KDD的領(lǐng)域本體構(gòu)建若干關(guān)鍵問題研究[D];南京郵電大學(xué);2011年

相關(guān)碩士學(xué)位論文 前10條

1 李照東;電影網(wǎng)站UGC對票房收入的影響研究[D];華中師范大學(xué);2018年

2 宋波;傳播偏向論視域下新聞UGC生產(chǎn)模式及發(fā)展路徑研究[D];山東師范大學(xué);2017年

3 楊玉蝶;UGC在網(wǎng)絡(luò)學(xué)習(xí)平臺設(shè)計中的應(yīng)用研究[D];湖南大學(xué);2013年

4 梁敬萍;“UGC商業(yè)性微電影”在品牌傳播中的應(yīng)用研究[D];湖南師范大學(xué);2014年

5 王楚;我國網(wǎng)絡(luò)電視臺引入UGC的策略研究[D];河北大學(xué);2015年

6 吳昊;基于UGC模式的網(wǎng)絡(luò)課堂及其資源存儲和推薦方法研究與實現(xiàn)[D];武漢理工大學(xué);2014年

7 黃林橙;基于社交網(wǎng)絡(luò)平臺的正向UGC羊群效應(yīng)的動力生成機制研究[D];北京郵電大學(xué);2015年

8 冷川;高校BBS的UGC群體分類及正向激勵機制研究[D];北京郵電大學(xué);2016年

9 徐麗;用戶、媒介、信息:UGC的傳播模型[D];暨南大學(xué);2015年

10 李莎;基于UGC的旅游目的地吸引力分析[D];哈爾濱工業(yè)大學(xué);2011年



本文編號:2751836

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/tushudanganlunwen/2751836.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶84eaf***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com
日本丁香婷婷欧美激情| 欧美大胆女人的大胆人体| 中文字幕日韩欧美亚洲午夜| 日韩国产欧美中文字幕| 女生更色还是男生更色| 少妇熟女亚洲色图av天堂| 夫妻性生活一级黄色录像| 国产精品午夜福利免费在线| 日韩精品一级片免费看| 91精品视频免费播放| 亚洲中文字幕在线视频频道| 好吊日成人免费视频公开| 麻豆果冻传媒一二三区| 激情丁香激情五月婷婷| 国产又粗又猛又爽又黄的文字| 国产精品一区二区日韩新区| 日本在线视频播放91| 一区二区在线激情视频| 国产一区欧美午夜福利| 九九热精品视频免费在线播放| 欧美精品一区二区水蜜桃| 亚洲中文字幕在线视频频道| 久久亚洲精品中文字幕| 欧美日韩国产黑人一区| 年轻女房东2中文字幕| 国内外免费在线激情视频| 国产99久久精品果冻传媒| 成人午夜视频在线播放| 欧美色婷婷综合狠狠爱| 中文字幕亚洲视频一区二区| 久久这里只精品免费福利| 隔壁的日本人妻中文字幕版| 成人午夜视频精品一区| 日本午夜福利视频免费观看| 国产精品欧美激情在线播放| 日本特黄特色大片免费观看 | 真实偷拍一区二区免费视频| 国产精品人妻熟女毛片av久久| 久久机热频这里只精品| 老司机这里只有精品视频| 国产一二三区不卡视频|