天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于中文UGC信息源的半自動(dòng)應(yīng)用本體構(gòu)建研究

發(fā)布時(shí)間:2020-07-12 10:49
【摘要】:在社會(huì)化媒體成為最受歡迎的信息傳播和網(wǎng)絡(luò)互動(dòng)方式的今天,UGC信息也如洪水般泛濫。UGC的信息爆炸與價(jià)值利用間的矛盾已經(jīng)成為了社會(huì)化媒體亟待解決的問(wèn)題。UGC信息源中知識(shí)的管理和利用,既是情報(bào)學(xué)發(fā)展的機(jī)遇,亦是對(duì)情報(bào)學(xué)的挑戰(zhàn),因此對(duì)UGC信息源中知識(shí)的高效組織就顯得尤為重要。本體作為知識(shí)組織的方法和技術(shù),不但可以有效的實(shí)現(xiàn)對(duì)UGC信息源中知識(shí)的組織,更能為社會(huì)化媒體的語(yǔ)義檢索提供基礎(chǔ)支持。傳統(tǒng)的領(lǐng)域本體是針對(duì)學(xué)科領(lǐng)域知識(shí)進(jìn)行構(gòu)建的,因而無(wú)法良好的支持基于用戶知識(shí)的社會(huì)化媒體;與此同時(shí),由于UGC信息的獨(dú)特性質(zhì),傳統(tǒng)的本體構(gòu)建方法也無(wú)法直接的應(yīng)用到對(duì)UGC信息源中知識(shí)的組織,因此需要利用UGC信息源進(jìn)行主題知識(shí)的應(yīng)用本體構(gòu)建,以滿足社會(huì)化媒體語(yǔ)義檢索的需要。本文在對(duì)現(xiàn)有本體構(gòu)建方法比較分析的基礎(chǔ)上,針對(duì)UGC信息源的分類(lèi)和特征,對(duì)部分本體構(gòu)建方法進(jìn)行了改進(jìn)和擴(kuò)展,提出了一套結(jié)合UGC信息源中半結(jié)構(gòu)化的維基百科信息和UGC信息源中非結(jié)構(gòu)化的文本資源信息為基礎(chǔ)的本體構(gòu)建方法體系并實(shí)現(xiàn)其原型系統(tǒng),不僅為構(gòu)建支持社會(huì)化媒體語(yǔ)義檢索的應(yīng)用本體一般方法提供了一定的參考價(jià)值,而且對(duì)后來(lái)的本體研究者具有一定的指導(dǎo)意義。 本論文的基本思路是圍繞UGC信息源的特點(diǎn),找到適合進(jìn)行應(yīng)用本體構(gòu)建的UGC信息源,通過(guò)對(duì)多種本體構(gòu)建方法在UGC信息源中的應(yīng)用進(jìn)行比較,找到適合于UGC信息源的應(yīng)用本體構(gòu)建方法,并對(duì)部分方法進(jìn)行改進(jìn),來(lái)實(shí)現(xiàn)基于UGC信息源的應(yīng)用本體構(gòu)建。關(guān)鍵內(nèi)容包括UGC信息源的特征分析與選擇、基于UGC信息源的本體概念獲取方法、基于UGC信息源的本體關(guān)系獲取方法、基于UGC信息源的本體維護(hù)方法等。文中附有圖56副,表33個(gè)。全文約16萬(wàn)字,共分為7個(gè)部分,主要內(nèi)容如下: 第1部分探討本體及本體構(gòu)建的相關(guān)理論基礎(chǔ)。首先對(duì)信息科學(xué)領(lǐng)域中的本體論進(jìn)行了討論,描述和界定了本體的概念,闡述了本體在知識(shí)描述、知識(shí)共享方面具備的特征,介紹本體的類(lèi)型以及本體的基本元素;詳細(xì)論述了XML、RDF和OWL三種本體描述語(yǔ)言的規(guī)范;討論了本體構(gòu)建的原則、方法和工具。然后針對(duì)本體的構(gòu)建方法,闡述了在本體構(gòu)建中概念抽取、關(guān)系抽取和本體維護(hù)方法中所涉及的語(yǔ)言學(xué)、邏輯學(xué)和耗散結(jié)構(gòu)理論的基礎(chǔ)知識(shí)。 第2部分主要討論了UGC信息源的概念和界定,分析了UGC信息源的內(nèi)容形式和發(fā)布形式,然后從傳播學(xué)和心理學(xué)對(duì)其進(jìn)行了分類(lèi),通過(guò)找到不同UGC信息源中概念的信息分布特征,選擇適宜進(jìn)行應(yīng)用本體構(gòu)建的UGC信息源。 第3部分共分為兩個(gè)小節(jié),首先探討了基于維基百科的本體概念獲取方法,包括對(duì)維基百科中實(shí)體概念模型的分析和本體概念的抽取。接著探討了基于UGC信息源文本的本體概念獲取方法。在基于UGC信息源文本的本體概念獲取方法中,首先從宏觀上闡述了本文基于中文UGC信息源的本體概念獲取模型,分別討論了UGC語(yǔ)料庫(kù)的獲取與預(yù)處理和本文選用的中文分詞方法;運(yùn)用維基百科抽取的本體概念與UGC文本的詞性規(guī)則組合建立詞性組合規(guī)則庫(kù),并對(duì)UGC信息源文本中的本體概念進(jìn)行抽取;利用基于互信息和左右信息熵的概念過(guò)濾方法對(duì)本體概念的獨(dú)立性和完整性進(jìn)行過(guò)濾,并針對(duì)過(guò)濾方法的不足,實(shí)施基于中心詞的概念補(bǔ)充方法對(duì)獲取的本體概念進(jìn)行補(bǔ)充,最后運(yùn)用領(lǐng)域相關(guān)度和一致度的篩選方法得到本體概念中的核心概念。 第4部分共分為兩個(gè)小節(jié),首先分析了維基百科中的分類(lèi)關(guān)系,并采用中心詞匹配、共標(biāo)引和目錄表的方法對(duì)維基百科中的分類(lèi)關(guān)系進(jìn)行抽;接著通過(guò)對(duì)UGC信息源文本中分類(lèi)關(guān)系獲取方法的分析,采用基于包含原理、基于模板匹配和基于層次聚類(lèi)的方法對(duì)UGC信息源文本中存在的分類(lèi)關(guān)系進(jìn)行抽取。然后針對(duì)UGC信息源中存在的非分類(lèi)關(guān)系,抽取維基百科抽取中出現(xiàn)的可能存在關(guān)系的概念對(duì),利用關(guān)聯(lián)規(guī)則的方法提取UGC信息源文本中出現(xiàn)的可能存在關(guān)系的概念對(duì),并抽取概念對(duì)之間的動(dòng)詞,利用CVF*IVF方法對(duì)這些動(dòng)詞進(jìn)行過(guò)濾,找到合適的動(dòng)詞作為概念對(duì)的謂詞,最后利用對(duì)數(shù)似然比的方法找到合適的本體三元組模型。 第5部分在基于前文研究?jī)?nèi)容的基礎(chǔ)上,將本體概念和本體關(guān)系形式化后,依照本體維護(hù)的一般過(guò)程,提出了基于中文UGC信息源的本體變化捕捉框架,通過(guò)對(duì)本體維護(hù)操作方法和本體維護(hù)的一致性約束的分析,提出了基于UGC信息源的本體維護(hù)成本算法,并對(duì)UGC信息源中的維護(hù)需求進(jìn)行了應(yīng)用舉例和分析。 第6部分構(gòu)建了基于中文UGC信息源的應(yīng)用本體構(gòu)建原型系統(tǒng),提出了系統(tǒng)在分詞、概念獲取、關(guān)系獲取方面的具體需求,并對(duì)系統(tǒng)進(jìn)行了總體設(shè)計(jì)以及功能和界面的展示,本文把原型系統(tǒng)分為三大塊以及十小塊功能模塊并對(duì)每一功能模塊的系統(tǒng)界面和功能進(jìn)行了詳細(xì)的闡述。 最后對(duì)全文進(jìn)行了總結(jié),指出了研究中存在的不足之處,并對(duì)接下來(lái)的研究進(jìn)行了展望,引出作者進(jìn)一步研究的基礎(chǔ)和方向。
【學(xué)位授予單位】:武漢大學(xué)
【學(xué)位級(jí)別】:博士
【學(xué)位授予年份】:2014
【分類(lèi)號(hào)】:G254
【圖文】:

形式化描述,“作者”,資源標(biāo)識(shí)符,資源標(biāo)識(shí)


圖1-1 RDF/XML形式化描述圖RDF數(shù)據(jù)模型包含3種類(lèi)型的元素:(1)資源(Resource)和實(shí)體(Entities),用統(tǒng)一資源標(biāo)識(shí)符URI進(jìn)行資源標(biāo)識(shí)。(2)屬性(Proporties),界定了網(wǎng)絡(luò)資源的各方面,包括特征(Characteristics)、性(Attributes)或關(guān)系。比如“作者”和“主頁(yè)”。

圖形描述,三元組,屬性值,資源


(3)屬性值或聲明,即已命名的屬性被賦予的特定資源就是RDF的屬性值或聲明。RDF聲明由3個(gè)組成部分,近似于漢語(yǔ)中的主謂賓結(jié)構(gòu):主體,一個(gè)特定的資源,用摘圓標(biāo)記;謂詞(Predicates),一個(gè)被命名的屬性,用箭頭標(biāo)記;對(duì)象(Objects),在該資源中屬性的取值,用矩形標(biāo)記。RDF的基本構(gòu)造就是<資源,屬性,屬性值>,總體也稱(chēng)之為陳述(Statement)。每一個(gè)資源的RDF描述由許多條陳述構(gòu)成。由于陳述由三部分組成,所以也稱(chēng)為三元組。三元組中的每個(gè)元素在RDF中都有明確的名稱(chēng)定義。因此,RDF中描述資源的最小單元陳述的三元組模型為<主體,謂詞,對(duì)象>。

模型圖,實(shí)體概念,模型圖


圖3-1維基百科中實(shí)體概念模型圖圖3-1是對(duì)維基百科中實(shí)體“蘋(píng)果公司”的三種特征的概念模型簡(jiǎn)圖,其中實(shí)體用“Entity”標(biāo)識(shí)出來(lái),無(wú)標(biāo)識(shí)的白框內(nèi)的信息表示的是沒(méi)有被維基百科標(biāo)注的文本,連接線上的文字表示特征的類(lèi)型,每個(gè)維基百科說(shuō)明的事物都能夠用這種概念特征模型圖來(lái)表示。下文主要對(duì)同義詞特征和類(lèi)型特征的抽取進(jìn)行介紹,關(guān)系特征只介紹如何抽取與目標(biāo)事物相關(guān)的概念,而關(guān)系特征中關(guān)系的抽取將放在下一章中進(jìn)行討論。維基百科通過(guò)WIKI代碼對(duì)維基百科中的條目進(jìn)行描述,如圖3-2所示。這段代碼表示,手機(jī)并不是無(wú)繩電話,屬于IT類(lèi)與通訊類(lèi),在IT類(lèi)中與之相關(guān)的術(shù)語(yǔ)有“無(wú)繩電話”、“q!繩桘妐”等

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 王晶;;社會(huì)化媒體環(huán)境下下UGC質(zhì)量狀況的調(diào)查與分析[J];創(chuàng)新科技;2015年12期

2 王曉宇;鄭亞琴;;社會(huì)化商業(yè)情境下UGC對(duì)品牌態(tài)度的影響述評(píng)[J];鄭州航空工業(yè)管理學(xué)院學(xué)報(bào);2014年03期

3 施夏珍;;UGC視角下的商業(yè)廣告--以微商廣告為例[J];農(nóng)村經(jīng)濟(jì)與科技;2017年02期

4 王瑤瑤;;企業(yè)如何利用UGC更好地進(jìn)行品牌傳播[J];農(nóng)村經(jīng)濟(jì)與科技;2017年14期

5 楊豫玲;;UGC的表現(xiàn)形式對(duì)娛樂(lè)新聞報(bào)道的影響——以微博為例[J];東南傳播;2017年08期

6 王娜;張麗娟;;UGC社區(qū)中的信息過(guò)載防控機(jī)制研究[J];創(chuàng)新科技;2016年03期

7 王寧寧;;基于微博平臺(tái)UGC的魔彈效果分析——以“海底撈”人性化服務(wù)為例[J];新聞世界;2015年05期

8 張振宇;喻發(fā)勝;;公共性與商業(yè)性:UGC媒體發(fā)展的兩難境地——以媒介形態(tài)研究的視角[J];湖北社會(huì)科學(xué);2015年08期

9 廖雪娟;;互聯(lián)網(wǎng)背景下UGC網(wǎng)站著作權(quán)問(wèn)題初探[J];智富時(shí)代;2017年03期

10 臧麗娜;;從“用戶產(chǎn)生內(nèi)容”(UGC)拓展在線廣告消費(fèi)者研究的新方法[J];現(xiàn)代傳播(中國(guó)傳媒大學(xué)學(xué)報(bào));2012年10期

相關(guān)會(huì)議論文 前10條

1 華迎;王永貴;李兵;;社會(huì)化媒體中用戶創(chuàng)造內(nèi)容(UGC)采納行為影響因素研究[A];2013中國(guó)信息經(jīng)濟(jì)學(xué)會(huì)學(xué)術(shù)年會(huì)暨博士生論壇論文集[C];2013年

2 蘇宇;;淺析UGC認(rèn)證技術(shù)在新聞報(bào)道中的應(yīng)用與實(shí)踐[A];中國(guó)新聞技術(shù)工作者聯(lián)合會(huì)2015年度“新聞科技論文”優(yōu)秀論文集[C];2015年

3 張曉瑩;張桂平;王裴巖;;領(lǐng)域本體構(gòu)建中關(guān)系輔助判斷技術(shù)研究[A];中國(guó)計(jì)算語(yǔ)言學(xué)研究前沿進(jìn)展(2009-2011)[C];2011年

4 孫涌;韋小麗;;領(lǐng)域本體構(gòu)建研究及在專(zhuān)利信息服務(wù)中的應(yīng)用[A];江蘇省系統(tǒng)工程學(xué)會(huì)第十一屆學(xué)術(shù)年會(huì)論文集[C];2009年

5 唐晉韜;王挺;周會(huì)平;;面向中文文本的時(shí)間本體構(gòu)建和自動(dòng)擴(kuò)充[A];第二屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議(NCIRCS-2005)論文集[C];2005年

6 王茹;邢毓華;;古建筑領(lǐng)域本體構(gòu)建研究[A];首屆工程設(shè)計(jì)高性能計(jì)算(HPC)技術(shù)應(yīng)用論壇論文集[C];2007年

7 郗云峰;;新浪微博,Facebook和Twiteer三大社交媒體用戶生成內(nèi)容(UGC)議程設(shè)置研究[A];“傳播與中國(guó)·復(fù)旦論壇”(2013)——網(wǎng)絡(luò)化關(guān)系:新傳播與當(dāng)下中國(guó)論文集[C];2013年

8 林軼南;呂智慧;宋凡楨;封茗君;卞筱潔;;用戶生成內(nèi)容(UGC)支撐下的文化景觀遺產(chǎn)數(shù)字檔案系統(tǒng)適用性研究[A];中國(guó)風(fēng)景園林學(xué)會(huì)2018年會(huì)論文集[C];2018年

9 何鵬;張旭峰;;數(shù)字博物館網(wǎng)絡(luò)服務(wù)及虛擬現(xiàn)實(shí)技術(shù)應(yīng)用[A];創(chuàng)意科技助力數(shù)字博物館[C];2011年

10 諶貽榮;陸勤;李文捷;崔高穎;;一種基于共享后綴術(shù)語(yǔ)集改進(jìn)中文核心領(lǐng)域本體構(gòu)建的方法[A];中國(guó)計(jì)算機(jī)語(yǔ)言學(xué)研究前沿進(jìn)展(2007-2009)[C];2009年

相關(guān)重要報(bào)紙文章 前2條

1 山西日?qǐng)?bào)工交部記者 杜鵑;UGC生產(chǎn)模式下“反轉(zhuǎn)新聞”的危害探究[N];山西經(jīng)濟(jì)日?qǐng)?bào);2017年

2 中國(guó)出版?zhèn)髅缴虉?bào)記者 王曉妍;彈幕:UGC藏巨大社交價(jià)值[N];中國(guó)出版?zhèn)髅缴虉?bào);2014年

相關(guān)博士學(xué)位論文 前10條

1 胡華;基于中文UGC信息源的半自動(dòng)應(yīng)用本體構(gòu)建研究[D];武漢大學(xué);2014年

2 肖健;軍事醫(yī)學(xué)本體構(gòu)建的理論與方法研究[D];中國(guó)人民解放軍軍事醫(yī)學(xué)科學(xué)院;2016年

3 陳云志;肝炎本體構(gòu)建及語(yǔ)義相似度研究[D];浙江大學(xué);2017年

4 蔡曉紅;基于輕度認(rèn)知功能障礙的中醫(yī)藥本體構(gòu)建及應(yīng)用研究[D];湖北中醫(yī)藥大學(xué);2015年

5 徐華林;領(lǐng)域UGC文本中話題-特征關(guān)系抽取及應(yīng)用研究[D];電子科技大學(xué);2016年

6 張亞軍;事件本體構(gòu)建中若干關(guān)鍵技術(shù)的研究[D];上海大學(xué);2017年

7 張旭潔;事件本體構(gòu)建中幾個(gè)關(guān)鍵問(wèn)題的研究[D];上海大學(xué);2013年

8 鐘美;基于Web的空間本體構(gòu)建方法研究[D];武漢大學(xué);2010年

9 李蓉蓉;面向復(fù)雜語(yǔ)義的專(zhuān)利本體構(gòu)建方法研究[D];武漢大學(xué);2014年

10 董俊;基于KDD的領(lǐng)域本體構(gòu)建若干關(guān)鍵問(wèn)題研究[D];南京郵電大學(xué);2011年

相關(guān)碩士學(xué)位論文 前10條

1 李照東;電影網(wǎng)站UGC對(duì)票房收入的影響研究[D];華中師范大學(xué);2018年

2 宋波;傳播偏向論視域下新聞UGC生產(chǎn)模式及發(fā)展路徑研究[D];山東師范大學(xué);2017年

3 楊玉蝶;UGC在網(wǎng)絡(luò)學(xué)習(xí)平臺(tái)設(shè)計(jì)中的應(yīng)用研究[D];湖南大學(xué);2013年

4 梁敬萍;“UGC商業(yè)性微電影”在品牌傳播中的應(yīng)用研究[D];湖南師范大學(xué);2014年

5 王楚;我國(guó)網(wǎng)絡(luò)電視臺(tái)引入U(xiǎn)GC的策略研究[D];河北大學(xué);2015年

6 吳昊;基于UGC模式的網(wǎng)絡(luò)課堂及其資源存儲(chǔ)和推薦方法研究與實(shí)現(xiàn)[D];武漢理工大學(xué);2014年

7 黃林橙;基于社交網(wǎng)絡(luò)平臺(tái)的正向UGC羊群效應(yīng)的動(dòng)力生成機(jī)制研究[D];北京郵電大學(xué);2015年

8 冷川;高校BBS的UGC群體分類(lèi)及正向激勵(lì)機(jī)制研究[D];北京郵電大學(xué);2016年

9 徐麗;用戶、媒介、信息:UGC的傳播模型[D];暨南大學(xué);2015年

10 李莎;基于UGC的旅游目的地吸引力分析[D];哈爾濱工業(yè)大學(xué);2011年



本文編號(hào):2751836

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/tushudanganlunwen/2751836.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶84eaf***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com