基于主題詞表和FCA的網(wǎng)頁(yè)語(yǔ)義概念樹構(gòu)建研究
本文關(guān)鍵詞:基于主題詞表和FCA的網(wǎng)頁(yè)語(yǔ)義概念樹構(gòu)建研究
更多相關(guān)文章: 本體 語(yǔ)義概念樹 形式概念分析 主題詞表 詞語(yǔ)相似度
【摘要】:針對(duì)用戶使用網(wǎng)站效率低和網(wǎng)站質(zhì)量差的問題,提出了利用形式概念分析(FCA)來構(gòu)建網(wǎng)頁(yè)語(yǔ)義概念樹的方法。該方法首先利用信息抽取、自然語(yǔ)言處理等技術(shù)對(duì)網(wǎng)頁(yè)集進(jìn)行文本抽取、分詞,提取出描述文本語(yǔ)義的特征詞;再以主題詞表為參照,設(shè)計(jì)基于搜索引擎的詞語(yǔ)相似度算法,將抽取的特征詞全部轉(zhuǎn)換成主題詞表中主題詞,對(duì)將抽取的語(yǔ)義信息轉(zhuǎn)換成形式背景,利用規(guī)則、聚類等技術(shù)對(duì)形式背景進(jìn)行約簡(jiǎn)。最后通過設(shè)計(jì)的建格算法構(gòu)建概念格,實(shí)現(xiàn)概念樹構(gòu)建。實(shí)驗(yàn)結(jié)果表明,利用該方法構(gòu)建的概念樹可以作為網(wǎng)站本體模型的基礎(chǔ),對(duì)語(yǔ)義評(píng)估具有積極的意義,具有一定的應(yīng)用價(jià)值和借鑒意義。
【作者單位】: 中國(guó)人民大學(xué)信息學(xué)院;中國(guó)地質(zhì)調(diào)查局發(fā)展研究中心信息工程室;
【關(guān)鍵詞】: 本體 語(yǔ)義概念樹 形式概念分析 主題詞表 詞語(yǔ)相似度
【基金】:國(guó)家自然科學(xué)基金資助項(xiàng)目(70871115)
【分類號(hào)】:TP393.092;TP391.1
【正文快照】: 隨著信息技術(shù)的快速發(fā)展,特別是互聯(lián)網(wǎng)的應(yīng)用及普及,網(wǎng)絡(luò)信息存儲(chǔ)呈爆炸式增加趨勢(shì);ヂ(lián)網(wǎng)作為信息的主要生產(chǎn)源,已經(jīng)從普通的靜態(tài)文本、圖像的存儲(chǔ)媒介,轉(zhuǎn)向交互式的網(wǎng)絡(luò)信息平臺(tái)發(fā)展。對(duì)于大多數(shù)的交互式產(chǎn)品來說,往往注重對(duì)其技術(shù)先進(jìn)性和功能豐富性的設(shè)計(jì),而忽視產(chǎn)品使用
【參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前4條
1 石倩;陳榮;魯明羽;;基于規(guī)則歸納的信息抽取系統(tǒng)實(shí)現(xiàn)[J];計(jì)算機(jī)工程與應(yīng)用;2008年21期
2 歐陽(yáng)純萍;胡長(zhǎng)軍;李揚(yáng);劉振宇;;一種基于FCA的面向關(guān)系數(shù)據(jù)庫(kù)的本體學(xué)習(xí)方法[J];計(jì)算機(jī)科學(xué);2011年12期
3 張沙清;劉強(qiáng);張平;陳新;;基于本體語(yǔ)義的制造網(wǎng)格構(gòu)建機(jī)理研究[J];計(jì)算機(jī)應(yīng)用研究;2008年08期
4 黃果;周竹榮;;基于領(lǐng)域本體的概念語(yǔ)義相似度計(jì)算研究[J];計(jì)算機(jī)工程與設(shè)計(jì);2007年10期
【共引文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 高煒;梁立;;基于概念匹配的本體映射算法[J];安徽大學(xué)學(xué)報(bào)(自然科學(xué)版);2010年06期
2 聞敬謙;李青;;基于本體的語(yǔ)義相似在維修案例推理中應(yīng)用[J];北京航空航天大學(xué)學(xué)報(bào);2009年02期
3 張?zhí)m芳;;一種基于本體的自然語(yǔ)言語(yǔ)義相似度算法[J];桂林理工大學(xué)學(xué)報(bào);2012年02期
4 江磊;鄭彥;余志虎;;基于概念樹的語(yǔ)義相似度計(jì)算的研究[J];廣東通信技術(shù);2010年08期
5 李從東;高楊;趙映紅;;突發(fā)事件應(yīng)急管理中的情景適應(yīng)度研究[J];電子科技大學(xué)學(xué)報(bào)(社科版);2012年04期
6 向程冠;熊世桓;;基于CSS視覺分塊的Web碎片信息抽取算法[J];計(jì)算機(jī)光盤軟件與應(yīng)用;2013年16期
7 侯麗鑫;鄭山紅;賀海濤;趙輝;韓冬;;融合概念格約簡(jiǎn)的中文領(lǐng)域本體學(xué)習(xí)方法[J];吉林大學(xué)學(xué)報(bào)(信息科學(xué)版);2013年06期
8 王堂;曹寶香;蘆效峰;楊義先;鈕心忻;;基于漢字字段的關(guān)系數(shù)據(jù)庫(kù)數(shù)字水印研究[J];計(jì)算機(jī)科學(xué);2011年12期
9 張忠平;趙海亮;張志惠;;基于本體的概念相似度計(jì)算[J];計(jì)算機(jī)工程;2009年07期
10 胡金柱;周星;舒江波;熊春秀;;基于啟發(fā)式規(guī)則的網(wǎng)頁(yè)主題信息精確定位方法[J];計(jì)算機(jī)應(yīng)用研究;2010年02期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前2條
1 陳立;宋自林;鄭世明;張英;;基于本體的概念相似度計(jì)算研究[A];江蘇省系統(tǒng)工程學(xué)會(huì)第十一屆學(xué)術(shù)年會(huì)論文集[C];2009年
2 左萬(wàn)利;王英;高金;趙靜宇;邵慧勇;;基于本體的語(yǔ)義查詢優(yōu)化[A];第26屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(B輯)[C];2009年
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前7條
1 宋巖;基于多Agent和本體的散雜貨港口集團(tuán)船舶調(diào)度系統(tǒng)研究[D];北京交通大學(xué);2011年
2 蔡盈芳;基于本體的航空產(chǎn)品知識(shí)庫(kù)構(gòu)建研究[D];北京交通大學(xué);2011年
3 賀穎;基于科學(xué)計(jì)量視角的同行評(píng)議專家遴選問題研究[D];天津大學(xué);2008年
4 謝曉蘭;制造網(wǎng)格若干關(guān)鍵技術(shù)研究[D];西安電子科技大學(xué);2009年
5 劉紫玉;多專業(yè)領(lǐng)域本體的構(gòu)建及語(yǔ)義檢索研究[D];北京交通大學(xué);2010年
6 胡燕;基于粗糙集的轉(zhuǎn)爐煉鋼知識(shí)發(fā)現(xiàn)及終點(diǎn)控制模型研究[D];重慶大學(xué);2013年
7 王毅;注塑模改模知識(shí)的增量式發(fā)現(xiàn)研究[D];廣東工業(yè)大學(xué);2014年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 劉洋;基于本體的醫(yī)保審計(jì)知識(shí)庫(kù)構(gòu)建研究[D];哈爾濱工程大學(xué);2010年
2 劉小齊;可復(fù)用測(cè)試用例的分類與智能檢索研究[D];華東理工大學(xué);2011年
3 劉釗;基于映射結(jié)果集合的本體映射算法[D];吉林大學(xué);2011年
4 李帥;基于語(yǔ)義相似度的查詢擴(kuò)展優(yōu)化[D];杭州電子科技大學(xué);2011年
5 蔡開敏;基于本體映射的概念相似性算法研究[D];華中師范大學(xué);2011年
6 塔娜;面向跨語(yǔ)言信息檢索的蒙漢語(yǔ)義詞典構(gòu)建[D];內(nèi)蒙古師范大學(xué);2011年
7 王利鑫;文本自動(dòng)比對(duì)研究與應(yīng)用[D];南京信息工程大學(xué);2011年
8 孫凱;自動(dòng)答疑系統(tǒng)中的問句理解與個(gè)性化推薦算法研究[D];南京信息工程大學(xué);2011年
9 田竹;基于本體和SWRL推理的知識(shí)檢索方法研究[D];電子科技大學(xué);2011年
10 江磊;領(lǐng)域詞典的構(gòu)建及其在語(yǔ)法分析中的應(yīng)用[D];南京郵電大學(xué);2011年
【二級(jí)參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 鄧志鴻,唐世渭,張銘,楊冬青,陳捷;Ontology研究綜述[J];北京大學(xué)學(xué)報(bào)(自然科學(xué)版);2002年05期
2 林亞平,劉云中,周順先,陳治平,蔡立軍;基于最大熵的隱馬爾可夫模型文本信息抽取[J];電子學(xué)報(bào);2005年02期
3 李素建;基于語(yǔ)義計(jì)算的語(yǔ)句相關(guān)度研究[J];計(jì)算機(jī)工程與應(yīng)用;2002年07期
4 李晶;陳恩紅;;Web信息抽取[J];計(jì)算機(jī)科學(xué);2003年06期
5 黃美麗;劉宗田;;基于形式概念分析的領(lǐng)域本體構(gòu)建方法研究[J];計(jì)算機(jī)科學(xué);2006年01期
6 周文;劉宗田;陳慧瓊;;FCA與本體結(jié)合研究的綜述[J];計(jì)算機(jī)科學(xué);2006年02期
7 王洪偉;伊磊;王洪濱;;面向關(guān)系模式的領(lǐng)域本體獲取[J];計(jì)算機(jī)工程;2007年03期
8 潘謙紅,王炬,史忠植;基于屬性論的文本相似度計(jì)算[J];計(jì)算機(jī)學(xué)報(bào);1999年06期
9 李效東,顧毓清;基于DOM的Web信息提取[J];計(jì)算機(jī)學(xué)報(bào);2002年05期
10 吳健,吳朝暉,李瑩,鄧水光;基于本體論和詞匯語(yǔ)義相似度的Web服務(wù)發(fā)現(xiàn)[J];計(jì)算機(jī)學(xué)報(bào);2005年04期
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前1條
1 吳健;基于Web服務(wù)的網(wǎng)絡(luò)化產(chǎn)品配置技術(shù)研究[D];浙江大學(xué);2004年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前1條
1 韓貴來;基于Agent的語(yǔ)義網(wǎng)格通信研究[D];廣東工業(yè)大學(xué);2005年
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 蔣林宙,陳紅亞;對(duì)《中國(guó)分類主題詞表》修訂的特點(diǎn)分析及其建議[J];現(xiàn)代情報(bào);2003年10期
2 ;隆重推出《中國(guó)分類主題詞表》(第二版,電子版)[J];國(guó)家圖書館學(xué)刊;2004年04期
3 羅庭芝,鄭建民;淺論《中國(guó)分類主題詞表》的修訂[J];圖書館;2004年06期
4 卜書慶;汪東波;;網(wǎng)絡(luò)時(shí)代《中國(guó)分類主題詞表》的發(fā)展與應(yīng)用[J];圖書情報(bào)工作;2005年07期
5 秦健;;實(shí)踐中的主題詞表及其應(yīng)用專輯:都柏林元數(shù)據(jù)年會(huì)論文選登[J];現(xiàn)代圖書情報(bào)技術(shù);2006年01期
6 Wonsook Lee;Shigeo Sugimoto;;建立網(wǎng)絡(luò)社區(qū)主題通道的核心主題詞表(英文)[J];現(xiàn)代圖書情報(bào)技術(shù);2006年01期
7 熊偉;第五太卓;劉蓉輝;丁磊雷;;高校校本公文主題詞表編制問題研究[J];陜西教育學(xué)院學(xué)報(bào);2006年01期
8 陳志新;;《中國(guó)分類主題詞表》的兩種對(duì)應(yīng)依據(jù)[J];國(guó)家圖書館學(xué)刊;2006年02期
9 陳志新;;《中國(guó)分類主題詞表》的理論基礎(chǔ)[J];圖書館理論與實(shí)踐;2006年03期
10 趙永蓮;;淺談《中國(guó)分類主題詞表》電子版的應(yīng)用[J];科技情報(bào)開發(fā)與經(jīng)濟(jì);2006年15期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前1條
1 雷瑜良;楊應(yīng)全;吳偉蘭;;《高等教育分類主題詞表》編制與特點(diǎn)分析[A];2010年中國(guó)索引學(xué)會(huì)年會(huì)暨學(xué)術(shù)研討會(huì)論文集[C];2010年
中國(guó)重要報(bào)紙全文數(shù)據(jù)庫(kù) 前1條
1 秦秋;中醫(yī)藥主題詞表國(guó)家標(biāo)準(zhǔn)出臺(tái)[N];中國(guó)醫(yī)藥報(bào);2005年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前4條
1 仲云云;電子政務(wù)主題詞表的構(gòu)建及應(yīng)用研究[D];南京農(nóng)業(yè)大學(xué);2007年
2 牛雅楠;WordNet和《中國(guó)分類主題詞表》的映射研究[D];山西大學(xué);2011年
3 李力人;基于林業(yè)主題詞表語(yǔ)義關(guān)系網(wǎng)的文獻(xiàn)聚類[D];北京林業(yè)大學(xué);2010年
4 李艷;分眾分類與受控詞表的集成研究[D];山西大學(xué);2013年
,本文編號(hào):807779
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/807779.html