基于多語言本體的中英跨語言信息檢索模型及實現(xiàn)
發(fā)布時間:2021-04-04 20:40
[目的 /意義]構(gòu)建一個基于多語言本體的跨語言信息檢索模型,有助于用戶通過該模型使用自己熟悉的語言來獲取不同語種的信息資源。[方法 /過程]通過本體設(shè)計及檢索模型功能模塊設(shè)計建立一個基于數(shù)字出版領(lǐng)域本體的中英跨語言信息檢索模型,并利用Java語言及Lucene搜索引擎架構(gòu)對該模型進(jìn)行編程實現(xiàn)。[結(jié)果/結(jié)論]多語言領(lǐng)域本體具有明確、形式化、共享、概念化、結(jié)構(gòu)清晰等特征,可以作為語義層應(yīng)用于跨語言信息檢索系統(tǒng)之中,實現(xiàn)信息資源的語義表達(dá)。經(jīng)測試,本文構(gòu)建的模型能夠較好地實現(xiàn)分詞、查詢擴(kuò)展和語義關(guān)聯(lián)等功能,促進(jìn)跨語言信息檢索向語義層次發(fā)展。
【文章來源】:圖書情報工作. 2017,61(01)北大核心CSSCI
【文章頁數(shù)】:9 頁
【部分圖文】:
使用類SearchGUI創(chuàng)建的圖形交互界面
??書館和學(xué)術(shù)用戶市潮,在Eclipse控制臺輸出的分詞結(jié)果為“愛思唯爾代表跨國科技出版集團(tuán)不斷培育圖書館學(xué)術(shù)用戶市場Elsevier”,相關(guān)選項為“[STM出版,數(shù)字期刊,EBSCO,出版單位,Scopus,數(shù)字學(xué)術(shù)出版,ScienceDirect,EES,案例,LexisNexis,數(shù)字期刊出版,IFLA,Brill,Unicorn,Millennium,WorldShare,共享空間,Apollo,Sierra,MODS,ISBD,Symphony,In-genta,Dspace,Library.Solution,Aleph,Polaris,World-Cat,DC,NLM,OpenDLib,OCLC,CrossRef,Horizon,相關(guān)概念,DOI,Alma,DOAJ]”,圖3為第1組測試的圖形界面:圖3第1組測試3.3.2第2組測試跨語言信息檢索功能測試檢索式為“Mobilephonepublishing,onlinegamesandinternetadvertisingareinthedevelopmentstage”,在Eclipse控制臺輸出的分詞結(jié)果為“手機(jī)出版網(wǎng)絡(luò)游戲網(wǎng)絡(luò)廣告106
司莉,陳雨雪,曾粵亮.基于多語言本體的中英跨語言信息檢索模型及實現(xiàn)[J].圖書情報工作,2017,61(1):100-108.發(fā)展階段Mobilephonepublishing手機(jī)出版onlinegames網(wǎng)絡(luò)游戲andinternetadvertising網(wǎng)絡(luò)廣告areinthedevelopment發(fā)展stage階段”,相關(guān)選項為“[彩鈴,彩信,手機(jī)出版物,移動出版,網(wǎng)易游戲,網(wǎng)絡(luò)游戲出版,網(wǎng)絡(luò)出版物,網(wǎng)絡(luò)廣告產(chǎn)業(yè)]”,圖4為第2組測試的圖形界面:圖4第2組測試3.3.3第3組測試相關(guān)查詢功能測試檢索式為“SGML與XML是典型的描述性標(biāo)記語言”,在Eclipse控制臺輸出的分詞結(jié)果為“典型描述性標(biāo)記語言SGMLXML”,相關(guān)選項為“[XML,HTML,內(nèi)容加工,相關(guān)概念,DTD,RDF,ISO,格式標(biāo)準(zhǔn),DocBook,XSL,復(fù)合出版,ECIP,S1000D,XPS,標(biāo)記語言,XMLSchema,技術(shù)標(biāo)準(zhǔn),DREL,信息組織,EPUB,Ne-wsML,OFD,SGML,ODRL,W3C,語義網(wǎng),ODF,DI-TA工具,DITAworks,動態(tài)出版,DC,DITA,XHTML,CEBX,CNONIX,DITAStorm]”,圖5為第3組測試的圖形界面:圖5第3組測試雙擊相關(guān)選項列表中的“DITA”,程序便以“DI-TA”為檢索詞進(jìn)行第二次檢索,在Eclipse控制臺輸出“DITA”的相關(guān)選項為“[DTD,元數(shù)據(jù),全媒體出版,版式渲染,DITA技術(shù)委員會,DITA工具,XMLSchema,內(nèi)容重組,XSL-FO,DocBook,URI,XSD,內(nèi)容驗證,內(nèi)容加工,IBM,復(fù)合出版,Adobe,流程再造,XML,信息組織,XSL,技術(shù)標(biāo)準(zhǔn),內(nèi)容資源整合,OASIS,按需出版]”,測試結(jié)果如圖6所示:圖6點擊相關(guān)查詢測試從以上3組測試的結(jié)果可以看出,本文實現(xiàn)的基于數(shù)字出版領(lǐng)域本體的跨語言信息檢索模型基本滿足了設(shè)計需求。其中,第1組測試表明模型能對單字詞及純數(shù)字進(jìn)行一定的處理,第2組測試驗證了模型使用英語進(jìn)行檢索時,反饋
【參考文獻(xiàn)】:
期刊論文
[1]基于主題詞表的數(shù)字出版領(lǐng)域本體構(gòu)建[J]. 司莉,陳雨雪,莊曉喆. 出版科學(xué). 2015(06)
[2]信息檢索模型及其在跨語言信息檢索中的應(yīng)用進(jìn)展[J]. 吳丹,齊和慶. 現(xiàn)代情報. 2009(07)
[3]基于本體的跨語言信息檢索模型和關(guān)鍵技術(shù)研究[J]. 郝嘉樹,王惠臨,劉耀. 情報科學(xué). 2009(02)
[4]結(jié)合本體論和統(tǒng)計方法的跨語言信息檢索模型[J]. 鄭德權(quán),李生,趙鐵軍,于浩. 哈爾濱工業(yè)大學(xué)學(xué)報. 2008(01)
[5]跨語言信息檢索模型應(yīng)用研究[J]. 劉偉成,孫吉紅. 情報雜志. 2007(10)
[6]本體在跨語言信息檢索中的應(yīng)用機(jī)制研究[J]. 吳丹,王惠臨. 圖書情報工作. 2006(09)
[7]本體驅(qū)動的跨語言信息檢索研究[J]. 吳丹. 現(xiàn)代圖書情報技術(shù). 2006(05)
[8]基于本體的跨語言信息檢索模型[J]. 王進(jìn),陳恩紅,張振亞,王煦法. 中文信息學(xué)報. 2004(03)
博士論文
[1]面向復(fù)雜語義的專利本體構(gòu)建方法研究[D]. 李蓉蓉.武漢大學(xué) 2014
碩士論文
[1]基于跨語言信息檢索的企業(yè)競爭情報收集系統(tǒng)模型研究[D]. 孫耀.山東科技大學(xué) 2011
[2]基于形式概念分析的領(lǐng)域本體構(gòu)建方法研究[D]. 張云中.吉林大學(xué) 2009
[3]基于本體的跨語言全文檢索模型的研究[D]. 吳芳.北京郵電大學(xué) 2006
本文編號:3118454
【文章來源】:圖書情報工作. 2017,61(01)北大核心CSSCI
【文章頁數(shù)】:9 頁
【部分圖文】:
使用類SearchGUI創(chuàng)建的圖形交互界面
??書館和學(xué)術(shù)用戶市潮,在Eclipse控制臺輸出的分詞結(jié)果為“愛思唯爾代表跨國科技出版集團(tuán)不斷培育圖書館學(xué)術(shù)用戶市場Elsevier”,相關(guān)選項為“[STM出版,數(shù)字期刊,EBSCO,出版單位,Scopus,數(shù)字學(xué)術(shù)出版,ScienceDirect,EES,案例,LexisNexis,數(shù)字期刊出版,IFLA,Brill,Unicorn,Millennium,WorldShare,共享空間,Apollo,Sierra,MODS,ISBD,Symphony,In-genta,Dspace,Library.Solution,Aleph,Polaris,World-Cat,DC,NLM,OpenDLib,OCLC,CrossRef,Horizon,相關(guān)概念,DOI,Alma,DOAJ]”,圖3為第1組測試的圖形界面:圖3第1組測試3.3.2第2組測試跨語言信息檢索功能測試檢索式為“Mobilephonepublishing,onlinegamesandinternetadvertisingareinthedevelopmentstage”,在Eclipse控制臺輸出的分詞結(jié)果為“手機(jī)出版網(wǎng)絡(luò)游戲網(wǎng)絡(luò)廣告106
司莉,陳雨雪,曾粵亮.基于多語言本體的中英跨語言信息檢索模型及實現(xiàn)[J].圖書情報工作,2017,61(1):100-108.發(fā)展階段Mobilephonepublishing手機(jī)出版onlinegames網(wǎng)絡(luò)游戲andinternetadvertising網(wǎng)絡(luò)廣告areinthedevelopment發(fā)展stage階段”,相關(guān)選項為“[彩鈴,彩信,手機(jī)出版物,移動出版,網(wǎng)易游戲,網(wǎng)絡(luò)游戲出版,網(wǎng)絡(luò)出版物,網(wǎng)絡(luò)廣告產(chǎn)業(yè)]”,圖4為第2組測試的圖形界面:圖4第2組測試3.3.3第3組測試相關(guān)查詢功能測試檢索式為“SGML與XML是典型的描述性標(biāo)記語言”,在Eclipse控制臺輸出的分詞結(jié)果為“典型描述性標(biāo)記語言SGMLXML”,相關(guān)選項為“[XML,HTML,內(nèi)容加工,相關(guān)概念,DTD,RDF,ISO,格式標(biāo)準(zhǔn),DocBook,XSL,復(fù)合出版,ECIP,S1000D,XPS,標(biāo)記語言,XMLSchema,技術(shù)標(biāo)準(zhǔn),DREL,信息組織,EPUB,Ne-wsML,OFD,SGML,ODRL,W3C,語義網(wǎng),ODF,DI-TA工具,DITAworks,動態(tài)出版,DC,DITA,XHTML,CEBX,CNONIX,DITAStorm]”,圖5為第3組測試的圖形界面:圖5第3組測試雙擊相關(guān)選項列表中的“DITA”,程序便以“DI-TA”為檢索詞進(jìn)行第二次檢索,在Eclipse控制臺輸出“DITA”的相關(guān)選項為“[DTD,元數(shù)據(jù),全媒體出版,版式渲染,DITA技術(shù)委員會,DITA工具,XMLSchema,內(nèi)容重組,XSL-FO,DocBook,URI,XSD,內(nèi)容驗證,內(nèi)容加工,IBM,復(fù)合出版,Adobe,流程再造,XML,信息組織,XSL,技術(shù)標(biāo)準(zhǔn),內(nèi)容資源整合,OASIS,按需出版]”,測試結(jié)果如圖6所示:圖6點擊相關(guān)查詢測試從以上3組測試的結(jié)果可以看出,本文實現(xiàn)的基于數(shù)字出版領(lǐng)域本體的跨語言信息檢索模型基本滿足了設(shè)計需求。其中,第1組測試表明模型能對單字詞及純數(shù)字進(jìn)行一定的處理,第2組測試驗證了模型使用英語進(jìn)行檢索時,反饋
【參考文獻(xiàn)】:
期刊論文
[1]基于主題詞表的數(shù)字出版領(lǐng)域本體構(gòu)建[J]. 司莉,陳雨雪,莊曉喆. 出版科學(xué). 2015(06)
[2]信息檢索模型及其在跨語言信息檢索中的應(yīng)用進(jìn)展[J]. 吳丹,齊和慶. 現(xiàn)代情報. 2009(07)
[3]基于本體的跨語言信息檢索模型和關(guān)鍵技術(shù)研究[J]. 郝嘉樹,王惠臨,劉耀. 情報科學(xué). 2009(02)
[4]結(jié)合本體論和統(tǒng)計方法的跨語言信息檢索模型[J]. 鄭德權(quán),李生,趙鐵軍,于浩. 哈爾濱工業(yè)大學(xué)學(xué)報. 2008(01)
[5]跨語言信息檢索模型應(yīng)用研究[J]. 劉偉成,孫吉紅. 情報雜志. 2007(10)
[6]本體在跨語言信息檢索中的應(yīng)用機(jī)制研究[J]. 吳丹,王惠臨. 圖書情報工作. 2006(09)
[7]本體驅(qū)動的跨語言信息檢索研究[J]. 吳丹. 現(xiàn)代圖書情報技術(shù). 2006(05)
[8]基于本體的跨語言信息檢索模型[J]. 王進(jìn),陳恩紅,張振亞,王煦法. 中文信息學(xué)報. 2004(03)
博士論文
[1]面向復(fù)雜語義的專利本體構(gòu)建方法研究[D]. 李蓉蓉.武漢大學(xué) 2014
碩士論文
[1]基于跨語言信息檢索的企業(yè)競爭情報收集系統(tǒng)模型研究[D]. 孫耀.山東科技大學(xué) 2011
[2]基于形式概念分析的領(lǐng)域本體構(gòu)建方法研究[D]. 張云中.吉林大學(xué) 2009
[3]基于本體的跨語言全文檢索模型的研究[D]. 吳芳.北京郵電大學(xué) 2006
本文編號:3118454
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/3118454.html
最近更新
教材專著