基于領(lǐng)域知識庫的語義出版形態(tài)研究
發(fā)布時間:2022-02-09 21:54
指出領(lǐng)域知識庫是對知識單元進行管理、存儲和關(guān)聯(lián)利用的有效工具,是專業(yè)出版機構(gòu)開展語義出版服務(wù)的基礎(chǔ)性工程。提出語義出版領(lǐng)域知識庫的知識單元可劃分為出版載體與文獻類型模塊、母體要素模塊、科學(xué)陳述模塊、知識形態(tài)模塊和外部關(guān)聯(lián)模塊,通過書目關(guān)聯(lián)關(guān)系、概念關(guān)聯(lián)關(guān)系、引證關(guān)聯(lián)關(guān)系、論證關(guān)聯(lián)關(guān)系、科研本體關(guān)聯(lián)關(guān)系構(gòu)建適用于出版業(yè)的資源語義網(wǎng)絡(luò)。闡釋面向集成揭示和智能推理兩種語義出版形態(tài),并提出采用"眾包"模式建設(shè)領(lǐng)域知識庫和推動開放知識組織體系共享利用的建議,以期對我國語義出版領(lǐng)域知識庫構(gòu)建及其應(yīng)用提供借鑒。
【文章來源】:出版科學(xué). 2020,28(05)北大核心CSSCI
【文章頁數(shù)】:9 頁
【部分圖文】:
以第一責(zé)任者和語種為關(guān)聯(lián)元素的書目關(guān)聯(lián)關(guān)系
綜合新型科學(xué)交流環(huán)境下知識單元的產(chǎn)生渠道、外部出版特征和內(nèi)容資源內(nèi)涵,梳理適用于語義出版的關(guān)聯(lián)要素,領(lǐng)域知識庫知識單元可分5個模塊進行識別和集成,如圖1所示:(1)出版載體與文獻類型模塊,如圍繞某一知識主題的期刊論文、學(xué)位論文、科技報告、標(biāo)準(zhǔn)、圖書等,有利于跨出版物載體提供主題服務(wù)。(2)母體要素模塊,如期刊名稱、會議名稱、作者、發(fā)表機構(gòu)、關(guān)鍵詞、基金項目、發(fā)表時間、參考文獻等書目元素,有利于梳理知識主題的研究熱點與發(fā)展趨勢,及時展現(xiàn)某一學(xué)科領(lǐng)域中信息吸收與知識擴散的發(fā)展演變。(3)科學(xué)陳述模塊,是指經(jīng)過自然語言處理,由文獻自動抽取的觀點、理論、原理、指標(biāo)和方法等,有利于根據(jù)規(guī)則對上述要素的權(quán)威性、影響力和前沿性進行評價和篩選,形成基于科學(xué)陳述要素的自動綜述等。(4)知識形態(tài)模塊,即從文獻內(nèi)部提取的軟件、工具、公式、視頻、表格、圖片、數(shù)據(jù)集等具有獨立表現(xiàn)形態(tài)的知識單元。(5)外部關(guān)聯(lián)模塊,是對原有文獻內(nèi)容的語義化、交互式、概念性擴展,如DBpedia、SemSur[17]、漢語主題詞表等知識組織工具,權(quán)威機構(gòu)發(fā)布的財經(jīng)數(shù)據(jù)、地理數(shù)據(jù)、生物數(shù)據(jù)等,或是某一知識主題的專業(yè)軟件、專家釋義、典型案例和新聞等知識對象。這有利于在服務(wù)層結(jié)構(gòu)化展示主題與體系內(nèi)上下位類目、相關(guān)類目的關(guān)系,以及向用戶立體化地展現(xiàn)可交互的三維圖像數(shù)據(jù)。值得注意的是,知識單元有可分解與不可分解兩類;也有學(xué)者將不可分解的知識單元稱之為“知識元”[18],它在分類和索引實踐中極為有用。上述知識單元中的概念、理論、圖表、數(shù)據(jù)等,也隸屬于知識元的概念范疇。因此,語義出版應(yīng)側(cè)重于知識元釋義和知識元關(guān)系建設(shè),強化對文章、篇、章、節(jié)、段落等獨立、完整的文字內(nèi)容進行的碎片化加工、標(biāo)引標(biāo)注、主題詞創(chuàng)建等技術(shù)處理,完善知識元修改、標(biāo)引、超鏈、備注、標(biāo)簽等流程環(huán)節(jié)的專業(yè)編輯,提升面向多元應(yīng)用場景的圖標(biāo)、公式、表格矢量化處理的專業(yè)能力。
當(dāng)前,出版機構(gòu)可圍繞自身優(yōu)質(zhì)出版資源和優(yōu)勢出版資源,從建設(shè)經(jīng)典閱讀、精品閱讀語義出版服務(wù)投送平臺入手,圍繞某一主題或知識點實現(xiàn)文獻整合及其所蘊含知識單元要素的動態(tài)重組,形成如圖書集成、文本綜述、主題監(jiān)測和追蹤等知識網(wǎng)絡(luò)產(chǎn)品。為此,本文設(shè)計了物理學(xué)語義出版服務(wù)平臺中知識主題集成揭示系統(tǒng)的相關(guān)功能,如圖3所示。其中,圖書集成服務(wù)是指以書目關(guān)聯(lián)關(guān)系為核心,通過詞條檢索功能,運用語義搜索技術(shù)將傳統(tǒng)關(guān)鍵詞匹配檢索提升至規(guī)范詞、篇章、語用、邏輯等語義檢索層次。它運用語義碎片化技術(shù),識別和提取出版內(nèi)容資源的結(jié)構(gòu)化信息碎片,根據(jù)用戶或者行業(yè)需求特征,將圖書、文本、多媒體資源等進行個性化整合及專題服務(wù),從而以百科閱讀、主題閱讀等形式對外呈現(xiàn),實現(xiàn)對多載體檢索內(nèi)容的按需聚合。自動綜述服務(wù)是指以概念關(guān)聯(lián)關(guān)系和引證關(guān)聯(lián)關(guān)系為核心,形成如簡介、理化性質(zhì)、制備方法、分類與應(yīng)用、發(fā)展前景等主題對象知識集合。它支持文本過濾與內(nèi)容對比分析功能;支持用戶自定義語義出版服務(wù)的內(nèi)容組織結(jié)構(gòu);支持高被引文獻的核心觀點/概念展示;支持多媒體資源、結(jié)構(gòu)化公式的有機融合;支持不同知識元之間的關(guān)聯(lián)與跳轉(zhuǎn)。主題監(jiān)測服務(wù)是指以科研本體關(guān)聯(lián)關(guān)系為核心的學(xué)術(shù)主體評價服務(wù)。該服務(wù)可圍繞知識主題,對相關(guān)機構(gòu)、作者、項目和管理決策進行數(shù)據(jù)處理和信息運算,實現(xiàn)立體化的實體計量和對某個知識單元的有效評價,凸顯某學(xué)科領(lǐng)域的核心或潛在作者、機構(gòu)、期刊、會議、項目等知識要素及其相關(guān)關(guān)系,動態(tài)展示學(xué)科發(fā)展現(xiàn)狀與趨勢。
【參考文獻】:
期刊論文
[1]學(xué)術(shù)期刊數(shù)字出版內(nèi)容增強模式探索[J]. 朱琳峰,李楠. 編輯學(xué)報. 2019(04)
[2]面向科學(xué)交流的語義出版體系建設(shè)研究[J]. 蘇靜. 數(shù)字圖書館論壇. 2018(11)
[3]科學(xué)出版物語義數(shù)據(jù)及其應(yīng)用研究[J]. 徐雷,潘珺. 中國科技期刊研究. 2018(07)
[4]語義出版物的內(nèi)容組織架構(gòu)研究——基于納米出版物和微型出版物的比較分析[J]. 王曉光,宋寧遠. 出版科學(xué). 2017(04)
[5]英國廣播公司(BBC)動態(tài)語義出版模式研究[J]. 王莉莉,欒冠楠. 圖書情報工作. 2017(08)
[6]DPaper:一種面向語義出版的結(jié)構(gòu)化論文寫作工具設(shè)計與實現(xiàn)[J]. 樂小虬,王子璇,張曉林,何遠標(biāo),付常雷,許麗媛. 現(xiàn)代圖書情報技術(shù). 2016(11)
[7]面向語義出版的學(xué)術(shù)期刊數(shù)字資源聚合研究[J]. 許鑫,江燕青,翟姍姍. 圖書情報工作. 2016(17)
[8]國際學(xué)術(shù)期刊的數(shù)字化發(fā)展趨勢[J]. 彭希珺,張曉林. 中國科技期刊研究. 2013(06)
[9]數(shù)據(jù)密集、語義、可視化與互動出版:全球科技出版發(fā)展趨勢研究[J]. 徐麗芳,叢挺. 出版科學(xué). 2012(04)
[10]基于“知識元”的知識組織與檢索[J]. 溫有奎. 計算機工程與應(yīng)用. 2005(01)
本文編號:3617702
【文章來源】:出版科學(xué). 2020,28(05)北大核心CSSCI
【文章頁數(shù)】:9 頁
【部分圖文】:
以第一責(zé)任者和語種為關(guān)聯(lián)元素的書目關(guān)聯(lián)關(guān)系
綜合新型科學(xué)交流環(huán)境下知識單元的產(chǎn)生渠道、外部出版特征和內(nèi)容資源內(nèi)涵,梳理適用于語義出版的關(guān)聯(lián)要素,領(lǐng)域知識庫知識單元可分5個模塊進行識別和集成,如圖1所示:(1)出版載體與文獻類型模塊,如圍繞某一知識主題的期刊論文、學(xué)位論文、科技報告、標(biāo)準(zhǔn)、圖書等,有利于跨出版物載體提供主題服務(wù)。(2)母體要素模塊,如期刊名稱、會議名稱、作者、發(fā)表機構(gòu)、關(guān)鍵詞、基金項目、發(fā)表時間、參考文獻等書目元素,有利于梳理知識主題的研究熱點與發(fā)展趨勢,及時展現(xiàn)某一學(xué)科領(lǐng)域中信息吸收與知識擴散的發(fā)展演變。(3)科學(xué)陳述模塊,是指經(jīng)過自然語言處理,由文獻自動抽取的觀點、理論、原理、指標(biāo)和方法等,有利于根據(jù)規(guī)則對上述要素的權(quán)威性、影響力和前沿性進行評價和篩選,形成基于科學(xué)陳述要素的自動綜述等。(4)知識形態(tài)模塊,即從文獻內(nèi)部提取的軟件、工具、公式、視頻、表格、圖片、數(shù)據(jù)集等具有獨立表現(xiàn)形態(tài)的知識單元。(5)外部關(guān)聯(lián)模塊,是對原有文獻內(nèi)容的語義化、交互式、概念性擴展,如DBpedia、SemSur[17]、漢語主題詞表等知識組織工具,權(quán)威機構(gòu)發(fā)布的財經(jīng)數(shù)據(jù)、地理數(shù)據(jù)、生物數(shù)據(jù)等,或是某一知識主題的專業(yè)軟件、專家釋義、典型案例和新聞等知識對象。這有利于在服務(wù)層結(jié)構(gòu)化展示主題與體系內(nèi)上下位類目、相關(guān)類目的關(guān)系,以及向用戶立體化地展現(xiàn)可交互的三維圖像數(shù)據(jù)。值得注意的是,知識單元有可分解與不可分解兩類;也有學(xué)者將不可分解的知識單元稱之為“知識元”[18],它在分類和索引實踐中極為有用。上述知識單元中的概念、理論、圖表、數(shù)據(jù)等,也隸屬于知識元的概念范疇。因此,語義出版應(yīng)側(cè)重于知識元釋義和知識元關(guān)系建設(shè),強化對文章、篇、章、節(jié)、段落等獨立、完整的文字內(nèi)容進行的碎片化加工、標(biāo)引標(biāo)注、主題詞創(chuàng)建等技術(shù)處理,完善知識元修改、標(biāo)引、超鏈、備注、標(biāo)簽等流程環(huán)節(jié)的專業(yè)編輯,提升面向多元應(yīng)用場景的圖標(biāo)、公式、表格矢量化處理的專業(yè)能力。
當(dāng)前,出版機構(gòu)可圍繞自身優(yōu)質(zhì)出版資源和優(yōu)勢出版資源,從建設(shè)經(jīng)典閱讀、精品閱讀語義出版服務(wù)投送平臺入手,圍繞某一主題或知識點實現(xiàn)文獻整合及其所蘊含知識單元要素的動態(tài)重組,形成如圖書集成、文本綜述、主題監(jiān)測和追蹤等知識網(wǎng)絡(luò)產(chǎn)品。為此,本文設(shè)計了物理學(xué)語義出版服務(wù)平臺中知識主題集成揭示系統(tǒng)的相關(guān)功能,如圖3所示。其中,圖書集成服務(wù)是指以書目關(guān)聯(lián)關(guān)系為核心,通過詞條檢索功能,運用語義搜索技術(shù)將傳統(tǒng)關(guān)鍵詞匹配檢索提升至規(guī)范詞、篇章、語用、邏輯等語義檢索層次。它運用語義碎片化技術(shù),識別和提取出版內(nèi)容資源的結(jié)構(gòu)化信息碎片,根據(jù)用戶或者行業(yè)需求特征,將圖書、文本、多媒體資源等進行個性化整合及專題服務(wù),從而以百科閱讀、主題閱讀等形式對外呈現(xiàn),實現(xiàn)對多載體檢索內(nèi)容的按需聚合。自動綜述服務(wù)是指以概念關(guān)聯(lián)關(guān)系和引證關(guān)聯(lián)關(guān)系為核心,形成如簡介、理化性質(zhì)、制備方法、分類與應(yīng)用、發(fā)展前景等主題對象知識集合。它支持文本過濾與內(nèi)容對比分析功能;支持用戶自定義語義出版服務(wù)的內(nèi)容組織結(jié)構(gòu);支持高被引文獻的核心觀點/概念展示;支持多媒體資源、結(jié)構(gòu)化公式的有機融合;支持不同知識元之間的關(guān)聯(lián)與跳轉(zhuǎn)。主題監(jiān)測服務(wù)是指以科研本體關(guān)聯(lián)關(guān)系為核心的學(xué)術(shù)主體評價服務(wù)。該服務(wù)可圍繞知識主題,對相關(guān)機構(gòu)、作者、項目和管理決策進行數(shù)據(jù)處理和信息運算,實現(xiàn)立體化的實體計量和對某個知識單元的有效評價,凸顯某學(xué)科領(lǐng)域的核心或潛在作者、機構(gòu)、期刊、會議、項目等知識要素及其相關(guān)關(guān)系,動態(tài)展示學(xué)科發(fā)展現(xiàn)狀與趨勢。
【參考文獻】:
期刊論文
[1]學(xué)術(shù)期刊數(shù)字出版內(nèi)容增強模式探索[J]. 朱琳峰,李楠. 編輯學(xué)報. 2019(04)
[2]面向科學(xué)交流的語義出版體系建設(shè)研究[J]. 蘇靜. 數(shù)字圖書館論壇. 2018(11)
[3]科學(xué)出版物語義數(shù)據(jù)及其應(yīng)用研究[J]. 徐雷,潘珺. 中國科技期刊研究. 2018(07)
[4]語義出版物的內(nèi)容組織架構(gòu)研究——基于納米出版物和微型出版物的比較分析[J]. 王曉光,宋寧遠. 出版科學(xué). 2017(04)
[5]英國廣播公司(BBC)動態(tài)語義出版模式研究[J]. 王莉莉,欒冠楠. 圖書情報工作. 2017(08)
[6]DPaper:一種面向語義出版的結(jié)構(gòu)化論文寫作工具設(shè)計與實現(xiàn)[J]. 樂小虬,王子璇,張曉林,何遠標(biāo),付常雷,許麗媛. 現(xiàn)代圖書情報技術(shù). 2016(11)
[7]面向語義出版的學(xué)術(shù)期刊數(shù)字資源聚合研究[J]. 許鑫,江燕青,翟姍姍. 圖書情報工作. 2016(17)
[8]國際學(xué)術(shù)期刊的數(shù)字化發(fā)展趨勢[J]. 彭希珺,張曉林. 中國科技期刊研究. 2013(06)
[9]數(shù)據(jù)密集、語義、可視化與互動出版:全球科技出版發(fā)展趨勢研究[J]. 徐麗芳,叢挺. 出版科學(xué). 2012(04)
[10]基于“知識元”的知識組織與檢索[J]. 溫有奎. 計算機工程與應(yīng)用. 2005(01)
本文編號:3617702
本文鏈接:http://sikaile.net/shekelunwen/chubanfaxing/3617702.html
最近更新
教材專著