專利大數(shù)據(jù)分析系統(tǒng)關(guān)鍵技術(shù)與應(yīng)用
發(fā)布時(shí)間:2020-06-12 11:28
【摘要】:隨著信息時(shí)代的來(lái)臨,技術(shù)的發(fā)展與創(chuàng)新速度達(dá)到了一個(gè)前所未有的巔峰,而這樣的進(jìn)步也為相關(guān)的知識(shí)管理帶來(lái)前所未有的挑戰(zhàn)。當(dāng)代技術(shù)領(lǐng)域的進(jìn)步極大地提高了對(duì)分散在各種信息來(lái)源中的組織知識(shí)進(jìn)行管理的需求。然而,傳統(tǒng)的專利分析方法存在人工占比高、數(shù)據(jù)質(zhì)量和挖掘價(jià)值低、分析結(jié)果單調(diào)以及對(duì)用戶智能利用程度低下的缺陷,因此需要利用新一代信息技術(shù)幫助改進(jìn)專利分析方法,以適應(yīng)大數(shù)據(jù)的應(yīng)用場(chǎng)景,并充分借助群體智能實(shí)現(xiàn)更精準(zhǔn)、更高效的專利內(nèi)容挖掘提取。本文在專利分析相關(guān)領(lǐng)域研究的基礎(chǔ)之上,提出了專利大數(shù)據(jù)分析的方法流程,針對(duì)該分析方法中的專利文獻(xiàn)基本信息分析、專利復(fù)雜網(wǎng)絡(luò)分析以及用戶-專利交互分析等關(guān)鍵技術(shù)做了重點(diǎn)研究,并在此基礎(chǔ)上開(kāi)發(fā)了專利大數(shù)據(jù)分析系統(tǒng)。本文的主要內(nèi)容包括:第1章研究了目前的專利活動(dòng)現(xiàn)狀,對(duì)專利文獻(xiàn)的分析流程以及專利文獻(xiàn)的挖掘方法進(jìn)行了梳理,同時(shí)對(duì)復(fù)雜網(wǎng)絡(luò)分析以及群體智能的國(guó)內(nèi)外研究進(jìn)行了整理。在對(duì)現(xiàn)有的專利分析流程進(jìn)行分析的基礎(chǔ)上,發(fā)現(xiàn)了傳統(tǒng)專利分析方法所面臨的困境,提出了專利大數(shù)據(jù)分析流程。第2章提出了專利文獻(xiàn)基本信息分析與挖掘的技術(shù)方案,通過(guò)界定專利文獻(xiàn)基本信息的數(shù)據(jù)形式與內(nèi)容邊界,解構(gòu)了專利文獻(xiàn)的數(shù)據(jù)結(jié)構(gòu),針對(duì)結(jié)構(gòu)化的專利元數(shù)據(jù)提出多角度的定量統(tǒng)計(jì)分析方法集合,針對(duì)非結(jié)構(gòu)化的專利文本數(shù)據(jù)則提出了從文本數(shù)據(jù)建模、特征表示、特征過(guò)濾以及基于SAO的關(guān)鍵詞分析的專利文本挖掘流程。第3章提出了利用專利數(shù)據(jù)中的潛在關(guān)聯(lián)關(guān)系的專利復(fù)雜網(wǎng)絡(luò)建模與分析技術(shù),通過(guò)提取專利的IPC共現(xiàn)關(guān)系、引用/被引關(guān)系以及基于SAO的關(guān)鍵詞關(guān)聯(lián)關(guān)系,構(gòu)建了專利IPC共現(xiàn)網(wǎng)絡(luò)、引文網(wǎng)絡(luò)以及關(guān)鍵詞網(wǎng)絡(luò),在完成網(wǎng)絡(luò)指標(biāo)統(tǒng)計(jì)的基礎(chǔ)上,利用主路徑分析以及異質(zhì)信息網(wǎng)絡(luò)分析的方法,對(duì)專利復(fù)雜網(wǎng)絡(luò)中的信息加以挖掘。第4章提出了基于群體智能的用戶-專利交互分析技術(shù),在將用戶與專利之間的交互行為抽象提取的基礎(chǔ)上,進(jìn)行了用戶-專利交互二分網(wǎng)絡(luò)的建模,并完成用戶關(guān)聯(lián)網(wǎng)絡(luò)的建模。基于這兩個(gè)網(wǎng)絡(luò),完成專利協(xié)同分析用戶的社區(qū)檢測(cè)與專利協(xié)同過(guò)濾,并完成專利的推薦流程。針對(duì)用戶對(duì)專利的標(biāo)注與評(píng)價(jià)行為,基于鏈接分析算法,提出了基于用戶-專利評(píng)價(jià)二分網(wǎng)絡(luò)的雙向價(jià)值評(píng)定方法。第5章基于本文的理論研究結(jié)果以及專利分析關(guān)鍵技術(shù)方案,開(kāi)發(fā)了專利大數(shù)據(jù)分析系統(tǒng),實(shí)現(xiàn)了專利分析用戶對(duì)專利的檢索、查看、評(píng)價(jià)與批量分析,并從系統(tǒng)的角度實(shí)現(xiàn)了對(duì)專利分析用戶的專利定向推薦,專利數(shù)據(jù)的全局定期計(jì)算與更新、專利用戶與專利的相關(guān)數(shù)據(jù)的持續(xù)提取與分析。本文的創(chuàng)新點(diǎn)包括:①在結(jié)合專利文獻(xiàn)挖掘、復(fù)雜網(wǎng)絡(luò)分析和群體智能的理論的基礎(chǔ)上,提出了專利大數(shù)據(jù)分析方法與流程;②提出了基于群體智能的專利分析技術(shù)——用戶-專利交互分析技術(shù),借助群體智能完成對(duì)專利數(shù)據(jù)的優(yōu)化與智能擴(kuò)展;③基于Node.js+Spring+Hadoop的技術(shù)架構(gòu),開(kāi)發(fā)了專利大數(shù)據(jù)分析系統(tǒng),實(shí)現(xiàn)全局專利大數(shù)據(jù)的實(shí)時(shí)更新、專利復(fù)雜網(wǎng)絡(luò)的建模與計(jì)算以及對(duì)專利協(xié)同分析用戶的支持。
【圖文】:
1.2研究背景逡逑根據(jù)國(guó)際知識(shí)產(chǎn)權(quán)組織提供的數(shù)據(jù)[4],我們可以看到近10年的專利活動(dòng)的演變,逡逑其數(shù)據(jù)趨勢(shì)如圖1-1所示。逡逑2017全球等效專利授權(quán)t0P20專利局所在W家或地區(qū)逡逑I逡逑Italy邋*逡逑a逡逑Brazil邋?逡逑s逡逑Singapore邋蜃逡逑a逡逑China,邋Hong邋Kong邋SAR邋a逡逑m逡逑France邋■逡逑灥逡逑Germany邋■逡逑Canada逡逑EPO逡逑:.wisuKmsim^逡逑Japan逡逑China邐K邋aw;■、漏邐灥MwmmMMmsgai逡逑0邐100,000200,00(B00,000400,000500,000600,000700,00(^00,000900,,000逡逑本地授權(quán)■非本地授杈■授權(quán)總數(shù)逡逑圖1-1邐2017全球等效專利授權(quán)top20專利局所在國(guó)家或地區(qū)逡逑在過(guò)去的10年間,專利的申請(qǐng)數(shù)量和申請(qǐng)數(shù)量的增速都在以迅猛的勢(shì)頭增長(zhǎng),逡逑而從國(guó)家間的2017年度統(tǒng)計(jì)數(shù)據(jù)來(lái)看,中國(guó)正以絕對(duì)的數(shù)量?jī)?yōu)勢(shì)壓過(guò)其他的專利申逡逑請(qǐng)來(lái)源國(guó)以及專利授權(quán)國(guó)。2017年,中國(guó)國(guó)家知識(shí)產(chǎn)權(quán)局(SIPO)受理的專利申請(qǐng)數(shù)量逡逑排在第一位,創(chuàng)紀(jì)錄地達(dá)到了邋138萬(wàn)件。不過(guò)由于2017年,中國(guó)更改了統(tǒng)計(jì)專利和逡逑工業(yè)品外觀設(shè)計(jì)等知識(shí)產(chǎn)權(quán)申請(qǐng)數(shù)據(jù)的方法,僅計(jì)算已支付費(fèi)用的專利。排在中國(guó)之逡逑后的是美利堅(jiān)合眾國(guó)(美國(guó);606
利用自動(dòng)化專利分析工具不僅可以減輕專利分析專家手動(dòng)分析專利的繁重任務(wù),逡逑還可以加快分析過(guò)程。專利分析涉及一系列步驟,包括從專利數(shù)據(jù)庫(kù)中提取專利,從逡逑專利中提取信息,以及分析提取的信息以推斷出邏輯結(jié)論。圖1-2顯示了專利分析的逡逑通用工作流程。這些專利包含各種類型的內(nèi)容,例如結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)。非結(jié)構(gòu)逡逑化專利數(shù)據(jù)包括敘述性文本,包括專利名稱,摘要,權(quán)利要求和描述。結(jié)構(gòu)化專利數(shù)逡逑據(jù)包含信息,例如專利的發(fā)明人、專利的受讓人和引用信息[20],[21]。逡逑5逡逑
【學(xué)位授予單位】:浙江大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2019
【分類號(hào)】:G306;TP311.13
本文編號(hào):2709465
【圖文】:
1.2研究背景逡逑根據(jù)國(guó)際知識(shí)產(chǎn)權(quán)組織提供的數(shù)據(jù)[4],我們可以看到近10年的專利活動(dòng)的演變,逡逑其數(shù)據(jù)趨勢(shì)如圖1-1所示。逡逑2017全球等效專利授權(quán)t0P20專利局所在W家或地區(qū)逡逑I逡逑Italy邋*逡逑a逡逑Brazil邋?逡逑s逡逑Singapore邋蜃逡逑a逡逑China,邋Hong邋Kong邋SAR邋a逡逑m逡逑France邋■逡逑灥逡逑Germany邋■逡逑Canada逡逑EPO逡逑:.wisuKmsim^逡逑Japan逡逑China邐K邋aw;■、漏邐灥MwmmMMmsgai逡逑0邐100,000200,00(B00,000400,000500,000600,000700,00(^00,000900,,000逡逑本地授權(quán)■非本地授杈■授權(quán)總數(shù)逡逑圖1-1邐2017全球等效專利授權(quán)top20專利局所在國(guó)家或地區(qū)逡逑在過(guò)去的10年間,專利的申請(qǐng)數(shù)量和申請(qǐng)數(shù)量的增速都在以迅猛的勢(shì)頭增長(zhǎng),逡逑而從國(guó)家間的2017年度統(tǒng)計(jì)數(shù)據(jù)來(lái)看,中國(guó)正以絕對(duì)的數(shù)量?jī)?yōu)勢(shì)壓過(guò)其他的專利申逡逑請(qǐng)來(lái)源國(guó)以及專利授權(quán)國(guó)。2017年,中國(guó)國(guó)家知識(shí)產(chǎn)權(quán)局(SIPO)受理的專利申請(qǐng)數(shù)量逡逑排在第一位,創(chuàng)紀(jì)錄地達(dá)到了邋138萬(wàn)件。不過(guò)由于2017年,中國(guó)更改了統(tǒng)計(jì)專利和逡逑工業(yè)品外觀設(shè)計(jì)等知識(shí)產(chǎn)權(quán)申請(qǐng)數(shù)據(jù)的方法,僅計(jì)算已支付費(fèi)用的專利。排在中國(guó)之逡逑后的是美利堅(jiān)合眾國(guó)(美國(guó);606
利用自動(dòng)化專利分析工具不僅可以減輕專利分析專家手動(dòng)分析專利的繁重任務(wù),逡逑還可以加快分析過(guò)程。專利分析涉及一系列步驟,包括從專利數(shù)據(jù)庫(kù)中提取專利,從逡逑專利中提取信息,以及分析提取的信息以推斷出邏輯結(jié)論。圖1-2顯示了專利分析的逡逑通用工作流程。這些專利包含各種類型的內(nèi)容,例如結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)。非結(jié)構(gòu)逡逑化專利數(shù)據(jù)包括敘述性文本,包括專利名稱,摘要,權(quán)利要求和描述。結(jié)構(gòu)化專利數(shù)逡逑據(jù)包含信息,例如專利的發(fā)明人、專利的受讓人和引用信息[20],[21]。逡逑5逡逑
【學(xué)位授予單位】:浙江大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2019
【分類號(hào)】:G306;TP311.13
【參考文獻(xiàn)】
相關(guān)期刊論文 前1條
1 黃英銘;;Web結(jié)構(gòu)挖掘及HITS算法分析[J];計(jì)算機(jī)與現(xiàn)代化;2007年07期
本文編號(hào):2709465
本文鏈接:http://sikaile.net/guanlilunwen/keyanlw/2709465.html
最近更新
教材專著