專利文獻是規(guī)模龐大的信息源,是科技研究成果的重要表現(xiàn)形式,能夠反映領(lǐng)域內(nèi)科技成果與技術(shù)發(fā)展的最新動態(tài),在科研、經(jīng)濟、法律等領(lǐng)域有舉足輕重的地位。隨著中國市場經(jīng)濟的迅猛發(fā)展與經(jīng)濟全球化日益深化,專利沖突與專利壁壘深深困擾著廣大中國企業(yè)與研發(fā)機構(gòu),專利侵權(quán)、專利保護也成為關(guān)注重點,對外國專利的研究與利用越發(fā)重要。本文圍繞中英雙語專利研究中英雙語專利信息檢索,幫助專利分析者通過雙語檢索準確獲得相關(guān)國內(nèi)外專利文獻,并基于主題演化的主題聚類方法研究中英雙語專利主題聚類,分析中英雙語專利的主題分布及演化,從實際需求出發(fā)開發(fā)了系統(tǒng)原型實現(xiàn)雙語檢索與雙語專利主題聚類功能,并以"3D打印"領(lǐng)域雙語專利給出應用實例。本文綜合各種跨語言信息檢索實現(xiàn)方法與專利信息特征提出基于詞典的提問式翻譯雙語專利信息檢索方案,該檢索方案通過構(gòu)建基礎(chǔ)雙語詞典、專業(yè)雙語詞典與雙語專利平行語料并建立相互輔助的關(guān)系為提問式提供準確翻譯,基礎(chǔ)雙語詞典與專業(yè)詞典互為補充,同時利用雙語平行語料庫構(gòu)建雙語空間進行歧義消解;利用向量空間模型表示專利文獻標題與摘要索引,并構(gòu)建專利檢索匹配方案。最后進行了領(lǐng)域內(nèi)小規(guī)模檢索實驗驗證了檢索方案的可行性與基于雙語平行語料庫歧義消解的可用性。本文在構(gòu)建中英雙語專利詞典與雙語信息檢索的基礎(chǔ)上深入專利文檔標題和摘要采用HDP主題模型進行主題聚類分析,利用HDP主題模型將專利文檔表示為一組主題的概率分布,可以深入專利文檔語義層次挖掘潛在技術(shù)主題。按照時間窗口劃分專利集合分別進行主題聚類,分析專利主題分布與演化,研究技術(shù)主題之間關(guān)系,并用"3D打印"領(lǐng)域雙語專利進行實例分析。從實際應用角度出發(fā),基于J2EE平臺開發(fā)了中英雙語專利信息檢索與主題聚類分析系統(tǒng),實現(xiàn)了中英雙語專利信息檢索、中英雙語專利主題聚類與詞典語料管理功能,對主題聚類結(jié)果進行可視化展示。
【學位單位】:南京理工大學
【學位級別】:碩士
【學位年份】:2017
【中圖分類】:G306;G254
【相似文獻】
相關(guān)期刊論文 前10條
1 柴振榮;信息檢索中特征相關(guān)性的利用[J];管理科學文摘;1995年07期
2 歲豐;企業(yè)家和信息檢索[J];管理科學文摘;1997年01期
3 楊則正;信息檢索的相關(guān)性[J];管理科學文摘;1997年07期
4 楊則正;信息檢索新技術(shù)[J];管理科學文摘;1997年07期
5 楊則正;信息檢索和過濾指標的確定[J];管理科學文摘;1997年07期
6 楊則正;信息檢索中多查詢現(xiàn)象的組合[J];管理科學文摘;1997年07期
7 鄭士貴;信息檢索中的分段比較[J];管理科學文摘;1997年08期
8 楊英;企務和信息檢索[J];管理科學文摘;1997年12期
9 李斌;信息檢索[J];管理科學文摘;1998年03期
10 鄭士貴;社會學信息檢索[J];管理科學文摘;1998年06期
相關(guān)會議論文 前10條
1 ;前言[A];第五屆全國信息檢索學術(shù)會議論文集[C];2009年
2 閆昱;何守才;;Web信息檢索中的超連接分析[A];第十八屆全國數(shù)據(jù)庫學術(shù)會議論文集(技術(shù)報告篇)[C];2001年
3 ;前言[A];第六屆全國信息檢索學術(shù)會議論文集[C];2010年
4 ;前言[A];第三屆全國信息檢索與內(nèi)容安全學術(shù)會議論文集[C];2007年
5 徐祥來;郭士忠;張麗華;;鋼鐵行業(yè)信息檢索基礎(chǔ)知識與研究[A];2008年河北省軋鋼技術(shù)與學術(shù)年會論文集(上)[C];2008年
6 張sソ
本文編號:2813447
本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/2813447.html