面向搜索引擎查詢?nèi)罩镜念I(lǐng)域術(shù)語自動識別方法
本文關(guān)鍵詞:面向搜索引擎查詢?nèi)罩镜念I(lǐng)域術(shù)語自動識別方法
更多相關(guān)文章: 領(lǐng)域術(shù)語 搜索引擎 查詢?nèi)罩?/b> 流形排序
【摘要】:【目的】為彌補傳統(tǒng)基于靜態(tài)領(lǐng)域語料的領(lǐng)域術(shù)語識別方法的不足,提出一種從搜索引擎查詢?nèi)罩局凶詣幼R別領(lǐng)域術(shù)語的新方法!痉椒ā渴褂盟牟繄D對查詢?nèi)罩具M行抽象描述,并在其上應(yīng)用流形排序算法得到所有候選術(shù)語關(guān)于領(lǐng)域度的排序,取排在前列的術(shù)語作為領(lǐng)域術(shù)語!窘Y(jié)果】在真實搜索引擎的查詢?nèi)罩旧蠈嶒炞C實本文方法具有更好的領(lǐng)域術(shù)語識別效果,在Precision@n指標(biāo)上比基準(zhǔn)方法提升約20%!揪窒蕖孔R別到的領(lǐng)域術(shù)語的覆蓋面部分依賴于領(lǐng)域?qū)<疫x取的初始查詢詞,這對領(lǐng)域?qū)<业慕?jīng)驗提出一定要求!窘Y(jié)論】該方法無需事先準(zhǔn)備大規(guī)模領(lǐng)域語料以及大量的人工標(biāo)注,即可構(gòu)建高質(zhì)量的領(lǐng)域術(shù)語集合,具有較高的實用價值。
【作者單位】: 山東科技大學(xué)信息科學(xué)與工程學(xué)院;
【關(guān)鍵詞】: 領(lǐng)域術(shù)語 搜索引擎 查詢?nèi)罩?/strong> 流形排序
【基金】:山東省自然科學(xué)基金“動態(tài)環(huán)境下結(jié)構(gòu)支持向量機學(xué)習(xí)算法及其應(yīng)用研究”(項目編號:ZR2014FP011) 山東省高等學(xué)?萍加媱濏椖俊懊嫦蛐畔z索的非平衡數(shù)據(jù)排序?qū)W習(xí)問題研究”(項目編號:J12LN45)和山東省高等學(xué)?萍加媱濏椖俊懊嫦蚍且(guī)范分布形態(tài)下不平衡文本數(shù)據(jù)的監(jiān)督學(xué)習(xí)關(guān)鍵技術(shù)研究”(項目編號:J14LN33)的研究成果之一
【分類號】:TP391.1
【正文快照】: 1引言領(lǐng)域術(shù)語泛指經(jīng)常出現(xiàn)于特定領(lǐng)域語料中的短語[1],比如“雙條杉天!焙汀叭~斑病”是農(nóng)業(yè)領(lǐng)域的術(shù)語。相比于傳統(tǒng)的通用詞匯,領(lǐng)域術(shù)語蘊含豐富的領(lǐng)域知識,因而領(lǐng)域詞典成為各類情報處理與分析任務(wù)的一類基礎(chǔ)資源,F(xiàn)有領(lǐng)域字典主要通過兩種方式構(gòu)建:采用手工構(gòu)建,如AGRIV
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前1條
1 翟海軍;郭嘉豐;王小磊;許洪波;;基于用戶查詢?nèi)罩镜拿麑嶓w挖掘[J];中文信息學(xué)報;2010年01期
【共引文獻】
中國期刊全文數(shù)據(jù)庫 前6條
1 曹雷;郭嘉豐;白露;程學(xué)旗;;基于半監(jiān)督話題模型的用戶查詢?nèi)罩久麑嶓w挖掘[J];中文信息學(xué)報;2012年05期
2 曹雷;郭嘉豐;程學(xué)旗;;基于二部圖半監(jiān)督方法的查詢?nèi)罩緦嶓w挖掘[J];山東大學(xué)學(xué)報(理學(xué)版);2012年05期
3 張梅;段建勇;徐驥超;;人名屬性知識挖掘及其在查詢分類中的應(yīng)用[J];現(xiàn)代圖書情報技術(shù);2013年09期
4 何峰;岳江浩;;基于改進貝葉斯的時效性實體詞挖掘[J];信息與電腦(理論版);2014年06期
5 李雪偉;呂學(xué)強;劉克會;;擴展搜索日志上下文的新詞識別[J];現(xiàn)代圖書情報技術(shù);2014年11期
6 任育偉;呂學(xué)強;李卓;徐麗萍;;搜索日志中命名實體識別[J];現(xiàn)代圖書情報技術(shù);2015年06期
中國博士學(xué)位論文全文數(shù)據(jù)庫 前1條
1 翟海軍;面向Web信息檢索的知識挖掘[D];中國科學(xué)技術(shù)大學(xué);2010年
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 張曉剛;潘久輝;;MS SQL Server 2000日志分析方法的研究與實現(xiàn)[J];計算機工程與設(shè)計;2006年19期
2 李春林;周根鴻;張文體;;重視日志審計確保數(shù)據(jù)安全[J];醫(yī)學(xué)信息;2007年10期
3 梁曉雪;王鋒;;基于聚類的日志分析技術(shù)綜述與展望[J];云南大學(xué)學(xué)報(自然科學(xué)版);2009年S1期
4 黃海隆;陳賽娉;;計算機日志分析與管理方法的研究[J];大眾科技;2006年07期
5 鄭毅;;基于日志分析的網(wǎng)絡(luò)IDS研究[J];襄樊學(xué)院學(xué)報;2008年11期
6 陳庭平;沈麗娟;曾鵬;;日志服務(wù)器建設(shè)和應(yīng)用[J];網(wǎng)絡(luò)安全技術(shù)與應(yīng)用;2010年09期
7 鄒先霞;賈維嘉;潘久輝;;基于數(shù)據(jù)庫日志的變化數(shù)據(jù)捕獲研究[J];小型微型計算機系統(tǒng);2012年03期
8 羅新;;防火墻日志分析系統(tǒng)的設(shè)計與實現(xiàn)[J];計算機時代;2012年02期
9 姜良華;崔建明;;Serv-U FTP服務(wù)器日志分析系統(tǒng)設(shè)計與實現(xiàn)[J];電腦知識與技術(shù);2010年28期
10 李玉榮;楊樹強;賈焰;周斌;樊宇;;分布式日志服務(wù)關(guān)鍵技術(shù)研究[J];計算機工程與應(yīng)用;2006年07期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 馬辰;武斌;;一種基于攻擊事件圖的蜜網(wǎng)日志分析方法[A];虛擬運營與云計算——第十八屆全國青年通信學(xué)術(shù)年會論文集(下冊)[C];2013年
2 周濤;;基于數(shù)據(jù)挖掘的入侵檢測日志分析技術(shù)研究[A];第二屆中國科學(xué)院博士后學(xué)術(shù)年會暨高新技術(shù)前沿與發(fā)展學(xué)術(shù)會議程序冊[C];2010年
3 陳晨;鄭康鋒;;一種基于支持向量機的蜜網(wǎng)系統(tǒng)日志分析方法[A];2011年通信與信息技術(shù)新進展——第八屆中國通信學(xué)會學(xué)術(shù)年會論文集[C];2011年
4 劉莉;;基于多協(xié)議技術(shù)的日志集中管理安全方案[A];2008年中國通信學(xué)會無線及移動通信委員會學(xué)術(shù)年會論文集[C];2008年
5 耿濤;;Web日志分析在電子數(shù)據(jù)取證中的應(yīng)用[A];第二十一次全國計算機安全學(xué)術(shù)交流會論文集[C];2006年
6 閆龍川;王懷宇;李楓;毛一凡;;基于Hadoop的郵件日志分析與研究[A];2012電力行業(yè)信息化年會論文集[C];2012年
7 陳慶章;王磊;毛科技;戴國勇;;基于防火墻日志的在線攻擊偵查系統(tǒng)的設(shè)計與實現(xiàn)(英文)[A];全國第19屆計算機技術(shù)與應(yīng)用(CACIS)學(xué)術(shù)會議論文集(下冊)[C];2008年
8 王振亞;武斌;;基于MFI-WT算法的蜜網(wǎng)日志分析方法[A];第十七屆全國青年通信學(xué)術(shù)年會論文集[C];2012年
9 金松昌;方濱興;楊樹強;賈焰;;基于Hadoop的網(wǎng)絡(luò)安全日志分析系統(tǒng)的設(shè)計與實現(xiàn)[A];全國計算機安全學(xué)術(shù)交流會論文集·第二十五卷[C];2010年
10 朱金清;王建新;陳志泊;;基于APRIORI的層次化聚類算法及其在IDS日志分析中的應(yīng)用[A];第二十四屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(研究報告篇)[C];2007年
中國重要報紙全文數(shù)據(jù)庫 前10條
1 中航工業(yè)南方航空工業(yè)集團(有限)公司科技與信息部 鄒滬湘;分析日志識別暴力破解[N];計算機世界;2013年
2 ;日志分析中的五個誤區(qū)[N];網(wǎng)絡(luò)世界;2004年
3 陳代壽;網(wǎng)管的四兩撥千斤[N];中國計算機報;2004年
4 IBM大數(shù)據(jù)專家 James Kobielus 范范 編譯;大數(shù)據(jù)日志分析借機器學(xué)習(xí)騰飛[N];網(wǎng)絡(luò)世界;2014年
5 《網(wǎng)絡(luò)世界》評測實驗室 于洋;用好Web日志[N];網(wǎng)絡(luò)世界;2004年
6 重慶 航行者;IIS的安全[N];電腦報;2002年
7 河南工業(yè)職業(yè)技術(shù)學(xué)院 邱建新;監(jiān)測Squid日志的五種方法[N];計算機世界;2005年
8 shotgun;入侵檢測初步(上)[N];電腦報;2001年
9 朱閔;淺談企業(yè)核心應(yīng)用的安全審計(下)[N];網(wǎng)絡(luò)世界;2008年
10 覃進文;在Windows 2000&&2003下快速安裝Webalizer[N];中國電腦教育報;2003年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前3條
1 饒翔;基于日志的大規(guī)模分布式軟件系統(tǒng)可信保障技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2011年
2 曹志波;基于日志的任務(wù)建模及調(diào)度優(yōu)化的研究[D];華南理工大學(xué);2014年
3 胡蓉;WEB日志和子空間聚類挖掘算法研究[D];華中科技大學(xué);2008年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 張?zhí)焐?日志采集與分析在Web網(wǎng)站中的設(shè)計與實現(xiàn)[D];上海交通大學(xué);2015年
2 周海靖;日志大數(shù)據(jù)分析平臺技術(shù)研究[D];山東大學(xué);2015年
3 賴特;網(wǎng)絡(luò)安全設(shè)備日志融合技術(shù)研究[D];電子科技大學(xué);2015年
4 董妍妍;基于Hadoop的Teradata數(shù)據(jù)倉庫日志分析系統(tǒng)的設(shè)計與實現(xiàn)[D];南京大學(xué);2014年
5 李名弈;IPTVQOS日志分析方法研究[D];復(fù)旦大學(xué);2013年
6 劉季函(Liu,Chi Han);基于Spark的網(wǎng)絡(luò)日志分析系統(tǒng)的設(shè)計與實現(xiàn)[D];南京大學(xué);2014年
7 李榮榮;基于Hadoop平臺的日志分析系統(tǒng)[D];復(fù)旦大學(xué);2013年
8 周云斌;基于主機的日志大數(shù)椐分析及安全性檢查[D];大連理工大學(xué);2015年
9 張迪;基于NoSQL的大規(guī)模Web日志分析系統(tǒng)的設(shè)計與實現(xiàn)[D];復(fù)旦大學(xué);2013年
10 潘宇軒;基于Django的日志分析系統(tǒng)的設(shè)計與實現(xiàn)[D];南京大學(xué);2014年
,本文編號:1003011
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1003011.html