基于URL的中文多語義名詞在線語義標(biāo)注
本文關(guān)鍵詞:基于URL的中文多語義名詞在線語義標(biāo)注
更多相關(guān)文章: 語義標(biāo)注 自然語言處理 中文多語義名詞 URL分類器 文本聚類 熱詞
【摘要】:中文語義標(biāo)注在自然語言處理領(lǐng)域有廣泛的應(yīng)用,其目的在于挖掘并標(biāo)注出中文多語義名詞的多個(gè)語義。提出一種新穎的語義標(biāo)注算法,通過在線URL分類目錄,構(gòu)建得到URL分類器。借助于URL分類器,對搜索引擎返回的多語義名詞的搜索結(jié)果(包括網(wǎng)頁URL及摘要)進(jìn)行分類,得到多語義名詞的初始語義分類結(jié)果。對初始語義分類結(jié)果按其網(wǎng)頁摘要聚類,提取聚類特征后得到多語義詞的語義標(biāo)注結(jié)果。該算法利用基于URL的網(wǎng)頁分類方法,能在線對中文多語義名詞進(jìn)行語義標(biāo)注。實(shí)驗(yàn)結(jié)果證明,該語義標(biāo)注算法可以取得70%的準(zhǔn)確率及80%的召回率,適用于網(wǎng)絡(luò)熱詞語義標(biāo)注。
【作者單位】: 華東師范大學(xué)計(jì)算機(jī)科學(xué)技術(shù)系;
【關(guān)鍵詞】: 語義標(biāo)注 自然語言處理 中文多語義名詞 URL分類器 文本聚類 熱詞
【基金】:上海市國際科技合作基金資助項(xiàng)目(11530700300) 上海市科委科研基金資助項(xiàng)目“面向NGB的智能業(yè)務(wù)分析關(guān)鍵技術(shù)研究及系統(tǒng)研制”(12dz1500205)
【分類號】:TP391.1
【正文快照】: 1概述語義知識學(xué)習(xí)在人工智能領(lǐng)域中具有重要應(yīng)用,一直以來都是自然語言處理研究中的熱點(diǎn)問題。語義標(biāo)注研究多語義詞的語義信息獲取,在相關(guān)度計(jì)算、查詢擴(kuò)展等領(lǐng)域得到廣泛應(yīng)用[1]。名詞的多語義特征表現(xiàn)尤為明顯,所以它是語義標(biāo)注的研究重點(diǎn)。對于中文多語義名詞,語義標(biāo)注應(yīng)
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前2條
1 張宇;宋巍;劉挺;李生;;基于URL主題的查詢分類方法[J];計(jì)算機(jī)研究與發(fā)展;2012年06期
2 何婷婷;李芳;;基于主題模型的博客標(biāo)簽語義知識獲取(英文)[J];中國通信;2012年03期
【共引文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前2條
1 蔣宗禮;時(shí)福林;;基于鏈接關(guān)系的網(wǎng)頁分類優(yōu)化算法[J];計(jì)算機(jī)與現(xiàn)代化;2014年05期
2 王樹西;夏增艷;;一種區(qū)分索引與信息的網(wǎng)頁分類數(shù)學(xué)模型及證明[J];計(jì)算機(jī)科學(xué);2014年S2期
中國重要會(huì)議論文全文數(shù)據(jù)庫 前1條
1 Liu Na;Li Ming-xia;Lu Ying;Tang Xiao-jun;Wang Hai-wen;Xiao Peng;;Mixture of Topic Model for Multi-document Summarization[A];第26屆中國控制與決策會(huì)議論文集[C];2014年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前1條
1 伍大勇;搜索引擎中命名實(shí)體查詢處理相關(guān)技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2012年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前4條
1 韓媛媛;熱計(jì)量表物聯(lián)網(wǎng)對象名解析服務(wù)系統(tǒng)的安全性研究[D];燕山大學(xué);2012年
2 胡蓉;基于標(biāo)簽—主題模型的標(biāo)簽推薦研究[D];華中師范大學(xué);2013年
3 陳水銀;基于語義分析的文檔排序方法研究[D];華中師范大學(xué);2014年
4 宋嵩;基于URL分析的移動(dòng)互聯(lián)網(wǎng)用戶分群[D];河北大學(xué);2013年
【二級參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前1條
1 張森;王斌;;Web檢索查詢意圖分類技術(shù)綜述[J];中文信息學(xué)報(bào);2008年04期
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 韋娜;耿國華;周明全;;基于相關(guān)反饋的文物圖像語義標(biāo)注[J];西北大學(xué)學(xué)報(bào)(自然科學(xué)版);2008年03期
2 欒悉道;謝毓湘;韓志廣;譚義紅;陳治平;沈金榮;;基于概念分布的圖像語義標(biāo)注與檢索[J];武漢理工大學(xué)學(xué)報(bào);2009年18期
3 張捷;;圖像語義標(biāo)注[J];電腦開發(fā)與應(yīng)用;2012年01期
4 孫君頂;杜娟;;圖像自動(dòng)語義標(biāo)注技術(shù)綜述[J];計(jì)算機(jī)系統(tǒng)應(yīng)用;2012年07期
5 吳煥瑞;;圖書領(lǐng)域的語義標(biāo)注[J];無線互聯(lián)科技;2013年03期
6 邱均平;牟楠;樓雯;趙蓉英;;國內(nèi)外語義標(biāo)注研究進(jìn)展分析[J];情報(bào)理論與實(shí)踐;2014年05期
7 李向陽,張亞非;基于語義標(biāo)注的信息抽取[J];解放軍理工大學(xué)學(xué)報(bào)(自然科學(xué)版);2004年04期
8 劉振;;社交媒體的語義標(biāo)注應(yīng)用現(xiàn)狀研究[J];圖書與情報(bào);2013年05期
9 劉杰;杜軍平;;基于潛在主題融合的跨媒體圖像語義標(biāo)注[J];電子學(xué)報(bào);2014年05期
10 王傳清;畢強(qiáng);;數(shù)字圖書館自動(dòng)化語義標(biāo)注工具系統(tǒng)模型研究[J];現(xiàn)代圖書情報(bào)技術(shù);2014年06期
中國重要會(huì)議論文全文數(shù)據(jù)庫 前10條
1 苗傳江;劉智穎;;現(xiàn)代漢語語料的句子級語義標(biāo)注[A];語言計(jì)算與基于內(nèi)容的文本處理——全國第七屆計(jì)算語言學(xué)聯(lián)合學(xué)術(shù)會(huì)議論文集[C];2003年
2 謝法奎;張全;袁毅;;基于HNC理論的語義標(biāo)注語料庫[A];內(nèi)容計(jì)算的研究與應(yīng)用前沿——第九屆全國計(jì)算語言學(xué)學(xué)術(shù)會(huì)議論文集[C];2007年
3 張娜;李濟(jì)洪;;基于語義標(biāo)注的中文閱讀理解語料庫的建設(shè)[A];內(nèi)容計(jì)算的研究與應(yīng)用前沿——第九屆全國計(jì)算語言學(xué)學(xué)術(shù)會(huì)議論文集[C];2007年
4 宋雨;鄭懌;吳燕;;RDFa語義標(biāo)注技術(shù)綜述[A];2009全國計(jì)算機(jī)網(wǎng)絡(luò)與通信學(xué)術(shù)會(huì)議論文集[C];2009年
5 鮑廣宇;譚偉;吳亞寧;;機(jī)器兵力指揮控制語言的語義標(biāo)注技術(shù)研究[A];2013第一屆中國指揮控制大會(huì)論文集[C];2013年
6 馬永騰;亢世勇;;非典型成員的語義標(biāo)注策略和問題[A];內(nèi)容計(jì)算的研究與應(yīng)用前沿——第九屆全國計(jì)算語言學(xué)學(xué)術(shù)會(huì)議論文集[C];2007年
7 王浩然;徐建良;張巍;;一種XML元數(shù)據(jù)的自動(dòng)語義標(biāo)注方法[A];2008'中國信息技術(shù)與應(yīng)用學(xué)術(shù)論壇論文集(二)[C];2008年
8 袁柳;李戰(zhàn)懷;陳世亮;;OntoWord:一種新的Web頁面語義標(biāo)注方法[A];第二十五屆中國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(二)[C];2008年
9 曾誠;李兵;何克清;;KMP算法在Web服務(wù)語義標(biāo)注中的應(yīng)用[A];2010年全國開放式分布與并行計(jì)算機(jī)學(xué)術(shù)會(huì)議論文集[C];2010年
10 周強(qiáng);王俊俊;陳麗歐;;構(gòu)建大規(guī)模的漢語事件知識庫[A];中國計(jì)算語言學(xué)研究前沿進(jìn)展(2009-2011)[C];2011年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前4條
1 米楊;基于頂級本體整合的醫(yī)學(xué)領(lǐng)域語義標(biāo)注研究[D];吉林大學(xué);2012年
2 謝銘;關(guān)聯(lián)數(shù)據(jù)和知識表示的自動(dòng)語義標(biāo)注技術(shù)[D];武漢大學(xué);2012年
3 唐金輝;視頻語義標(biāo)注的若干問題研究[D];中國科學(xué)技術(shù)大學(xué);2008年
4 荊濤;面向領(lǐng)域網(wǎng)頁的語義標(biāo)注若干問題研究[D];吉林大學(xué);2011年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 丁長林;中醫(yī)古籍文獻(xiàn)語義標(biāo)注技術(shù)的研究[D];沈陽航空航天大學(xué);2013年
2 王國印;科技文獻(xiàn)語義標(biāo)注系統(tǒng)研究[D];華中科技大學(xué);2009年
3 羅旋;基于復(fù)句領(lǐng)域本體的語義標(biāo)注方法研究[D];華中師范大學(xué);2006年
4 丁蓉;自動(dòng)語義標(biāo)注方法研究[D];蘭州理工大學(xué);2012年
5 王亞斌;基于本體的語義標(biāo)注研究[D];蘭州理工大學(xué);2010年
6 于曉繁;基于本體和元數(shù)據(jù)的語義標(biāo)注平臺(tái)模型與系統(tǒng)架構(gòu)研究[D];山東理工大學(xué);2012年
7 張泓博;面向領(lǐng)域文檔的自動(dòng)語義標(biāo)注方法研究[D];重慶大學(xué);2012年
8 沙麗華;面向領(lǐng)域文檔的語義標(biāo)注方法研究[D];吉林大學(xué);2009年
9 張磊;基于中文維基百科的全文語義標(biāo)注系統(tǒng)[D];華中科技大學(xué);2012年
10 施夢煒;基于本體面向三維場景的語義標(biāo)注研究與應(yīng)用[D];上海交通大學(xué);2013年
,本文編號:1032795
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1032795.html