基于條件隨機(jī)場的中文商品查詢語義標(biāo)注問題研究
【圖文】:
它就是 “品牌詞”;如果指代一種水果,蘋果的英文“apple”同樣有歧義)。又如「巧克力是 “產(chǎn)品類型詞”,而恰巧 LG 公司出了一款“巧號詞”,還有許多“女裝”類目下的商品描述也可能是個(gè)“不知名的品牌”(這時(shí)它是“品牌詞”),又或色或圖案(這時(shí)它是“屬性詞”)。再如「3g」,在“”,表示產(chǎn)品使用 3G 上網(wǎng)方式,而在“3g 鉆戒”中重量三克的意思,所以語義類別相同,真實(shí)意義也可,查詢串中的詞往往是上下文相關(guān)的,不同的上下文它們的語義類別自然也就可能不同了。圖 1-1 展示了
本章分“序列標(biāo)注模型”、“查詢分析”和“自然語言處理”三小節(jié)介紹已有的研究工作。本文研究“中文商品查詢語義標(biāo)注”問題,是“查詢標(biāo)注”(Query Tagging)的子問題。圖 2-1 展示了查詢標(biāo)注與其他研究主題之間的聯(lián)系。左側(cè)虛線框表示機(jī)器學(xué)習(xí)相關(guān)主題,例如文本分類(Text Classification)、序列標(biāo)注/切分(SequencLabeling/Segment)。查詢標(biāo)注主要由機(jī)器學(xué)習(xí)中的序列標(biāo)注模型4解決。右側(cè)虛線框表示表示自然語言處理相關(guān)主題,例如中文分詞、文本分塊(Text Chunking)詞性標(biāo)注(Part-of-Speech Tagging, POS Tagging)等。自然語言處理中的相關(guān)技術(shù)與研究為查詢標(biāo)注提供了基礎(chǔ)。由于中文商品查詢語義標(biāo)注研究的數(shù)據(jù)對象是商品查詢,已有的關(guān)于商品查詢的研究也為本文的研究提供了經(jīng)驗(yàn)參考。在語義標(biāo)注前,通常要對商品查詢進(jìn)行分類,這需要查詢分類(Query Classification)的相關(guān)知識。
【學(xué)位授予單位】:中山大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2012
【分類號】:TP391.3
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 楊艷萍;譚慶平;;Web服務(wù)自動語義標(biāo)注的本體定位方法研究[J];計(jì)算機(jī)工程與科學(xué);2008年04期
2 曾誠;李兵;何克清;;KMP算法在Web服務(wù)語義標(biāo)注中的應(yīng)用[J];微電子學(xué)與計(jì)算機(jī);2010年08期
3 李毅;保鵬飛;薛萬國;;中文電子病歷的信息抽取研究[J];生物醫(yī)學(xué)工程學(xué)雜志;2010年04期
4 張瑜;李景;孟憲學(xué);蘇曉路;;網(wǎng)絡(luò)標(biāo)注的主要方法概述[J];圖書情報(bào)工作;2008年01期
5 張瑜;;網(wǎng)絡(luò)標(biāo)注的主要方法[J];湖北第二師范學(xué)院學(xué)報(bào);2010年02期
6 鞠彥輝;劉闖;;國外典型語義標(biāo)注平臺的比較研究[J];現(xiàn)代情報(bào);2009年01期
7 崔紅;段宇鋒;酈芳;;基于機(jī)器學(xué)習(xí)的生物多樣性英文文檔語義標(biāo)注研究[J];圖書情報(bào)知識;2011年02期
8 蘇菱;吳克偉;黃帥;;一種基于DTSVM的遙感圖像分割方法[J];合肥工業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版);2011年03期
9 李向陽;張亞非;;一種基于遺傳算法的語義標(biāo)注[J];電子科技大學(xué)學(xué)報(bào);2007年01期
10 張大陸;呂韜;;基于概念頻率的Web服務(wù)語義標(biāo)注[J];同濟(jì)大學(xué)學(xué)報(bào)(自然科學(xué)版);2008年01期
相關(guān)會議論文 前10條
1 陳波;姬東鴻;孫程;呂晨;;基于特征結(jié)構(gòu)的漢語主謂謂語句語義標(biāo)注研究[A];中國計(jì)算語言學(xué)研究前沿進(jìn)展(2009-2011)[C];2011年
2 袁柳;李戰(zhàn)懷;陳世亮;;OntoWord:一種新的Web頁面語義標(biāo)注方法[A];第二十五屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(二)[C];2008年
3 曾誠;李兵;何克清;;KMP算法在Web服務(wù)語義標(biāo)注中的應(yīng)用[A];2010年全國開放式分布與并行計(jì)算機(jī)學(xué)術(shù)會議論文集[C];2010年
4 韓先培;齊振宇;田野;王渝麗;趙軍;;基于領(lǐng)域語義信息的百科問答系統(tǒng)[A];中國計(jì)算機(jī)語言學(xué)研究前沿進(jìn)展(2007-2009)[C];2009年
5 宋雨;鄭懌;吳燕;;RDFa語義標(biāo)注技術(shù)綜述[A];2009全國計(jì)算機(jī)網(wǎng)絡(luò)與通信學(xué)術(shù)會議論文集[C];2009年
6 韓先培;趙軍;;基于Wikipedia的語義元數(shù)據(jù)生成[A];第四屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集(上)[C];2008年
7 房江太;黃映輝;李冠宇;;基于WSDL-S的Web服務(wù)語義標(biāo)注方法[A];2008'中國信息技術(shù)與應(yīng)用學(xué)術(shù)論壇論文集(一)[C];2008年
8 孫曉玲;林鴻飛;;統(tǒng)一語義視圖下的垂直領(lǐng)域跨語言檢索模型[A];中國計(jì)算機(jī)語言學(xué)研究前沿進(jìn)展(2007-2009)[C];2009年
9 周小甲;李昊e
本文編號:2577471
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2577471.html