天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 軟件論文 >

蘊(yùn)含地理事件微博客消息的自動(dòng)識(shí)別方法

發(fā)布時(shí)間:2017-09-26 01:32

  本文關(guān)鍵詞:蘊(yùn)含地理事件微博客消息的自動(dòng)識(shí)別方法


  更多相關(guān)文章: 微博客 地理事件 事件文本識(shí)別 主題模型 詞向量


【摘要】:微博客文本蘊(yùn)含類(lèi)型豐富的地理事件信息,能夠彌補(bǔ)傳統(tǒng)定點(diǎn)監(jiān)測(cè)手段的不足,提高事件應(yīng)急響應(yīng)質(zhì)量。然而,由于大規(guī)模標(biāo)注語(yǔ)料的普遍匱乏,無(wú)法利用監(jiān)督學(xué)習(xí)過(guò)程識(shí)別蘊(yùn)含地理事件信息的微博客文本。為此,本文提出一種蘊(yùn)含地理事件微博客消息的自動(dòng)識(shí)別方法,通過(guò)快速獲取的語(yǔ)料資源增強(qiáng)識(shí)別效果。該方法利用主題模型具有提取文檔中主題集合的優(yōu)勢(shì),通過(guò)主題過(guò)濾候選語(yǔ)料文本,實(shí)現(xiàn)地理事件語(yǔ)料的自動(dòng)提取。同時(shí),將分布式表達(dá)詞向量模型引入事件相關(guān)性計(jì)算過(guò)程,借助詞向量隱含的語(yǔ)義信息豐富微博客短文本的上下文內(nèi)容,進(jìn)一步增強(qiáng)事件消息的識(shí)別效果。通過(guò)以新浪微博為數(shù)據(jù)源開(kāi)展的實(shí)驗(yàn)分析表明,本文提出的蘊(yùn)含地理事件信息微博客消息識(shí)別方法,識(shí)別來(lái)自事件微博話(huà)題的消息文本的F-1值可達(dá)到71.41%,比經(jīng)典的基于SVM模型的監(jiān)督學(xué)習(xí)方法提高了10.79%。在模擬真實(shí)微博環(huán)境的500萬(wàn)微博客數(shù)據(jù)集上的識(shí)別準(zhǔn)確率達(dá)到60%。
【作者單位】: 中國(guó)科學(xué)院地理科學(xué)與資源研究所資源與環(huán)境信息系統(tǒng)國(guó)家重點(diǎn)實(shí)驗(yàn)室;中國(guó)科學(xué)院大學(xué);
【關(guān)鍵詞】微博客 地理事件 事件文本識(shí)別 主題模型 詞向量
【基金】:國(guó)家“863”計(jì)劃課題(2013AA120305) 國(guó)家自然科學(xué)基金項(xiàng)目(41401460)
【分類(lèi)號(hào)】:TP393.092;TP391.1
【正文快照】: 1引言文本[7]。對(duì)于內(nèi)容自由度更高的開(kāi)放文本,監(jiān)督學(xué)習(xí)識(shí)別方法的效果更好,但監(jiān)督學(xué)習(xí)方法需要足夠近年來(lái),隨著智能終端和移動(dòng)互聯(lián)網(wǎng)的普及,的標(biāo)注語(yǔ)料進(jìn)行模型訓(xùn)練,大部分研究使用的語(yǔ)料位置服務(wù)應(yīng)用不斷增長(zhǎng),與空間位置密切相關(guān)的地主要來(lái)源于開(kāi)放的測(cè)評(píng)語(yǔ)料[4,8]或人工標(biāo)

【相似文獻(xiàn)】

中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條

1 溫艷玲;;食品追溯系統(tǒng)自動(dòng)識(shí)別方法研究——以豬肉食品為例[J];信息與電腦(理論版);2011年12期

2 劉惠娟;周源華;;地圖中河流的自動(dòng)識(shí)別方法[J];自動(dòng)化學(xué)報(bào);1993年04期

3 張仰森,徐波,曹元大,宗成慶;基于姓氏驅(qū)動(dòng)的中國(guó)姓名自動(dòng)識(shí)別方法[J];計(jì)算機(jī)工程與應(yīng)用;2003年04期

4 唐慧君,王建軍,羅秀娟,周泗忠;一種點(diǎn)陣碼的自動(dòng)識(shí)別方法[J];應(yīng)用光學(xué);2004年05期

5 秦海勤;徐可君;江龍平;;分形理論應(yīng)用中無(wú)標(biāo)度區(qū)自動(dòng)識(shí)別方法[J];機(jī)械工程學(xué)報(bào);2006年12期

6 游宏梁;張巍;沈鈞毅;劉挺;;一種基于加權(quán)投票的術(shù)語(yǔ)自動(dòng)識(shí)別方法[J];中文信息學(xué)報(bào);2011年03期

7 周激流,何其超;人臉正面模式自動(dòng)識(shí)別方法研究[J];四川大學(xué)學(xué)報(bào)(自然科學(xué)版);1993年01期

8 陳京德,季明松;非接觸IC卡讀寫(xiě)領(lǐng)域的一次技術(shù)創(chuàng)新——非接觸IC卡多功能讀寫(xiě)器[J];金卡工程;2003年05期

9 曾維亮;梁春生;李冉;皮亦鳴;;基于邊緣最大匹配的印鑒自動(dòng)識(shí)別方法[J];信息與電子工程;2006年05期

10 曾維亮;梁春生;李冉;;基于邊緣最大匹配的印鑒自動(dòng)識(shí)別方法[J];實(shí)驗(yàn)科學(xué)與技術(shù);2006年S1期

中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前10條

1 鄭家恒;楊曉巖;;英文譯名自動(dòng)識(shí)別方法研究[A];輝煌二十年——中國(guó)中文信息學(xué)會(huì)二十周年學(xué)術(shù)會(huì)議論文集[C];2001年

2 鐘茂生;;基于詞語(yǔ)形式標(biāo)記的句際語(yǔ)義關(guān)系自動(dòng)識(shí)別方法[A];第五屆全國(guó)信息檢索學(xué)術(shù)會(huì)議論文集[C];2009年

3 張巍;游宏梁;張吉才;;一種基于加權(quán)投票的術(shù)語(yǔ)自動(dòng)識(shí)別方法[A];第六屆全國(guó)信息檢索學(xué)術(shù)會(huì)議論文集[C];2010年

4 黃行;江荻;;現(xiàn)代藏語(yǔ)判定動(dòng)詞句主賓語(yǔ)的自動(dòng)識(shí)別方法[A];語(yǔ)言計(jì)算與基于內(nèi)容的文本處理——全國(guó)第七屆計(jì)算語(yǔ)言學(xué)聯(lián)合學(xué)術(shù)會(huì)議論文集[C];2003年

5 杜小毅;于濂;;基于聯(lián)合特征的車(chē)標(biāo)自動(dòng)識(shí)別方法[A];第七屆中國(guó)智能交通年會(huì)優(yōu)秀論文集——智能交通技術(shù)[C];2012年

6 王寧;游志勝;潘薇;李貴俊;;一種護(hù)照編碼自動(dòng)識(shí)別方法[A];信號(hào)與信息處理技術(shù)第三屆信號(hào)與信息處理全國(guó)聯(lián)合學(xué)術(shù)會(huì)議論文集[C];2004年

7 尚英;;動(dòng)詞重疊形式的自動(dòng)識(shí)別方法研究[A];第二屆全國(guó)學(xué)生計(jì)算語(yǔ)言學(xué)研討會(huì)論文集[C];2004年

8 劉旭花;孟祥增;劉俊曉;吳鵬飛;;一種基于知識(shí)庫(kù)的圖像對(duì)象自動(dòng)識(shí)別方法[A];第十三屆全國(guó)圖象圖形學(xué)學(xué)術(shù)會(huì)議論文集[C];2006年

9 王昆翔;韓加;徐勇;;關(guān)于人臉圖象自動(dòng)識(shí)別方法的研究[A];2001年中國(guó)智能自動(dòng)化會(huì)議論文集(上冊(cè))[C];2001年

10 楊志華;齊東旭;江力;楊力華;;一種基于EMD分解的睡眠腦電圖梭形波自動(dòng)識(shí)別方法[A];第一屆中國(guó)情感計(jì)算及智能交互學(xué)術(shù)會(huì)議論文集[C];2003年

中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條

1 陳U,

本文編號(hào):920761


資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/920761.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶(hù)24687***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com