基于新浪微博的冰雹實(shí)況信息提取方法和實(shí)用性研究
發(fā)布時(shí)間:2023-05-17 23:57
通過網(wǎng)絡(luò)爬蟲提取新浪微博的冰雹信息,比較文檔頻率(DF)、詞頻-逆向文件頻率(TF-IDF)、信息增益(IG)、互信息(MI)、卡方檢驗(yàn)(CHI)、類間詞頻方差(DAC)在SVM支持向量機(jī)、NB樸素貝葉斯分類器、KNN K近鄰分類器、DT決策樹以及Google公司BERT模型分類器的訓(xùn)練測(cè)試結(jié)果,發(fā)現(xiàn)互信息(MI)函數(shù)分類排序在樸素貝葉斯(NB)分類器訓(xùn)練的模型在對(duì)冰雹降雹事件識(shí)別準(zhǔn)確率較高,制定了冰雹實(shí)況提取規(guī)則,并提取出冰雹的時(shí)間、地點(diǎn)、大小,與山西109個(gè)氣象臺(tái)站2010-02—2020-12的觀測(cè)資料對(duì)比,通過微博提取的冰雹實(shí)況信息雖然不能替代氣象臺(tái)站的工作,但是有一定參考性。
【文章頁數(shù)】:3 頁
本文編號(hào):3818262
【文章頁數(shù)】:3 頁
本文編號(hào):3818262
本文鏈接:http://sikaile.net/projectlw/qxxlw/3818262.html
最近更新
教材專著