基于新浪微博的冰雹實況信息提取方法和實用性研究
發(fā)布時間:2023-05-17 23:57
通過網絡爬蟲提取新浪微博的冰雹信息,比較文檔頻率(DF)、詞頻-逆向文件頻率(TF-IDF)、信息增益(IG)、互信息(MI)、卡方檢驗(CHI)、類間詞頻方差(DAC)在SVM支持向量機、NB樸素貝葉斯分類器、KNN K近鄰分類器、DT決策樹以及Google公司BERT模型分類器的訓練測試結果,發(fā)現互信息(MI)函數分類排序在樸素貝葉斯(NB)分類器訓練的模型在對冰雹降雹事件識別準確率較高,制定了冰雹實況提取規(guī)則,并提取出冰雹的時間、地點、大小,與山西109個氣象臺站2010-02—2020-12的觀測資料對比,通過微博提取的冰雹實況信息雖然不能替代氣象臺站的工作,但是有一定參考性。
【文章頁數】:3 頁
本文編號:3818262
【文章頁數】:3 頁
本文編號:3818262
本文鏈接:http://sikaile.net/projectlw/qxxlw/3818262.html