農業(yè)物聯網文本數據統(tǒng)計分析
發(fā)布時間:2021-10-08 04:21
隨著互聯網和物聯網等信息技術的飛速發(fā)展,網絡中積累了大量半結構化和非結構化的文本數據,如何從這些海量的文本中獲取所需的信息,已經成為了統(tǒng)計分析工作者的一項重要任務。近年來,隨著人們物質生活需求的不斷增長,農業(yè)產品的質量和產量等問題越來越被重視,以信息和軟件為中心生產模式的農業(yè)物聯網得到了廣泛的應用,其實時監(jiān)控、遠程控制和查詢等功能對現代農業(yè)的發(fā)展具有重要意義,對農業(yè)物聯網上的文本進行挖掘是一件非常有價值的事情。目前,國內外對文本挖掘進行了大量的研究,文本挖掘的方法日趨完善,文本挖掘的內容日漸豐富,其主要在相似性檢測、文本分類和信息獲取等領域,另外,高效直觀信息圖成為了新型文本內容顯示方式,如文字云。本文主要采用農業(yè)物聯網中的文本數據,從文本相似性和文本文字云兩個方面展開探討和研究。在文本相似性研究方面,本文采用了兩種方法對文本進行相似性分析,一種是結合關鍵詞微變的聚類和LD算法的方法,首先約簡文本中的低頻詞,利用LD算法分析詞與詞之間的相似度,建立文本相似度矩陣,然后用特征詞間的相似度及其權重來構建空間向量,最后計算文本間的相似度;另一種是結合閾值優(yōu)化和e EP模式的方法,在獲取文檔特...
【文章來源】:安慶師范大學安徽省
【文章頁數】:57 頁
【學位級別】:碩士
【部分圖文】:
Imagechef文字云
Wordle文字云
Tagxedo文字云
【參考文獻】:
期刊論文
[1]數據流分類挖掘中的概念變化研究[J]. 韓法旺,劉耀宗. 計算機科學. 2014(S2)
[2]一種基于向量空間模型的模糊本體映射方法[J]. 張凌宇,陳淑鑫,張光妲,呂洪柱. 計算機應用研究. 2014(05)
[3]基于統(tǒng)計偏好的邊界域重構方法[J]. 程玉勝,詹文法,張玉州. 小型微型計算機系統(tǒng). 2013(11)
[4]基于文本密度模型的Web正文抽取[J]. 朱澤德,李淼,張健,陳雷,曾新華. 模式識別與人工智能. 2013(07)
[5]基于文本空間表示模型的文本相似度計算研究[J]. 張文萍,黎春蘭. 現代情報. 2013(02)
[6]面向文本分類的中文文本語義表示方法[J]. 宋勝利,王少龍,陳平. 西安電子科技大學學報. 2013(02)
[7]基于TFIDF和詞語關聯度的中文關鍵詞提取方法[J]. 張建娥. 情報科學. 2012(10)
[8]文字云圖的英語閱讀教學設計與實踐——以文字云圖工具Wordle為例[J]. 杜華. 現代教育技術. 2012(09)
[9]信息可視化在信息表達中的重要性和應用[J]. 徐海波. 信息與電腦(理論版). 2012(09)
[10]基于加權語義網的文本相似度計算的研究[J]. 廖開際,楊彬彬. 情報雜志. 2012(07)
本文編號:3423419
【文章來源】:安慶師范大學安徽省
【文章頁數】:57 頁
【學位級別】:碩士
【部分圖文】:
Imagechef文字云
Wordle文字云
Tagxedo文字云
【參考文獻】:
期刊論文
[1]數據流分類挖掘中的概念變化研究[J]. 韓法旺,劉耀宗. 計算機科學. 2014(S2)
[2]一種基于向量空間模型的模糊本體映射方法[J]. 張凌宇,陳淑鑫,張光妲,呂洪柱. 計算機應用研究. 2014(05)
[3]基于統(tǒng)計偏好的邊界域重構方法[J]. 程玉勝,詹文法,張玉州. 小型微型計算機系統(tǒng). 2013(11)
[4]基于文本密度模型的Web正文抽取[J]. 朱澤德,李淼,張健,陳雷,曾新華. 模式識別與人工智能. 2013(07)
[5]基于文本空間表示模型的文本相似度計算研究[J]. 張文萍,黎春蘭. 現代情報. 2013(02)
[6]面向文本分類的中文文本語義表示方法[J]. 宋勝利,王少龍,陳平. 西安電子科技大學學報. 2013(02)
[7]基于TFIDF和詞語關聯度的中文關鍵詞提取方法[J]. 張建娥. 情報科學. 2012(10)
[8]文字云圖的英語閱讀教學設計與實踐——以文字云圖工具Wordle為例[J]. 杜華. 現代教育技術. 2012(09)
[9]信息可視化在信息表達中的重要性和應用[J]. 徐海波. 信息與電腦(理論版). 2012(09)
[10]基于加權語義網的文本相似度計算的研究[J]. 廖開際,楊彬彬. 情報雜志. 2012(07)
本文編號:3423419
本文鏈接:http://sikaile.net/jingjilunwen/nongyejingjilunwen/3423419.html
最近更新
教材專著