天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 搜索引擎論文 >

面向信息分析與預(yù)測(cè)的網(wǎng)絡(luò)搜索關(guān)鍵詞集中度和相關(guān)度研究

發(fā)布時(shí)間:2019-09-08 19:09
【摘要】:基于網(wǎng)絡(luò)搜索的信息分析與預(yù)測(cè)是依據(jù)用戶的網(wǎng)絡(luò)搜索行為來解釋事物內(nèi)在規(guī)律,并對(duì)事物未知變化趨勢(shì)進(jìn)行估計(jì)的一種信息分析與預(yù)測(cè)活動(dòng)。它的起源和發(fā)展離不開互聯(lián)網(wǎng)的普及和發(fā)展,尤其是網(wǎng)絡(luò)搜索引擎的出現(xiàn),為信息分析與預(yù)測(cè)提供了龐大的用戶樣本和海量的數(shù)據(jù)。國(guó)外研究人員在本世紀(jì)初就開始了該領(lǐng)域的實(shí)證研究, Ginsberg等人針對(duì)流感流行趨勢(shì)的研究成為該領(lǐng)域研究的重要代表成果,也推動(dòng)了基于網(wǎng)絡(luò)搜索的信息分析與預(yù)測(cè)研究成為國(guó)內(nèi)外學(xué)者廣泛關(guān)注的研究?jī)?nèi)容。 本文以基于網(wǎng)絡(luò)搜索的信息分析與預(yù)測(cè)活動(dòng)中的重要環(huán)節(jié)——關(guān)鍵詞選擇作為研究對(duì)象,詳細(xì)介紹了基于網(wǎng)絡(luò)搜索的信息分析與預(yù)測(cè)活動(dòng)的相關(guān)理論,闡述了面向信息分析與預(yù)測(cè)的網(wǎng)絡(luò)搜索關(guān)鍵詞選擇的基本過程,詳細(xì)介紹了關(guān)鍵詞選擇的兩種方法,即關(guān)鍵詞集中度和相關(guān)度,嘗試使用這兩種方法對(duì)觀測(cè)關(guān)鍵詞的選擇進(jìn)行實(shí)驗(yàn)效果分析。 全文共分六章,主要內(nèi)容如下: (1)基于網(wǎng)絡(luò)搜索的信息分析與預(yù)測(cè)的相關(guān)理論 本章系統(tǒng)闡述了基于網(wǎng)絡(luò)搜索的信息分析與預(yù)測(cè)的概念、起源和發(fā)展、作用、特點(diǎn),以及基于網(wǎng)絡(luò)搜索的信息分析與預(yù)測(cè)的研究視角、內(nèi)在機(jī)制及影響因素,并利用Ginsberg的45個(gè)流感關(guān)鍵詞分析了基于網(wǎng)絡(luò)搜索的信息分析與預(yù)測(cè)的局限性,最后提出了基于網(wǎng)絡(luò)搜索的信息分析與預(yù)測(cè)的基本流程。 (2)面向信息分析與預(yù)測(cè)的網(wǎng)絡(luò)搜索關(guān)鍵詞選擇的基本過程 本章重點(diǎn)介紹了分析預(yù)測(cè)過程的重要環(huán)節(jié)——關(guān)鍵詞選擇的過程。關(guān)鍵詞、數(shù)據(jù)集以及分析預(yù)測(cè)模型是基于網(wǎng)絡(luò)搜索的信息分析與預(yù)測(cè)的三個(gè)主要因素;诰W(wǎng)絡(luò)搜索的信息分析與預(yù)測(cè)活動(dòng)包括前期分析、關(guān)鍵詞選擇、相關(guān)分析及預(yù)測(cè)模型建立、效果驗(yàn)證、實(shí)施預(yù)測(cè)、動(dòng)態(tài)修正等六個(gè)主要環(huán)節(jié)。關(guān)鍵詞的選擇過程包括任務(wù)準(zhǔn)備、選擇關(guān)鍵詞數(shù)據(jù)來源、選擇初始關(guān)鍵詞、收集候選關(guān)鍵詞以及確定觀測(cè)關(guān)鍵詞、確定關(guān)鍵詞的分析與預(yù)測(cè)組合以及反饋修改等七個(gè)主要過程。關(guān)鍵詞選擇過程是從初始關(guān)鍵詞、候選關(guān)鍵詞到觀測(cè)關(guān)鍵詞的一個(gè)過程。對(duì)于最終用于分析與預(yù)測(cè)的觀測(cè)關(guān)鍵詞則具有典型的馬太效應(yīng)、長(zhǎng)尾效應(yīng)等現(xiàn)象,其離散分布則呈現(xiàn)出一種Zipf分布特征。 (3)關(guān)鍵詞集中度分析 本章引入了關(guān)鍵詞集中度、關(guān)鍵詞移動(dòng)平均集中度、關(guān)鍵詞集中度變化率以及關(guān)鍵詞移動(dòng)平均集中度變化率等概念。以Ginsberg的45個(gè)流感關(guān)鍵詞作為研究對(duì)象,發(fā)現(xiàn)在區(qū)分關(guān)鍵詞“穩(wěn)定—突變”特征的效果上,關(guān)鍵詞集中度變化率要優(yōu)于關(guān)鍵詞集中度。 (4)關(guān)鍵詞相關(guān)度分析 本章主要介紹了簡(jiǎn)單相關(guān)性分析和時(shí)序相關(guān)分析方法,包括pearson、spearman、時(shí)差相關(guān)、峰谷對(duì)應(yīng)等相關(guān)分析方法。在與萬科股票相關(guān)的關(guān)鍵詞選擇實(shí)例分析中,發(fā)現(xiàn)pearson、spearman可以有效地判斷同步條件下的關(guān)鍵詞相關(guān)性強(qiáng)弱特征,而時(shí)差相關(guān)分析方法則可以有效地識(shí)別關(guān)鍵詞“領(lǐng)先—滯后”特征。 (5)H7N9禽流感關(guān)鍵詞選擇實(shí)驗(yàn)研究 本章主要結(jié)合2013年上半年爆發(fā)的H7N9禽流感疫情,運(yùn)用關(guān)鍵詞集中度和相關(guān)度分析方法,對(duì)與H7N9禽流感爆發(fā)有關(guān)的關(guān)鍵詞進(jìn)行比較分析,并得出了可用于不同研究領(lǐng)域的三組觀測(cè)關(guān)鍵詞表。 (6)對(duì)論文的整體進(jìn)行總結(jié)和展望 本章對(duì)全文的研究工作進(jìn)行總結(jié),并對(duì)基于網(wǎng)絡(luò)搜索的信息分析與預(yù)測(cè)研究的未來發(fā)展方向進(jìn)行了展望,提出了三個(gè)有價(jià)值的研究問題。
【圖文】:

全球互聯(lián)網(wǎng),互聯(lián)網(wǎng),移動(dòng)應(yīng)用,節(jié)點(diǎn)狀態(tài)


選題背景和研究意義.1選題背景從上世紀(jì)90年代互聯(lián)網(wǎng)誕生后,網(wǎng)絡(luò)數(shù)據(jù)量急劇膨脹。據(jù)2009年英國(guó)衛(wèi)報(bào)篇報(bào)道稱,由于互聯(lián)網(wǎng)社交網(wǎng)站、帶有上網(wǎng)功能的移動(dòng)電話和政府不斷膨脹頻監(jiān)視器的同T 作用下,全球的數(shù)據(jù)總量已經(jīng)達(dá)到4870億GB?。圖0-1是rl.com的internet map移動(dòng)應(yīng)用軟件?展示的全球互聯(lián)網(wǎng)節(jié)點(diǎn)的發(fā)展歷程和趨三張圖分別是1994、2012和2020年全球互聯(lián)網(wǎng)節(jié)點(diǎn)狀態(tài)。從第三張圖可以,未來互聯(lián)網(wǎng)的發(fā)展將完全滲透全球各個(gè)角落。

網(wǎng)站,流感,全球


搜索“流感”的人都真的患有流感,但當(dāng)把與流感有關(guān)的搜索查詢匯總按時(shí)間順序統(tǒng)計(jì)時(shí),發(fā)現(xiàn)許多搜索查詢?cè)诹鞲屑竟?jié)確實(shí)會(huì)明顯增多②(如圖0-2所示,其中紅色連續(xù)實(shí)線表示cdc數(shù)據(jù),黑色分?jǐn)鄬?shí)線表示搜索分析數(shù)據(jù),,黑色虛線表示預(yù)測(cè)值區(qū)間)。通過對(duì)世界各地與流感相關(guān)搜索查詢次數(shù)進(jìn)行統(tǒng)計(jì),谷歌便估測(cè)出世界上不同國(guó)家和地區(qū)的流感爆發(fā)情況? (如圖0_3所示)。12 1 1 1 1~‘ 1 10 - I .-! 1 I -8 e - ;1 I -2004 2005 2006 2007 2008圖0 - 2 google flu預(yù)測(cè)模型結(jié)果-.... ‘圖0 - 3 google flu trends網(wǎng)站公布的全球流感監(jiān)測(cè)圖① http://www.cclc.gov/flu/index.htm? http://www.google.org/flutrends/about/how.html③ http://www.google.org/flutrends/7
【學(xué)位授予單位】:武漢大學(xué)
【學(xué)位級(jí)別】:博士
【學(xué)位授予年份】:2013
【分類號(hào)】:G252.7

【參考文獻(xiàn)】

相關(guān)期刊論文 前10條

1 王知津;韓正彪;;信息行為集成化研究框架初探[J];中國(guó)圖書館學(xué)報(bào);2012年01期

2 鄧曉旭;;網(wǎng)絡(luò)傳播價(jià)值體系論[J];陜西師范大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版);2010年06期

3 曾潤(rùn)喜;;網(wǎng)絡(luò)輿情管控工作機(jī)制研究[J];圖書情報(bào)工作;2009年18期

4 曾潤(rùn)喜;;網(wǎng)絡(luò)輿情信息資源共享研究[J];情報(bào)雜志;2009年08期

5 胡軍;張超;陳平雁;;非參數(shù)雙變量相關(guān)分析方法Spearman和Kendall的Monte Carlo模擬比較[J];中國(guó)衛(wèi)生統(tǒng)計(jì);2008年06期

6 紀(jì)良綱;王慧娟;;商品流通規(guī)模監(jiān)測(cè)預(yù)警指標(biāo)的篩選——基于時(shí)差相關(guān)分析法的視角[J];經(jīng)濟(jì)與管理;2008年02期

7 蘇金樹;張博鋒;徐昕;;基于機(jī)器學(xué)習(xí)的文本分類技術(shù)研究進(jìn)展[J];軟件學(xué)報(bào);2006年09期

8 李雙雙;陳毅文;李江予;;消費(fèi)者網(wǎng)上購(gòu)物決策模型分析[J];心理科學(xué)進(jìn)展;2006年02期

9 曹雙喜;鄧小昭;;網(wǎng)絡(luò)用戶信息行為研究述略[J];情報(bào)雜志;2006年02期

10 何明升;網(wǎng)絡(luò)消費(fèi)方式的內(nèi)在結(jié)構(gòu)及其形成機(jī)理[J];哈爾濱工業(yè)大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版);2002年01期

相關(guān)博士學(xué)位論文 前1條

1 王曰芬;文獻(xiàn)計(jì)量法與內(nèi)容分析法的綜合研究[D];南京理工大學(xué);2007年

相關(guān)碩士學(xué)位論文 前4條

1 邱娣;基于Web日志挖掘的用戶信息需求識(shí)別研究[D];華中師范大學(xué);2012年

2 王林生;我國(guó)網(wǎng)絡(luò)消費(fèi)影響因素理論與實(shí)證分析[D];重慶工商大學(xué);2012年

3 劉華;論搜索數(shù)據(jù)在網(wǎng)絡(luò)傳播研究中的應(yīng)用價(jià)值與途徑[D];山東師范大學(xué);2011年

4 王斕樾;用戶行為分析在搜索引擎中的應(yīng)用[D];沈陽(yáng)工業(yè)大學(xué);2007年



本文編號(hào):2533401

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2533401.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶db3b2***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com