手機健康管理類應(yīng)用縱向大數(shù)據(jù)管理與統(tǒng)計分析
【圖文】:
1.1健康管理類APP的數(shù)據(jù)特點1.1.1一個橫庫與多個縱庫的組合形式健康管理類APP數(shù)據(jù)庫常見的構(gòu)成形式為一個橫向數(shù)據(jù)庫與多個縱向數(shù)據(jù)庫的組合。橫向庫中保存用戶的基本信息,以用戶的性別、地址等類似數(shù)據(jù)構(gòu)成,橫庫中常常包含用戶的一些敏感信息,如姓名、電話、電子郵箱等。APP相應(yīng)記錄功能的每一個模塊又對應(yīng)著一個縱向數(shù)據(jù)庫,其包含的信息為事件類型、數(shù)值、記錄的時間。例如APP中體重記錄模塊會記錄用戶每次測量體重的具體數(shù)值和時間。該類數(shù)據(jù)為標(biāo)準(zhǔn)的縱向數(shù)據(jù)。橫庫和縱庫通過用戶的唯一編碼進行關(guān)聯(lián)。具體如圖1所示。1.1.2數(shù)據(jù)量大健康管理類APP的數(shù)據(jù)量大體現(xiàn)在兩個層面。第一層面為用戶量層面,應(yīng)用商店中用戶量為千萬級別的熱門健康管理APP越來越多。第二層面為用戶的記錄層面,健康管理類APP記錄的數(shù)據(jù),尤其是客觀記錄的傳感器數(shù)據(jù),包括用戶記錄的走步、運動、睡眠等信息,單位用戶本身的原始記錄量是巨大的。而近年來,社交元素也加入到了健康管理類APP中,這也促使了這類APP吸引了大量用戶進行長期的、詳細的信息記錄。1.1.3原始記錄需進一步信息提取這類APP所記錄的原始數(shù)據(jù)往往不能直接被利用,比如用戶記錄的走步實際數(shù)據(jù)庫中的原始數(shù)據(jù)為某一步伐發(fā)生的具體時間,用戶記錄的睡眠數(shù)據(jù)實際為睡眠開始時間、結(jié)束時間,,某一時間段的深睡眠和淺睡眠的開始時間、結(jié)束時間。但進行統(tǒng)計分析時,原始數(shù)據(jù)需要進行進一步的信息提取,以獲得符合統(tǒng)計分析目的數(shù)據(jù),如每日步數(shù),睡眠總時長等。1.1.4數(shù)據(jù)質(zhì)量差健康管理類APP的數(shù)據(jù)質(zhì)量在不同的數(shù)據(jù)類型中有一定差異。例如實例中的女性月經(jīng)管理數(shù)據(jù)和用戶的膳食記錄數(shù)據(jù),均屬于用戶自報型數(shù)據(jù)。受本身數(shù)據(jù)收集形式所限,數(shù)據(jù)質(zhì)量較差。而運動數(shù)據(jù)、睡眠數(shù)據(jù)這類被?
狽椒ń?行信息提取得到二次數(shù)據(jù)后,對于二次數(shù)據(jù)采用類似的方法進行缺失值、異常值的清理。若發(fā)現(xiàn)的缺失值、異常值來源于原始數(shù)據(jù)異常,需對原始數(shù)據(jù)進行清理,并同時再次進行信息提取生成更新后的二次數(shù)據(jù)庫。1.2.5篩選可靠用戶數(shù)據(jù)與信息庫合并為保證數(shù)據(jù)的可靠性,建議在獲得清理后的二次數(shù)據(jù)后,篩選出數(shù)據(jù)記錄詳實的用戶。可限定所保留的用戶最少記錄條數(shù),已篩選出相對活躍用戶的記錄,數(shù)據(jù)更可靠。將篩選后的數(shù)據(jù)(縱庫)和用戶信息庫(橫庫)合并,在縱庫里獲得橫庫中的受試者信息。具體的數(shù)據(jù)管理過程如圖2。1.3統(tǒng)計分析方法經(jīng)過數(shù)據(jù)管理后的健康管理類APP數(shù)據(jù)符合如下特點:①數(shù)據(jù)為縱向大數(shù)據(jù);②每位用戶的記錄次數(shù)和記錄時間點不一定相同;③不同時點的觀測值可能存在相關(guān)性。本類資料需根據(jù)數(shù)據(jù)類型的不同,對數(shù)值型資料可采用混合效應(yīng)模型[5,6],對分類型資料可采用廣義混合線性模型和廣義估計方程進行分析[7,8]。2實例分析2.1實例數(shù)據(jù)介紹本實例所使用的數(shù)據(jù)來源于某互聯(lián)網(wǎng)公司開發(fā)的女性月經(jīng)管理APP。該APP的核心功能是用戶記錄每月經(jīng)開始日期及結(jié)束日期以獲得下次月經(jīng)的預(yù)測和提醒。用戶每月定期記錄月經(jīng)開始事件(event-type=1)及結(jié)束事件(eventtype=2)(圖3),APP實現(xiàn)月經(jīng)周期的記錄及預(yù)測。本研究使用的數(shù)據(jù)為該公司從注冊用戶的前100萬活躍用戶中隨機抽選的15萬用戶,截至?xí)r間為2015年2月1日以前的數(shù)據(jù)。2.2數(shù)據(jù)管理過程與結(jié)果通過兩次月經(jīng)開始的間隔獲得月經(jīng)周期的數(shù)據(jù)。最終數(shù)據(jù)管理的過程和結(jié)果見表2、3。2.3統(tǒng)計分析過程與結(jié)果數(shù)據(jù)管理所獲得的用戶月經(jīng)周期長度為縱向大數(shù)據(jù),且不同用戶記錄時點和記錄次數(shù)不一定相同,本例采用混合效應(yīng)模型進行數(shù)據(jù)分析。因變量是用戶?
【相似文獻】
相關(guān)期刊論文 前10條
1 張俊華;戴國華;商洪才;曹紅波;任明;項耀祖;高秀梅;張伯禮;;中醫(yī)藥大規(guī)模臨床研究的數(shù)據(jù)核查[J];中國循證醫(yī)學(xué)雜志;2007年03期
2 曲超;;臨床科研中的數(shù)據(jù)管理[J];中國社區(qū)醫(yī)師;2014年01期
3 蘆殿榮;李冬云;陳信義;姜靖雯;白樺;;臨床研究課題資料收集過程中的數(shù)據(jù)管理及其質(zhì)控探討[J];中醫(yī)藥管理雜志;2008年10期
4 李雪迎;;重視數(shù)據(jù)管理保障臨床研究科學(xué)性和可靠性[J];中國介入心臟病學(xué)雜志;2013年06期
5 范繼榮;歐陽環(huán)宇;黃少敏;盧建宇;;淺談藥品、器械財務(wù)數(shù)據(jù)管理通用接口軟件[J];中國藥物經(jīng)濟學(xué);2014年02期
6 冀鵬;淺談煤炭醫(yī)院藥品信息化的數(shù)據(jù)管理[J];煤炭經(jīng)濟研究;2002年12期
7 卜擎燕;熊寧寧;鄒建東;蔣萌;劉芳;;從臨床研究數(shù)據(jù)管理角度設(shè)計病例報告表[J];中國新藥雜志;2007年05期
8 王華清,林家瑞;24小時動態(tài)ECG分析系統(tǒng)中數(shù)據(jù)管理的應(yīng)用研究[J];中國醫(yī)療器械雜志;1995年03期
9 王建;周祖木;;HIV抗體初篩實驗室的數(shù)據(jù)管理及其程序研制[J];旅行醫(yī)學(xué)科學(xué);2001年04期
10 李偉;卜擎燕;鄒建東;熊寧寧;;編輯檢查在臨床研究數(shù)據(jù)管理中的應(yīng)用[J];中國臨床藥理學(xué)與治療學(xué);2009年01期
相關(guān)會議論文 前10條
1 馮偉一;張博;;PDM技術(shù)在服裝企業(yè)中的應(yīng)用[A];2005現(xiàn)代服裝紡織高科技發(fā)展研討會論文集[C];2005年
2 王_g;;淺析現(xiàn)階段煤炭集團企業(yè)信息化數(shù)據(jù)管理的決定因素[A];第18屆全國煤礦自動化與信息化學(xué)術(shù)會議論文集[C];2008年
3 鄭文心;謝文秀;彭勇;黃瑋;;試驗數(shù)據(jù)管理的企業(yè)集成方法研究[A];第三屆民用飛機先進制造技術(shù)及裝備論壇論文匯編[C];2011年
4 楊茂瑜;郎中凱;王恒芹;吳羿;;EXCEL在HIV檢測數(shù)據(jù)管理中的應(yīng)用[A];重慶市預(yù)防醫(yī)學(xué)會2012年學(xué)術(shù)年會論文集[C];2012年
5 周娜紅;宋瑋;高坤靜;;面向服務(wù)的繼電保護整定計算和數(shù)據(jù)管理研究[A];中國高等學(xué)校電力系統(tǒng)及其自動化專業(yè)第二十四屆學(xué)術(shù)年會論文集(中冊)[C];2008年
6 沈春慧;;關(guān)于加強稅收征管業(yè)務(wù)數(shù)據(jù)管理的實踐與思考[A];中國管理科學(xué)文獻[C];2008年
7 聶培堯;徐秋元;;知識系統(tǒng)在科學(xué)數(shù)據(jù)管理中的應(yīng)用[A];第九屆全國數(shù)據(jù)庫學(xué)術(shù)會議論文集(下)[C];1990年
8 蔣愛華;;城鄉(xiāng)一體化數(shù)據(jù)管理探討[A];中國測繪學(xué)會九屆三次理事會暨2007年“信息化測繪論壇”學(xué)術(shù)年會論文集[C];2007年
9 朱曉華;;尋求深海測量數(shù)據(jù)管理新途徑——Bathy DataBASE技術(shù)研究[A];中國航海學(xué)會航標(biāo)專業(yè)委員會測繪學(xué)組學(xué)術(shù)研討會學(xué)術(shù)交流論文集[C];2008年
10 吳桂琴;趙萍;劉愛巧;;蛋雞育種數(shù)據(jù)管理與分析系統(tǒng)的應(yīng)用[A];安全優(yōu)質(zhì)的家禽生產(chǎn)——第十五次全國家禽學(xué)術(shù)討論會論文集[C];2011年
相關(guān)重要報紙文章 前10條
1 單群一;惠普:讓數(shù)據(jù)管理告別“亞健康”[N];中國稅務(wù)報;2007年
2 李蒙生;數(shù)據(jù)管理年會落下帷幕 同方知網(wǎng)軟件喜獲殊榮[N];中國電腦教育報;2007年
3 黎江 王頌;保險公司:從數(shù)據(jù)管理“泥沼”中突圍[N];金融時報;2006年
4 郭濤;統(tǒng)一數(shù)據(jù)管理 特立而獨行[N];中國計算機報;2007年
5 本報記者 于翔;統(tǒng)一數(shù)據(jù)管理向“云”延伸[N];網(wǎng)絡(luò)世界;2009年
6 記者 劉一冰;CommVault再發(fā)力[N];電腦商報;2011年
7 記者 劉佳;全國首個數(shù)據(jù)管理基礎(chǔ)標(biāo)準(zhǔn)在大連問世[N];遼寧日報;2012年
8 趙愛東 記者 巴家偉;全國首個數(shù)據(jù)管理基礎(chǔ)標(biāo)準(zhǔn)“大連造”[N];大連日報;2012年
9 《網(wǎng)絡(luò)世界》記者 柴莎莎;攜一體化夢想 翱翔數(shù)據(jù)管理天空[N];網(wǎng)絡(luò)世界;2012年
10 本報記者 陳錚;須從多維度提升水平[N];中國醫(yī)藥報;2012年
相關(guān)博士學(xué)位論文 前7條
1 錢鵬;高?茖W(xué)數(shù)據(jù)管理研究[D];南京大學(xué);2012年
2 孔蘭菊;SaaS應(yīng)用交付平臺中多租戶云數(shù)據(jù)管理關(guān)鍵技術(shù)研究[D];山東大學(xué);2011年
3 馬海濤;Active XML數(shù)據(jù)管理基礎(chǔ)問題研究[D];哈爾濱工業(yè)大學(xué);2009年
4 吳剛;RDF圖數(shù)據(jù)管理的關(guān)鍵技術(shù)研究[D];清華大學(xué);2008年
5 邵峰;XML數(shù)據(jù)管理中的結(jié)構(gòu)查詢技術(shù)研究[D];浙江大學(xué);2008年
6 左維;基于XML/Web Services的月球探測數(shù)據(jù)管理與集成技術(shù)研究[D];中國科學(xué)院研究生院(地球化學(xué)研究所);2004年
7 李筧列;流程企業(yè)模型與數(shù)據(jù)管理研究[D];浙江大學(xué);2009年
相關(guān)碩士學(xué)位論文 前10條
1 白賓;外資銀行監(jiān)管數(shù)據(jù)報送系統(tǒng)的設(shè)計與實現(xiàn)[D];內(nèi)蒙古大學(xué);2015年
2 吳春靜;箭載嵌入式數(shù)據(jù)管理系統(tǒng)軟件設(shè)計與實現(xiàn)[D];中國科學(xué)院研究生院(空間科學(xué)與應(yīng)用研究中心);2015年
3 陳紅菊;新疆城鄉(xiāng)道路客運成品油價格補助管理系統(tǒng)的設(shè)計與實現(xiàn)[D];山東大學(xué);2015年
4 屠元利;巴音學(xué)院市場營銷模擬教學(xué)系統(tǒng)的設(shè)計與實現(xiàn)[D];山東大學(xué);2015年
5 蘇光耀;某機電企業(yè)PDM實施的研究與應(yīng)用[D];廣西大學(xué);2015年
6 趙悅璇;無線傳感網(wǎng)監(jiān)測系統(tǒng)中的數(shù)據(jù)管理與可視化[D];大連理工大學(xué);2015年
7 陽軍;都福企業(yè)數(shù)據(jù)管理網(wǎng)絡(luò)平臺的設(shè)計與實現(xiàn)[D];大連理工大學(xué);2015年
8 許嘉勛;基于云數(shù)據(jù)庫的企業(yè)資產(chǎn)管理應(yīng)用系統(tǒng)[D];復(fù)旦大學(xué);2013年
9 付大凡;變壓器企業(yè)PLM系統(tǒng)BOM數(shù)據(jù)管理的研究與實現(xiàn)[D];電子科技大學(xué);2014年
10 劉月姣;基于CARMEN系統(tǒng)的寶馬項目數(shù)據(jù)管理統(tǒng)一協(xié)作系統(tǒng)的設(shè)計與實現(xiàn)[D];山東大學(xué);2015年
本文編號:2554213
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2554213.html