手機健康管理類應用縱向大數(shù)據(jù)管理與統(tǒng)計分析
【圖文】:
1.1健康管理類APP的數(shù)據(jù)特點1.1.1一個橫庫與多個縱庫的組合形式健康管理類APP數(shù)據(jù)庫常見的構成形式為一個橫向數(shù)據(jù)庫與多個縱向數(shù)據(jù)庫的組合。橫向庫中保存用戶的基本信息,以用戶的性別、地址等類似數(shù)據(jù)構成,橫庫中常常包含用戶的一些敏感信息,如姓名、電話、電子郵箱等。APP相應記錄功能的每一個模塊又對應著一個縱向數(shù)據(jù)庫,其包含的信息為事件類型、數(shù)值、記錄的時間。例如APP中體重記錄模塊會記錄用戶每次測量體重的具體數(shù)值和時間。該類數(shù)據(jù)為標準的縱向數(shù)據(jù)。橫庫和縱庫通過用戶的唯一編碼進行關聯(lián)。具體如圖1所示。1.1.2數(shù)據(jù)量大健康管理類APP的數(shù)據(jù)量大體現(xiàn)在兩個層面。第一層面為用戶量層面,應用商店中用戶量為千萬級別的熱門健康管理APP越來越多。第二層面為用戶的記錄層面,健康管理類APP記錄的數(shù)據(jù),尤其是客觀記錄的傳感器數(shù)據(jù),包括用戶記錄的走步、運動、睡眠等信息,單位用戶本身的原始記錄量是巨大的。而近年來,社交元素也加入到了健康管理類APP中,這也促使了這類APP吸引了大量用戶進行長期的、詳細的信息記錄。1.1.3原始記錄需進一步信息提取這類APP所記錄的原始數(shù)據(jù)往往不能直接被利用,比如用戶記錄的走步實際數(shù)據(jù)庫中的原始數(shù)據(jù)為某一步伐發(fā)生的具體時間,用戶記錄的睡眠數(shù)據(jù)實際為睡眠開始時間、結束時間,,某一時間段的深睡眠和淺睡眠的開始時間、結束時間。但進行統(tǒng)計分析時,原始數(shù)據(jù)需要進行進一步的信息提取,以獲得符合統(tǒng)計分析目的數(shù)據(jù),如每日步數(shù),睡眠總時長等。1.1.4數(shù)據(jù)質量差健康管理類APP的數(shù)據(jù)質量在不同的數(shù)據(jù)類型中有一定差異。例如實例中的女性月經(jīng)管理數(shù)據(jù)和用戶的膳食記錄數(shù)據(jù),均屬于用戶自報型數(shù)據(jù)。受本身數(shù)據(jù)收集形式所限,數(shù)據(jù)質量較差。而運動數(shù)據(jù)、睡眠數(shù)據(jù)這類被?
狽椒ń?行信息提取得到二次數(shù)據(jù)后,對于二次數(shù)據(jù)采用類似的方法進行缺失值、異常值的清理。若發(fā)現(xiàn)的缺失值、異常值來源于原始數(shù)據(jù)異常,需對原始數(shù)據(jù)進行清理,并同時再次進行信息提取生成更新后的二次數(shù)據(jù)庫。1.2.5篩選可靠用戶數(shù)據(jù)與信息庫合并為保證數(shù)據(jù)的可靠性,建議在獲得清理后的二次數(shù)據(jù)后,篩選出數(shù)據(jù)記錄詳實的用戶?上薅ㄋA舻挠脩糇钌儆涗洍l數(shù),已篩選出相對活躍用戶的記錄,數(shù)據(jù)更可靠。將篩選后的數(shù)據(jù)(縱庫)和用戶信息庫(橫庫)合并,在縱庫里獲得橫庫中的受試者信息。具體的數(shù)據(jù)管理過程如圖2。1.3統(tǒng)計分析方法經(jīng)過數(shù)據(jù)管理后的健康管理類APP數(shù)據(jù)符合如下特點:①數(shù)據(jù)為縱向大數(shù)據(jù);②每位用戶的記錄次數(shù)和記錄時間點不一定相同;③不同時點的觀測值可能存在相關性。本類資料需根據(jù)數(shù)據(jù)類型的不同,對數(shù)值型資料可采用混合效應模型[5,6],對分類型資料可采用廣義混合線性模型和廣義估計方程進行分析[7,8]。2實例分析2.1實例數(shù)據(jù)介紹本實例所使用的數(shù)據(jù)來源于某互聯(lián)網(wǎng)公司開發(fā)的女性月經(jīng)管理APP。該APP的核心功能是用戶記錄每月經(jīng)開始日期及結束日期以獲得下次月經(jīng)的預測和提醒。用戶每月定期記錄月經(jīng)開始事件(event-type=1)及結束事件(eventtype=2)(圖3),APP實現(xiàn)月經(jīng)周期的記錄及預測。本研究使用的數(shù)據(jù)為該公司從注冊用戶的前100萬活躍用戶中隨機抽選的15萬用戶,截至時間為2015年2月1日以前的數(shù)據(jù)。2.2數(shù)據(jù)管理過程與結果通過兩次月經(jīng)開始的間隔獲得月經(jīng)周期的數(shù)據(jù)。最終數(shù)據(jù)管理的過程和結果見表2、3。2.3統(tǒng)計分析過程與結果數(shù)據(jù)管理所獲得的用戶月經(jīng)周期長度為縱向大數(shù)據(jù),且不同用戶記錄時點和記錄次數(shù)不一定相同,本例采用混合效應模型進行數(shù)據(jù)分析。因變量是用戶?
【相似文獻】
相關期刊論文 前10條
1 張俊華;戴國華;商洪才;曹紅波;任明;項耀祖;高秀梅;張伯禮;;中醫(yī)藥大規(guī)模臨床研究的數(shù)據(jù)核查[J];中國循證醫(yī)學雜志;2007年03期
2 曲超;;臨床科研中的數(shù)據(jù)管理[J];中國社區(qū)醫(yī)師;2014年01期
3 蘆殿榮;李冬云;陳信義;姜靖雯;白樺;;臨床研究課題資料收集過程中的數(shù)據(jù)管理及其質控探討[J];中醫(yī)藥管理雜志;2008年10期
4 李雪迎;;重視數(shù)據(jù)管理保障臨床研究科學性和可靠性[J];中國介入心臟病學雜志;2013年06期
5 范繼榮;歐陽環(huán)宇;黃少敏;盧建宇;;淺談藥品、器械財務數(shù)據(jù)管理通用接口軟件[J];中國藥物經(jīng)濟學;2014年02期
6 冀鵬;淺談煤炭醫(yī)院藥品信息化的數(shù)據(jù)管理[J];煤炭經(jīng)濟研究;2002年12期
7 卜擎燕;熊寧寧;鄒建東;蔣萌;劉芳;;從臨床研究數(shù)據(jù)管理角度設計病例報告表[J];中國新藥雜志;2007年05期
8 王華清,林家瑞;24小時動態(tài)ECG分析系統(tǒng)中數(shù)據(jù)管理的應用研究[J];中國醫(yī)療器械雜志;1995年03期
9 王建;周祖木;;HIV抗體初篩實驗室的數(shù)據(jù)管理及其程序研制[J];旅行醫(yī)學科學;2001年04期
10 李偉;卜擎燕;鄒建東;熊寧寧;;編輯檢查在臨床研究數(shù)據(jù)管理中的應用[J];中國臨床藥理學與治療學;2009年01期
相關會議論文 前10條
1 馮偉一;張博;;PDM技術在服裝企業(yè)中的應用[A];2005現(xiàn)代服裝紡織高科技發(fā)展研討會論文集[C];2005年
2 王_g;;淺析現(xiàn)階段煤炭集團企業(yè)信息化數(shù)據(jù)管理的決定因素[A];第18屆全國煤礦自動化與信息化學術會議論文集[C];2008年
3 鄭文心;謝文秀;彭勇;黃瑋;;試驗數(shù)據(jù)管理的企業(yè)集成方法研究[A];第三屆民用飛機先進制造技術及裝備論壇論文匯編[C];2011年
4 楊茂瑜;郎中凱;王恒芹;吳羿;;EXCEL在HIV檢測數(shù)據(jù)管理中的應用[A];重慶市預防醫(yī)學會2012年學術年會論文集[C];2012年
5 周娜紅;宋瑋;高坤靜;;面向服務的繼電保護整定計算和數(shù)據(jù)管理研究[A];中國高等學校電力系統(tǒng)及其自動化專業(yè)第二十四屆學術年會論文集(中冊)[C];2008年
6 沈春慧;;關于加強稅收征管業(yè)務數(shù)據(jù)管理的實踐與思考[A];中國管理科學文獻[C];2008年
7 聶培堯;徐秋元;;知識系統(tǒng)在科學數(shù)據(jù)管理中的應用[A];第九屆全國數(shù)據(jù)庫學術會議論文集(下)[C];1990年
8 蔣愛華;;城鄉(xiāng)一體化數(shù)據(jù)管理探討[A];中國測繪學會九屆三次理事會暨2007年“信息化測繪論壇”學術年會論文集[C];2007年
9 朱曉華;;尋求深海測量數(shù)據(jù)管理新途徑——Bathy DataBASE技術研究[A];中國航海學會航標專業(yè)委員會測繪學組學術研討會學術交流論文集[C];2008年
10 吳桂琴;趙萍;劉愛巧;;蛋雞育種數(shù)據(jù)管理與分析系統(tǒng)的應用[A];安全優(yōu)質的家禽生產(chǎn)——第十五次全國家禽學術討論會論文集[C];2011年
相關重要報紙文章 前10條
1 單群一;惠普:讓數(shù)據(jù)管理告別“亞健康”[N];中國稅務報;2007年
2 李蒙生;數(shù)據(jù)管理年會落下帷幕 同方知網(wǎng)軟件喜獲殊榮[N];中國電腦教育報;2007年
3 黎江 王頌;保險公司:從數(shù)據(jù)管理“泥沼”中突圍[N];金融時報;2006年
4 郭濤;統(tǒng)一數(shù)據(jù)管理 特立而獨行[N];中國計算機報;2007年
5 本報記者 于翔;統(tǒng)一數(shù)據(jù)管理向“云”延伸[N];網(wǎng)絡世界;2009年
6 記者 劉一冰;CommVault再發(fā)力[N];電腦商報;2011年
7 記者 劉佳;全國首個數(shù)據(jù)管理基礎標準在大連問世[N];遼寧日報;2012年
8 趙愛東 記者 巴家偉;全國首個數(shù)據(jù)管理基礎標準“大連造”[N];大連日報;2012年
9 《網(wǎng)絡世界》記者 柴莎莎;攜一體化夢想 翱翔數(shù)據(jù)管理天空[N];網(wǎng)絡世界;2012年
10 本報記者 陳錚;須從多維度提升水平[N];中國醫(yī)藥報;2012年
相關博士學位論文 前7條
1 錢鵬;高?茖W數(shù)據(jù)管理研究[D];南京大學;2012年
2 孔蘭菊;SaaS應用交付平臺中多租戶云數(shù)據(jù)管理關鍵技術研究[D];山東大學;2011年
3 馬海濤;Active XML數(shù)據(jù)管理基礎問題研究[D];哈爾濱工業(yè)大學;2009年
4 吳剛;RDF圖數(shù)據(jù)管理的關鍵技術研究[D];清華大學;2008年
5 邵峰;XML數(shù)據(jù)管理中的結構查詢技術研究[D];浙江大學;2008年
6 左維;基于XML/Web Services的月球探測數(shù)據(jù)管理與集成技術研究[D];中國科學院研究生院(地球化學研究所);2004年
7 李筧列;流程企業(yè)模型與數(shù)據(jù)管理研究[D];浙江大學;2009年
相關碩士學位論文 前10條
1 白賓;外資銀行監(jiān)管數(shù)據(jù)報送系統(tǒng)的設計與實現(xiàn)[D];內蒙古大學;2015年
2 吳春靜;箭載嵌入式數(shù)據(jù)管理系統(tǒng)軟件設計與實現(xiàn)[D];中國科學院研究生院(空間科學與應用研究中心);2015年
3 陳紅菊;新疆城鄉(xiāng)道路客運成品油價格補助管理系統(tǒng)的設計與實現(xiàn)[D];山東大學;2015年
4 屠元利;巴音學院市場營銷模擬教學系統(tǒng)的設計與實現(xiàn)[D];山東大學;2015年
5 蘇光耀;某機電企業(yè)PDM實施的研究與應用[D];廣西大學;2015年
6 趙悅璇;無線傳感網(wǎng)監(jiān)測系統(tǒng)中的數(shù)據(jù)管理與可視化[D];大連理工大學;2015年
7 陽軍;都福企業(yè)數(shù)據(jù)管理網(wǎng)絡平臺的設計與實現(xiàn)[D];大連理工大學;2015年
8 許嘉勛;基于云數(shù)據(jù)庫的企業(yè)資產(chǎn)管理應用系統(tǒng)[D];復旦大學;2013年
9 付大凡;變壓器企業(yè)PLM系統(tǒng)BOM數(shù)據(jù)管理的研究與實現(xiàn)[D];電子科技大學;2014年
10 劉月姣;基于CARMEN系統(tǒng)的寶馬項目數(shù)據(jù)管理統(tǒng)一協(xié)作系統(tǒng)的設計與實現(xiàn)[D];山東大學;2015年
本文編號:2554213
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2554213.html