基于YY語音的手機(jī)文本數(shù)據(jù)提取與分析
本文關(guān)鍵詞:基于YY語音的手機(jī)文本數(shù)據(jù)提取與分析
更多相關(guān)文章: Android YY語音 數(shù)據(jù)提取 分析
【摘要】:近年來,智能手機(jī)擁有者數(shù)量大幅增加。智能機(jī)憑借其強(qiáng)大的功能迅速成為通訊的主要工具。不同于傳統(tǒng)手機(jī),智能機(jī)具有高性能的操作系統(tǒng)(如Android、i OS),使用者能夠在智能手機(jī)上安裝種類繁多的應(yīng)用程序。隨著手機(jī)犯罪相關(guān)的違法活動(dòng)逐漸增多,社會(huì)公共秩序以及公眾生活受到了極其惡劣的影響。如何對(duì)手機(jī)信息進(jìn)行提取和分析以協(xié)助公安部門打擊犯罪有著重大的現(xiàn)實(shí)意義。本文針對(duì)Android智能手機(jī)平臺(tái)上的第三方應(yīng)用軟件——YY語音,進(jìn)行文本數(shù)據(jù)提取與分析。本系統(tǒng)是筆者所在實(shí)驗(yàn)室與某公司合作開發(fā)的實(shí)際項(xiàng)目,可以實(shí)現(xiàn)手機(jī)的自動(dòng)取證,大幅度減少了相關(guān)人員的工作量,使他們從繁重的人工分析中解脫出來。文中首先對(duì)使用的有關(guān)原理以及技術(shù)基礎(chǔ)進(jìn)行了簡要闡述,包括Android的系統(tǒng)框架結(jié)構(gòu)、Android手機(jī)的Root原理、系統(tǒng)安全權(quán)限和數(shù)據(jù)存儲(chǔ)機(jī)制、自然語言處理的中文分詞技術(shù)、SQLite數(shù)據(jù)庫接口以及數(shù)據(jù)解析技術(shù)等。理解、學(xué)習(xí)上述理論知識(shí)有助于整體系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)。其次,對(duì)Android手機(jī)進(jìn)行Root操作以獲取YY語音應(yīng)用程序包并展開研究。接著詳細(xì)分析了程序包中的文件,定位了程序包中存儲(chǔ)關(guān)鍵數(shù)據(jù)的文件。Android手機(jī)中的數(shù)據(jù)采用SQLite存儲(chǔ),文中著重分析了其中幾個(gè)文件之間的關(guān)聯(lián)以及數(shù)據(jù)庫表的組成。針對(duì)有價(jià)值信息的存儲(chǔ)格式研究了相應(yīng)的提取方法并設(shè)計(jì)目標(biāo)數(shù)據(jù)庫。最后,參考公安部的具體需求和相關(guān)規(guī)范,設(shè)計(jì)并實(shí)現(xiàn)該系統(tǒng)。對(duì)關(guān)鍵信息進(jìn)行提取并解析數(shù)據(jù),包括用戶賬戶信息、好友信息、好友分組信息、群組信息、聊天信息等。對(duì)聊天記錄的內(nèi)容展開分析,把敏感信息識(shí)別、采集出來保存到目標(biāo)數(shù)據(jù)庫中。系統(tǒng)采用可視化工具演示結(jié)果,讓工作人員能快速、準(zhǔn)確地定位到有效信息。本系統(tǒng)經(jīng)過測(cè)試、逐步完善,現(xiàn)已基本達(dá)到預(yù)期效果。系統(tǒng)為相關(guān)部門取證提供便捷,具有實(shí)際意義。
【關(guān)鍵詞】:Android YY語音 數(shù)據(jù)提取 分析
【學(xué)位授予單位】:吉林大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TP391.1
【目錄】:
- 摘要4-5
- Abstract5-9
- 第1章 緒論9-14
- 1.1 研究背景及意義9-10
- 1.2 研究現(xiàn)狀10-12
- 1.2.1 國外現(xiàn)狀10-11
- 1.2.2 國內(nèi)現(xiàn)狀11-12
- 1.3 本文的主要研究工作12
- 1.4 論文的組織結(jié)構(gòu)12-14
- 第2章 Android系統(tǒng)原理與技術(shù)基礎(chǔ)14-19
- 2.1 Android操作系統(tǒng)框架與機(jī)制14-18
- 2.1.1 Android系統(tǒng)架構(gòu)概況14-15
- 2.1.2 Android系統(tǒng)安全權(quán)限機(jī)制15-17
- 2.1.3 Android系統(tǒng)數(shù)據(jù)存儲(chǔ)機(jī)制17-18
- 2.2 Android系統(tǒng)Root原理18
- 2.3 本章小結(jié)18-19
- 第3章 中文分詞技術(shù)介紹19-22
- 3.1 自然語言處理19
- 3.2 中文分詞技術(shù)19-20
- 3.3 NLPIR分詞系統(tǒng)20-21
- 3.4 本章小結(jié)21-22
- 第4章 系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)22-56
- 4.1 YY語音數(shù)據(jù)分析22-28
- 4.1.1 源數(shù)據(jù)庫數(shù)據(jù)分析22-24
- 4.1.2 SQLite解析技術(shù)24-28
- 4.1.3 需要注意的問題28
- 4.1.4 系統(tǒng)開發(fā)平臺(tái)28
- 4.2 目標(biāo)數(shù)據(jù)庫設(shè)計(jì)28-32
- 4.3 程序總體流程32-34
- 4.4 源文件驗(yàn)證34
- 4.5 目標(biāo)數(shù)據(jù)庫創(chuàng)建流程34-35
- 4.6 YY語音用戶賬戶信息提取35-36
- 4.7 YY語音聯(lián)系人信息提取36-38
- 4.8 YY語音聯(lián)系人分組信息提取38-40
- 4.9 YY語音群組信息提取40-42
- 4.10 YY語音聊天信息提取42-44
- 4.11 YY語音聊天信息敏感內(nèi)容分析及處理44-51
- 4.12 YY語音結(jié)果演示51-54
- 4.13 系統(tǒng)的應(yīng)用54-55
- 4.14 本章小結(jié)55-56
- 第5章 總結(jié)與展望56-58
- 5.1 總結(jié)56
- 5.2 展望56-58
- 參考文獻(xiàn)58-61
- 作者簡介及科研成果61-62
- 致謝62
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前5條
1 蔡文羽;張樹楠;;以YY語音為例議網(wǎng)絡(luò)媒體的特點(diǎn)及問題[J];商品與質(zhì)量;2012年S5期
2 張樹楠;蔡文羽;;以YY語音為例議網(wǎng)絡(luò)媒體的特性[J];商品與質(zhì)量;2012年S5期
3 蔡文羽;張樹楠;;以YY語音為例議網(wǎng)絡(luò)媒體的發(fā)展前景[J];商品與質(zhì)量;2012年S6期
4 ;YY語音,大家一起聊[J];電腦愛好者;2009年19期
5 ;[J];;年期
中國重要報(bào)紙全文數(shù)據(jù)庫 前8條
1 商報(bào)記者 吳園園;YY音樂盈利模式引爭議[N];北京商報(bào);2012年
2 本報(bào)記者 楊桐;YY音樂是歡聚時(shí)代的障眼法?[N];中華工商時(shí)報(bào);2012年
3 商報(bào)記者 潘敏;YY不是破冰者是敢死隊(duì)[N];北京商報(bào);2012年
4 本報(bào)記者 遲有雷;YY赴美上市 私募力挺“剩者”為王[N];經(jīng)濟(jì)觀察報(bào);2012年
5 北京商報(bào)記者 程銘R,
本文編號(hào):1119131
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1119131.html