大數(shù)據(jù)、人工智能與財(cái)稅服務(wù)創(chuàng)新
【部分圖文】:
文字識(shí)別完成后還需要智能修正,根據(jù)業(yè)務(wù)邏輯進(jìn)行驗(yàn)證,利用深度學(xué)習(xí)及數(shù)據(jù)爬蟲技術(shù)進(jìn)行業(yè)務(wù)邏輯校驗(yàn),大數(shù)據(jù)技術(shù)自動(dòng)積累票據(jù)及客戶的相關(guān)信息,利用數(shù)據(jù)爬蟲獲取外部相關(guān)數(shù)據(jù),采用深度學(xué)習(xí)的方式獲取票據(jù)的業(yè)務(wù)邏輯并進(jìn)行驗(yàn)證,利用大數(shù)據(jù)進(jìn)行智能糾偏,查找錯(cuò)誤并自動(dòng)修正,準(zhǔn)確率可達(dá)90%-97%。深度學(xué)習(xí)的全文識(shí)別技術(shù),采用人工智能的深度學(xué)習(xí)算法及全文識(shí)別算法結(jié)合預(yù)設(shè)模版,區(qū)分不同版面類別,為快速精準(zhǔn)識(shí)別票據(jù)信息奠定基礎(chǔ)模版。識(shí)別率可達(dá)98%,僅2%的需要人工干預(yù)理票;機(jī)器自動(dòng)定位獲取字段位置,自動(dòng)定位準(zhǔn)確率可達(dá)95%。圖像算法技術(shù)運(yùn)用人工智能的深度學(xué)習(xí)算法自動(dòng)進(jìn)行精確切割,切割準(zhǔn)確率高達(dá)100%。OCR技術(shù)通過(guò)OCR技術(shù)和定位信息將圖片信息轉(zhuǎn)化為文本信息,OCR識(shí)別率水平可達(dá)70%~80%。
財(cái)稅服務(wù)場(chǎng)景中,有大量的重復(fù)工作,比如生成憑證、記入賬戶、票據(jù)稽核、報(bào)銷場(chǎng)景的審計(jì)等,在具體業(yè)務(wù)場(chǎng)景的辨析中,一項(xiàng)耗費(fèi)是記入固定資產(chǎn)還是無(wú)形資產(chǎn),是記入存貨還是費(fèi)用?合同規(guī)定的關(guān)鍵信息,如何有效地反映?需要運(yùn)用什么樣的會(huì)計(jì)政策?等等都需要應(yīng)用語(yǔ)義識(shí)別進(jìn)行辨析。利用大數(shù)據(jù)技術(shù)在財(cái)稅領(lǐng)域運(yùn)用語(yǔ)義識(shí)別,是給機(jī)器人裝上語(yǔ)義理解的引擎,利用語(yǔ)義識(shí)別進(jìn)行關(guān)鍵詞提取,主題提取/預(yù)測(cè),語(yǔ)義距離分析,可以極大的提高業(yè)務(wù)效率。采用機(jī)器學(xué)習(xí)的方法提煉語(yǔ)義分析模型核心價(jià)值,需要基于行業(yè)專家的最佳實(shí)踐,積累樣板,借助電商網(wǎng)站、國(guó)標(biāo)網(wǎng)站上公布的行業(yè)標(biāo)準(zhǔn),作為體系化學(xué)習(xí)的語(yǔ)料/樣本;將種類繁多的信息通過(guò)分詞技術(shù)打散,為語(yǔ)義分析、情感分析提供樣本支持;基于分布式大數(shù)據(jù)平臺(tái)的高效計(jì)算能力,提供實(shí)時(shí)的服務(wù);結(jié)合財(cái)稅日常業(yè)務(wù)流水、補(bǔ)充外部信息形成巨大的語(yǔ)料/樣本、利用大數(shù)據(jù)高效計(jì)算提煉專家模型,反過(guò)來(lái)推動(dòng)業(yè)務(wù)低成本高速發(fā)展。財(cái)稅機(jī)器人語(yǔ)義理解引擎的數(shù)據(jù)是基于對(duì)業(yè)務(wù)流水?dāng)?shù)據(jù)和公司內(nèi)外信息,業(yè)務(wù)流水大數(shù)據(jù)是針對(duì)企業(yè)財(cái)務(wù)管理過(guò)程中的票據(jù)、合同、電子化憑證以及其他紙質(zhì)憑證、記錄等傳統(tǒng)模型的信息進(jìn)行影像化,形成業(yè)務(wù)流水大數(shù)據(jù)。同時(shí),將財(cái)務(wù)業(yè)務(wù)場(chǎng)景過(guò)程中的數(shù)據(jù)信息接口對(duì)接形成大數(shù)據(jù)流。企業(yè)內(nèi)外信息是通過(guò)爬蟲采集技術(shù),收集大量的電商/商品明細(xì)、零售商品明細(xì)、行業(yè)標(biāo)準(zhǔn)規(guī)范、互聯(lián)網(wǎng)輿情/商情信息以及歷史業(yè)務(wù)樣本數(shù)據(jù)。并且,利用強(qiáng)大的數(shù)據(jù)處理技術(shù),對(duì)數(shù)據(jù)進(jìn)行清洗、整合,形成高質(zhì)量的樣本數(shù)據(jù)。結(jié)合專家的經(jīng)驗(yàn),對(duì)樣本進(jìn)行批量分類。
實(shí)現(xiàn)自動(dòng)記賬需要多種數(shù)據(jù)來(lái)源,目前智能財(cái)稅行業(yè)已經(jīng)開發(fā)出互聯(lián)網(wǎng)云平臺(tái)加免費(fèi)使用,眾包模式,可以采用免費(fèi)的票據(jù)識(shí)別,獲取大量企業(yè)的記賬數(shù)據(jù)。大規(guī)模機(jī)器學(xué)習(xí)、人工智能的建模平臺(tái)已經(jīng)應(yīng)用Spark、Graphlab、Parameter Server以及GPU異構(gòu)計(jì)算(Caffe、 torch、tensorflow)等的多種技術(shù),包含用于圖像的卷積神經(jīng)網(wǎng)絡(luò),用于視頻/文本的循環(huán)神經(jīng)網(wǎng)絡(luò),基于大數(shù)據(jù)關(guān)聯(lián)分析的財(cái)務(wù)反欺詐技術(shù),基于深度學(xué)習(xí)等財(cái)務(wù)預(yù)測(cè)系統(tǒng)參考值與實(shí)際值比對(duì)的異常檢測(cè)建模與技術(shù)等。建模云平臺(tái)數(shù)字化所有的信息并進(jìn)行集成,同時(shí)將業(yè)務(wù)票據(jù)憑證和企業(yè)ERP、OA、財(cái)務(wù)軟件、MIS、CRM等系統(tǒng)對(duì)接,識(shí)別出常規(guī)會(huì)計(jì)事項(xiàng),預(yù)配置或機(jī)器學(xué)習(xí)。其中,會(huì)計(jì)事項(xiàng)識(shí)別包括差旅費(fèi)報(bào)銷,醫(yī)藥費(fèi)報(bào)銷,采購(gòu)固定資產(chǎn),采購(gòu)原材料,在建工程,租賃辦公場(chǎng)所,確認(rèn)產(chǎn)成品成本等在內(nèi)的各種會(huì)計(jì)事項(xiàng),根據(jù)會(huì)計(jì)事項(xiàng),結(jié)合信息配置科目,預(yù)配置或機(jī)器學(xué)習(xí)。識(shí)別會(huì)計(jì)事項(xiàng)后,需要基于深度學(xué)習(xí),用數(shù)據(jù)標(biāo)記對(duì)應(yīng)場(chǎng)景,生成業(yè)務(wù)場(chǎng)景數(shù)據(jù),根據(jù)單據(jù)和其他信息形成會(huì)計(jì)憑證(分錄)的數(shù)據(jù)來(lái)源,與業(yè)務(wù)場(chǎng)景對(duì)應(yīng)的記賬對(duì)應(yīng)的規(guī)則進(jìn)行會(huì)計(jì)憑證配置與記賬。在整個(gè)過(guò)程中不斷反饋,深度學(xué)習(xí)不斷優(yōu)化,最終實(shí)現(xiàn)單據(jù)數(shù)據(jù)自動(dòng)采集、機(jī)器學(xué)習(xí)自動(dòng)記賬。并為智能機(jī)器對(duì)賬分錄、自動(dòng)報(bào)稅等奠定基礎(chǔ)。4.一鍵報(bào)稅
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 趙治遠(yuǎn);;基于大數(shù)據(jù)的醫(yī)院信息化建設(shè)思路[J];中國(guó)新通信;2018年12期
2 耿明;;基于人工智能+大數(shù)據(jù)的科學(xué)精準(zhǔn)傳播[J];科協(xié)論壇;2017年05期
3 劉鵬;;大數(shù)據(jù)、人工智能發(fā)展與應(yīng)用[J];視聽(tīng)界(廣播電視技術(shù));2018年04期
4 劉鎮(zhèn)源;;基于云平臺(tái)的大數(shù)據(jù)信息安全機(jī)制研究[J];通訊世界;2017年22期
5 嚴(yán)衛(wèi);錢振江;周立凡;肖樂(lè);;人工智能大數(shù)據(jù)倫理問(wèn)題的研究[J];科技風(fēng);2019年28期
6 孫艷華;;場(chǎng)景分類在數(shù)字出版中的應(yīng)用[J];出版發(fā)行研究;2019年03期
7 張愷;;大數(shù)據(jù)人工智能時(shí)代的智慧交通研究[J];中國(guó)新通信;2019年16期
8 楊耀庭;;大數(shù)據(jù)是企業(yè)信息化建設(shè)的核心[J];建筑技術(shù)開發(fā);2017年02期
9 姚德生;;大數(shù)據(jù)時(shí)代下的智能安防淺析[J];中國(guó)安全防范技術(shù)與應(yīng)用;2019年03期
10 俞華鋒;;大數(shù)據(jù)下基于Spark的電商智能推薦云平臺(tái)的研究[J];科技視界;2018年26期
相關(guān)博士學(xué)位論文 前1條
1 萬(wàn)好;濾波視覺(jué)跟蹤算法研究及在智能機(jī)器人中的應(yīng)用[D];華南理工大學(xué);2019年
相關(guān)碩士學(xué)位論文 前10條
1 吳雅鋒;基于考試成績(jī)得分的知識(shí)點(diǎn)關(guān)聯(lián)關(guān)系分析研究[D];華中科技大學(xué);2019年
2 高玉;移動(dòng)程序化場(chǎng)景營(yíng)銷策略研究[D];浙江傳媒學(xué)院;2019年
3 朱建楠;大數(shù)據(jù)下的用戶金融肖像模型及其反饋演化機(jī)制研究[D];蘭州交通大學(xué);2018年
4 侯淇鐘;大數(shù)據(jù)在涉恐人員管控中的應(yīng)用研究[D];中國(guó)人民公安大學(xué);2018年
5 張明成;大數(shù)據(jù)視角下的相關(guān)性思維研究[D];太原科技大學(xué);2018年
6 韓名豪;基于Hadoop的新聞事件數(shù)據(jù)查詢與分析[D];北京郵電大學(xué);2018年
7 李玫;基于智能機(jī)器人平臺(tái)的科學(xué)課程教學(xué)模式構(gòu)建及實(shí)證研究[D];陜西師范大學(xué);2018年
8 張繼國(guó);面向全自主智能機(jī)器人的雙目視覺(jué)技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2012年
9 程琳琳;文檔自動(dòng)評(píng)閱與課程學(xué)習(xí)大數(shù)據(jù)平臺(tái)研究與實(shí)現(xiàn)[D];電子科技大學(xué);2020年
10 李莉;大數(shù)據(jù)發(fā)展中的中國(guó)社會(huì)公正問(wèn)題研究[D];延安大學(xué);2016年
本文編號(hào):2849207
本文鏈接:http://sikaile.net/kejilunwen/rengongzhinen/2849207.html