自助語(yǔ)音識(shí)別流程編輯器的設(shè)計(jì)與實(shí)現(xiàn)
本文選題:交互式語(yǔ)音應(yīng)答 + 流程編輯器; 參考:《電子科技大學(xué)》2015年碩士論文
【摘要】:語(yǔ)音識(shí)別技術(shù),在2012年發(fā)生重大突破,由深層神經(jīng)網(wǎng)絡(luò)(DNN)取代高斯分配以描述語(yǔ)音特征。學(xué)術(shù)界公認(rèn)提高了30%的辨識(shí)成功率,引發(fā)以語(yǔ)音識(shí)別為基礎(chǔ)的各項(xiàng)自助服務(wù)在國(guó)內(nèi)快速興起。其中以智能語(yǔ)音導(dǎo)航IVR為主,包括工商銀行、中信銀行、平安銀行、交通銀行、浦發(fā)銀行、中荷人壽等知名企業(yè)。然而許多項(xiàng)目未能達(dá)到預(yù)期目標(biāo),與歐美及日本地區(qū)的普遍流行及認(rèn)同無(wú)法相比。其中主要原因?yàn)閲?guó)內(nèi)廠商太過(guò)傾向于識(shí)別率的高低,忽略了語(yǔ)音界面設(shè)計(jì),以至于不被用戶(hù)認(rèn)同。在自助語(yǔ)音服務(wù)中,語(yǔ)音界面(VUI)扮演的角色,和網(wǎng)絡(luò)服務(wù)中圖形界面(GUI)的角色相同,如果語(yǔ)音界面設(shè)計(jì)不佳,用戶(hù)很快就會(huì)失去耐心,直接要求轉(zhuǎn)人工服務(wù)或者掛斷電話,不管企業(yè)的自助服務(wù)內(nèi)容多么豐富有效。在傳統(tǒng)的IVR系統(tǒng)中,業(yè)務(wù)邏輯實(shí)現(xiàn)是根據(jù)不同的IVR系統(tǒng)進(jìn)行編寫(xiě)的,存在以下缺點(diǎn):移植性、靈活性差,在實(shí)際系統(tǒng)上做應(yīng)用開(kāi)發(fā)的難度很大,特別是涉及到話音流程的編寫(xiě)及調(diào)試問(wèn)題,無(wú)法綜合利用現(xiàn)有的web資源。為了縮短交互式語(yǔ)音應(yīng)答(IVR:Interaction Voice Response)系統(tǒng)流程開(kāi)發(fā)周期,降低傳統(tǒng)IVR系統(tǒng)中業(yè)務(wù)邏輯編寫(xiě)的困難,方便快捷地設(shè)計(jì)出優(yōu)秀語(yǔ)音界面,從這三方面角度提出設(shè)計(jì)以Voice-XML為開(kāi)發(fā)語(yǔ)言并可以降低開(kāi)發(fā)工作的腳本編輯器,專(zhuān)用于設(shè)計(jì)流程界面設(shè)計(jì)。本文設(shè)計(jì)的流程編輯器,在結(jié)構(gòu)設(shè)計(jì)上,分為用戶(hù)界面層、業(yè)務(wù)功能層、基礎(chǔ)功能層3個(gè)層面。在用戶(hù)界面提供菜單欄、工具欄、繪圖欄、項(xiàng)目欄、日志欄、屬性欄及節(jié)點(diǎn)欄。業(yè)務(wù)功能層功能上則是分為項(xiàng)目管理模塊、工具箱模塊、文件管理模塊、編輯屬性模塊和窗口功能模塊。在基礎(chǔ)功能層提供第三方數(shù)據(jù)庫(kù)、數(shù)據(jù)存儲(chǔ)、節(jié)點(diǎn)模型、界面開(kāi)發(fā)、事件監(jiān)聽(tīng)的功能。工具包以swing組件為基礎(chǔ),分為頂層、中間及基本組件3類(lèi)。在流程定義中,以圖元為基礎(chǔ),把可能采用的業(yè)務(wù)節(jié)點(diǎn)以圖元表示,向用戶(hù)提供的是流程中核心流程節(jié)點(diǎn)控件。用戶(hù)通過(guò)拖拽圖形所表示的流程節(jié)點(diǎn)到繪制區(qū)域,填寫(xiě)每個(gè)相應(yīng)流程節(jié)點(diǎn)的屬性信息,然后使用帶箭頭的連線來(lái)連接兩個(gè)流程節(jié)點(diǎn)即可快速完成流程編輯。最后生成目標(biāo)文件Voice-XML,即可運(yùn)用到IVR中進(jìn)行順利運(yùn)行。此編輯器的實(shí)現(xiàn)節(jié)省了Voice-XML的腳本開(kāi)發(fā)時(shí)間,提高了整體流程的開(kāi)發(fā)效率。在測(cè)試階段,也對(duì)各功能的實(shí)現(xiàn)進(jìn)行了測(cè)試運(yùn)行,驗(yàn)證了各功能的可操作性。
[Abstract]:Speech recognition technology, a major breakthrough in 2012, was replaced by a deep neural network (DNNN) to describe speech features. It is recognized that the success rate of recognition is increased by 30%, which leads to the rapid rise of self-service based on speech recognition in China. In which intelligent voice navigation IVR, including ICBC, CITIC Bank, Ping an Bank, Bank of Communications, Pudong Development Bank, China and Netherlands Life Insurance and other well-known enterprises. However, many projects have fallen short of expectations and are not comparable to the widespread popularity and acceptance in Europe, the United States and Japan. The main reason is that the domestic manufacturers are too inclined to the recognition rate, ignoring the design of the speech interface, so that they are not recognized by the users. In a self-service voice service, the voice interface (VUI) plays the same role as the graphical interface (GUI) in the network service. If the voice interface is not well designed, the user will quickly lose patience and ask directly for a manual service or hang up the phone. No matter how rich and effective the enterprise's self-service content is. In the traditional IVR system, the business logic implementation is written according to different IVR systems, which has the following shortcomings: portability, flexibility is poor, and it is very difficult to do application development on the actual system. Especially, it is difficult to make comprehensive use of existing web resources because of the writing and debugging of voice flow. In order to shorten the development cycle of interactive voice response Voice response (IVR: interaction Voice response) system and reduce the difficulty of business logic writing in traditional IVR system, the excellent speech interface is designed conveniently and quickly. From these three aspects, a script editor with Voice-XML as the development language and which can reduce the development work is put forward, which is specially used in the design process interface design. The process editor designed in this paper is divided into three layers: user interface layer, business function layer and basic function layer. Provides menu bar, toolbar, drawing bar, project bar, log bar, properties bar, and node bar in the user interface. The function of business function layer is divided into project management module, toolbox module, file management module, edit attribute module and window function module. Provides third party database, data storage, node model, interface development, event monitoring in the basic function layer. The toolkit is based on swing components and is divided into three categories: top level, intermediate and basic components. In the process definition, based on the graph element, the possible business node is represented by the graph element, and the core process node control is provided to the user. Users drag and drop the process nodes represented by the graph to the drawing area, fill in the attribute information of each corresponding process node, and then connect the two process nodes with arrows to complete the process editing quickly. Finally, the target file Voice-XML is generated, which can be used in IVR to run smoothly. The implementation of this editor saves Voice-XML script development time and improves the overall development efficiency. In the test stage, the realization of each function is also tested and run, which verifies the operability of each function.
【學(xué)位授予單位】:電子科技大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類(lèi)號(hào)】:TP311.52;TN912.34
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 高玉清;;手機(jī)語(yǔ)音導(dǎo)航業(yè)務(wù)即將落地[J];互聯(lián)網(wǎng)天地;2005年10期
2 王柏君;Amelie;;手掌上的指南針——聯(lián)通CDMA語(yǔ)音導(dǎo)航[J];時(shí)尚旅游;2007年10期
3 劉玉寶;孫愛(ài)民;李純蓮;祝海英;;盲用語(yǔ)音導(dǎo)航自動(dòng)化考試系統(tǒng)的研究與實(shí)現(xiàn)[J];武漢理工大學(xué)學(xué)報(bào);2009年08期
4 宋海晨;肖瑛;李齊齊;;校園資訊語(yǔ)音導(dǎo)航平臺(tái)設(shè)計(jì)[J];數(shù)字通信;2012年05期
5 孫慧;聯(lián)通手機(jī)語(yǔ)音導(dǎo)航助你暢游天下[J];通信世界;2005年36期
6 劉小夯;看聯(lián)想電腦[J];中國(guó)計(jì)算機(jī)用戶(hù);1998年11期
7 張東;胡文學(xué);劉愛(ài)龍;楊學(xué)偉;;嵌入式車(chē)載語(yǔ)音導(dǎo)航儀設(shè)計(jì)與實(shí)現(xiàn)[J];西安工程科技學(xué)院學(xué)報(bào);2006年02期
8 何川;;陽(yáng)光V3.5:盲人的陽(yáng)光系統(tǒng)[J];互聯(lián)網(wǎng)天地;2005年S1期
9 林麗華;;為百度地圖手工擴(kuò)充語(yǔ)音導(dǎo)航數(shù)據(jù)包[J];電腦迷;2012年21期
10 趙文韜;;“話王98”有耳有嘴 識(shí)別率85%速度每分鐘150字[J];每周電腦報(bào);1998年19期
相關(guān)會(huì)議論文 前4條
1 徐珠寶;許勇;楊軍;;盲人語(yǔ)音導(dǎo)航模塊的編程實(shí)現(xiàn)[A];中國(guó)聲學(xué)學(xué)會(huì)2009年青年學(xué)術(shù)會(huì)議[CYCA’09]論文集[C];2009年
2 許培飛;;從客戶(hù)感知出發(fā)提升電信10000號(hào)語(yǔ)音導(dǎo)航系統(tǒng)便捷性[A];2007中國(guó)科協(xié)年會(huì)——通信與信息發(fā)展高層論壇論文集[C];2007年
3 劉巧蓮;都萌;荊瑩;汪磊;;車(chē)載自然語(yǔ)音導(dǎo)航系統(tǒng)構(gòu)建初探[A];2007第三屆中國(guó)智能交通年會(huì)論文集[C];2007年
4 梁哲煒;宋小波;趙衛(wèi)國(guó);劉任任;;基于XML的盲用瀏覽器設(shè)計(jì)與實(shí)現(xiàn)[A];第一屆全國(guó)Web信息系統(tǒng)及其應(yīng)用會(huì)議(WISA2004)論文集[C];2004年
相關(guān)重要報(bào)紙文章 前10條
1 綦悠悠;黑龍江聯(lián)通“手機(jī)導(dǎo)航”便民出行[N];人民郵電;2006年
2 中國(guó)消費(fèi)者報(bào) 武曉黎;用手機(jī)給你語(yǔ)音導(dǎo)航[N];中國(guó)消費(fèi)者報(bào);2005年
3 ;飛利浦消費(fèi)通訊再推新品[N];科技日?qǐng)?bào);2000年
4 本報(bào)記者 稅敏;獨(dú)立導(dǎo)航VS服務(wù)器端導(dǎo)航[N];網(wǎng)絡(luò)世界;2005年
5 通訊員 張玉斌;推出多項(xiàng)特色服務(wù)[N];人民郵電;2003年
6 曾;飛利浦989手機(jī)上市[N];計(jì)算機(jī)世界;2000年
7 記者 王巖;易騰邁推出高科技新品[N];現(xiàn)代物流報(bào);2006年
8 ;聯(lián)信志誠(chéng) 我的通信我選擇[N];中國(guó)計(jì)算機(jī)報(bào);2009年
9 記者 周娜;聯(lián)通推出語(yǔ)音導(dǎo)航業(yè)務(wù)欲挑戰(zhàn)傳統(tǒng)車(chē)載GPS[N];民營(yíng)經(jīng)濟(jì)報(bào);2006年
10 本報(bào)記者 劉益廣 通訊員 廣華 沈柳;“熊貓”一技術(shù)讓盲人耳聽(tīng)八方[N];市場(chǎng)報(bào);2005年
相關(guān)碩士學(xué)位論文 前6條
1 夏兵朝;動(dòng)物機(jī)器人的語(yǔ)音導(dǎo)航與精細(xì)控制方法研究[D];浙江大學(xué);2015年
2 熊瑋;自助語(yǔ)音識(shí)別流程編輯器的設(shè)計(jì)與實(shí)現(xiàn)[D];電子科技大學(xué);2015年
3 王淑華;基于PDA的語(yǔ)音導(dǎo)航系統(tǒng)相關(guān)技術(shù)研究與實(shí)現(xiàn)[D];江西師范大學(xué);2007年
4 田露;視障大學(xué)生心理測(cè)試系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];電子科技大學(xué);2012年
5 王旭旭;承德市農(nóng)業(yè)專(zhuān)家語(yǔ)音服務(wù)系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D];電子科技大學(xué);2010年
6 許家昌;電氣工程師PDA公式處理與資料查詢(xún)?cè)O(shè)計(jì)與實(shí)現(xiàn)[D];安徽理工大學(xué);2009年
,本文編號(hào):1800623
本文鏈接:http://sikaile.net/kejilunwen/wltx/1800623.html