MRCP協議-提供語音識別(ASR)與語音合成服務(TTS)
發布時間:2022-02-16作者:小編閱讀:0
MRCP協議(媒體資源控制協議)
媒體資𒁃源控制協議(Media Resource Control Protocol,MRCP)是一🍌種通訊協議,用以語音服務器向客戶端提供各種語音服務(如語音識別和語音合成)。
MRCP并不定義會話連接,不關心服務器與客戶端是如何連接的,M𓄧RCP的消息通常是承載于其它協議之上,如RTSP,SIP等。
MRCP消息使用類似HTTP等很多Internet協議一樣的文本格式,每一個消息包括三一部分:首行,消息頭,消息體。首行說明消息種類及返回碼等信息。消息頭包括了多個行內容,每一行都形如"字段:數值"。消息體包括🎉了消息的詳細內容,長度在消息頭中指定。
類似HTTP,MRCP使用請求(通常由客戶端💫進行)、響應模式。響應能夠簡單的確定請求,或是得出關于處理的其它信息。比如,MRCP客戶端向服務端請求想要推送一些音頻數據以進行處理(例如語音識別),因此,服務端能夠推送一個包括端口號的響應,由于MRCP仍未定義音頻數據的傳輸,因此 ,必須借助其它的協議,例如RTP來進行。
有兩個版本的MRCP協議,版本2使用SIP作為控制協議,版本1使用RTSP。
[1]RFC4463:AMedia Resource Control Protocol(MRCP)
MRCP協議簡述
媒體資源控制協議(Media Resource Contro💦l Protocol,MRCP)是由Cisco、Nuance等公司聯合開發的網絡協議,該協議由IETF作為Internet草案公布(draft-shanmugham-mrcp-07)。該協議為這些必須進行語音處理的客戶端提供了一種通過網絡來控制媒體處理資源(如ASR、TTS模塊等)的體制。該協議在設計之初就考慮到了能夠在將來得到擴展以支持聲紋鑒別和身份識別(SpeakerIdentification/SpeakerVerification)等作用。
MRCP協議定義了控制媒體處理資源所必不可少的請求(Request)、回復(Response)和事件(Event)等消息。MRCP協議也為每一種資源定義了狀態機,為每一個請求和服務器🍌事件定義了需要的狀態轉換。MRCP關心的焦點在于控制這些進行媒體流處理的資源(如ASR、TTS),以及怎樣與這些資源之間進行通信。
MRCP協議不能獨立工作,它依賴于RTSP(RealTimeStreamingProtocol)作為載體在客戶端與服務器端之間建立會話連接。而語音媒體數據則通過RTP(RealTimeTransportPr𝔉otocol)協議連接傳輸給語音應用服務器。
典型的根據MRCP的分布式語音應用系統選用C/S架構,由客戶端傳出媒體流處理請求,服務器端則運用媒體處理資源(ASR/TTS)來處理或生ౠ成媒體流,并將相對的處理結果返回給客戶端。那樣客戶端就可以通過MRCP協議來通過網絡分布式地控制服務器端的媒體處理資源。
隨著MRCP協議的持續推廣與應用,各語音技術廠商在實踐與布署過程中碰到了各種各樣的問題。因此,IESG(TheInternetEngineeringSteeringGroup)于2002年特許成立了Speechsc工作組,專門負責擬定更加完善高效的支持分布式語音資源處理的開放協議。在Speechsc工作組的努力下,改進后的MRCPv2(draft-ietf-speechsc-mrcpv2-09)很快應運而生了。MRCPv2的消息格式和資源狀態機等都建立在MRCP協議版本1的基本之上,它完全兼容W3C的SSML、SRGS、NLSML規范。與MRCPv1不一樣的ཧ是MRCPv2消息不再依賴RTSP作為載體,只是作為獨立的消息進行傳輸,可是它仍依賴于會話管理協議,如SIP(SessionInitiationProtocol)協議,來在客戶端與服務器端之間建立控制會話。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,請聯系站長郵箱:shawn.lee@elian🦩cloud.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。
標題:MRCP協議-提供語音識別(ASR)與語音合成服務(TTS)
TAG標簽:網絡傳輸
地址://beijingyml.cn/article/20210209164747.html