11月28日,捷通華聲宣布靈云開放平臺(tái)推出多語種語音合成(簡(jiǎn)稱TTS)技術(shù),全面支持中文、英語、法語、俄語、西班牙語、阿拉伯語、德語、葡萄牙語、日語、韓語、泰語等11種語言,覆蓋全球90%以上的國(guó)家和地區(qū)。這也是捷通華聲推出覆蓋92種語言的手寫識(shí)別(HWR)技術(shù)之后的另一項(xiàng)重大突破。目前,靈云多語種TTS已經(jīng)在靈云開放平臺(tái)全面開放使用。
語音合成即TTS(Text to Speech)技術(shù),又稱文語轉(zhuǎn)換技術(shù),能將任意文本信息實(shí)時(shí)轉(zhuǎn)化為標(biāo)準(zhǔn)流暢的語音朗讀,簡(jiǎn)單講就是讓“機(jī)器開口講話”。通過TTS技術(shù),計(jì)算機(jī)可以在任何時(shí)候?qū)⑷我馕谋?ldquo;輕松”轉(zhuǎn)換成具有高自然度的語音,從而真正實(shí)現(xiàn)讓機(jī)器“像人一樣開口說話”。
2011年12月08日,捷通華聲創(chuàng)造性推出了全球第一個(gè)最大、最全的智能人機(jī)交互(HCI)技術(shù)開放平臺(tái) — 靈云。靈云是一種可以用語音、手寫、拍照、手勢(shì),將來甚至可使用腦波識(shí)別等智能手段來操作、感知手機(jī)、計(jì)算機(jī)等數(shù)字設(shè)備的網(wǎng)絡(luò)云服務(wù),發(fā)展目標(biāo)是讓人機(jī)交互像人與人溝通一樣的簡(jiǎn)單自然。靈云以“云 + 端”方式,為中國(guó)整個(gè)信息產(chǎn)業(yè)領(lǐng)域提供語音合成(TTS)、語音識(shí)別(ASR)、手寫識(shí)別(HWR)、光學(xué)字符識(shí)別(OCR)和自然語言理解(NLU)等多項(xiàng)核心技術(shù)能力。自靈云推出以來,靈云開放平臺(tái)與超過千家企業(yè)形成合作伙伴關(guān)系,為各行各業(yè)企業(yè)提供了全方位HCI技術(shù)支撐。兩年來,靈云智能語音等HCI技術(shù)助力并通過百度導(dǎo)航、導(dǎo)航犬、搜狗地圖、嘀嘀打車、漢字英雄、天行聽書、觸寶輸入法、百度PC輸入法、天行輸入法等家喻戶曉的移動(dòng)應(yīng)用服務(wù)大眾,為超過近3億社會(huì)大眾提供輕松、便捷的HCI技術(shù)服務(wù)。
值得指出的是,此次捷通華聲靈云推出多語種語音合成技術(shù)云服務(wù),與兩周前推出的覆蓋92種語言手寫識(shí)別技術(shù),可謂“珠聯(lián)璧合”,說明靈云平臺(tái)已開始具備服務(wù)全球的基本能力,為助力中國(guó)企業(yè)進(jìn)軍國(guó)際市場(chǎng)、全面參與國(guó)際競(jìng)爭(zhēng)做好越來越充足的HCI技術(shù)能力支撐準(zhǔn)備。相信也會(huì)對(duì)促進(jìn)中國(guó)與國(guó)際間的交流合作做出貢獻(xiàn)。
靈云平臺(tái)是一個(gè)開放的平臺(tái),也是一個(gè)企業(yè)間合作的平臺(tái)。未來發(fā)展,捷通華聲靈云將在發(fā)揮智能語音等多項(xiàng)HCI技術(shù)優(yōu)勢(shì)的基礎(chǔ)上,不斷與國(guó)內(nèi)外學(xué)術(shù)界、產(chǎn)業(yè)界、包括國(guó)際跨國(guó)企業(yè)進(jìn)行合作,力爭(zhēng)通過全球范圍的合作,為世界各國(guó)用戶提供更多、更好、更全面的HCI技術(shù)能力,將合作共贏的理念通過HCI技術(shù)融入中國(guó)IT產(chǎn)業(yè),也融入世界!