TTS發展迅速 強大到連霍金都用?

TTS是什麼?相信有看過我們分析的已經對TTS有一定的了解。現在,拾捌堂就帶大家認識TTS的發展歷史,以及它的未來發展等有關TTS的種種事情。

首先談談TTS的發展歷史,要成功做到TTS(Text To Speech),很大程度需要靠電腦和人工智能(Artificial Intelligence,AI)的幫忙。人類早在17世紀已開始研發機械式說話裝置,直到19世紀,貝爾實驗室(The Bell Labs)對於電子語音合成技術的研究有突破,開啟了近代語音合成技術(TTS)的發展。

1939年,貝爾實驗室製作出第一個,利用共振峰原理(Formant)所製作的電子語音合成器VODER,開啟了TTS的開端。及後,瑞典語言學家G. Fant在1960年提出線性預測編碼技術(Linear Predictive Coding,LPC)來作為語音合成分析技術,加上E.Moulines和F.Charpentier在1980年代提出PSOLA語音合成演算法,都推動著現在的TTS發展。

醫療是TTS的其中一個重要的用途。著名用家包括剛剛去世的物理學家霍金(Stephen Hawking),其中一個標誌性的記號,就是那台會代他說話的輪椅!80年代霍金並未因漸凍人症(Amyotrophic lateral sclerosis,ALS)而完全失去活動能力時,靠的就是由DECtalk研發的語音合成軟體,做到TTS(Text To Speech)和外界進行溝通。

除了霍金的例子之外,去年底在內地引起哄動的AI虛擬新聞主播也是其中一個較為人識的用途。新華社研發的AI合成主播,通過節錄真人主播報道片段中的聲音、口形、表情、動作等特徵,再經AI分析及生成,只要在AI主播前顯示文字或報道內容,AI主播就能準確讀出。

另一個生活化的應用就是Google Assistant等智能家居助理。以Google為例,Google有自行研發的專屬的語音合成標記語言the Speech Synthesis Markup Language(SSML)技術來支援語音合成應用程式,並操控互動語音系統,使AI智能助理能解讀人類的文字輸入和語音提問,並配合能令AI發聲更接近真人的WaveNet技術,對提問作出回應。

其實TTS的用途已非常廣泛,從巴士上的抵站播報,到各大網站內時常遇上的Chatbot,都具備了TTS的功能。隨著AI、大數據(Big Data)和機器學習(Machine Learning)的進步,TTS的像真程度會變得越來越高!TTS背後,少不了NLP的功勞!想知道NLP最新的發展水平?立即按這裡看看吧!

三大編輯精選:

TTS vs STT TTS和STT的分別是什麼?

Voice Search新趨勢!2020最新搜尋方式你不能不知!

不用開口都知你想講什麼?未來AI能將思考轉成語音!

 

Leave a Reply

Your email address will not be published. Required fields are marked *