這是翻譯吐司嗎?微軟的即時口譯技術出現重大突破

Microsoft 公開了一個展示新技術的短片,該技術可將說話者講出來的英文翻譯成中文,並模仿說話者原本的聲音重新說一遍,也就是「同步口譯」。
評論
評論

如果讀者恰好對《星艦迷航記》很有研究的話,那想必對於 UT(Universal Translator)這個同步翻譯外星語言的機器應該不陌生,只不過今天要談的不是外星語言,而是英文和中文。昨天 Microsoft 公開了一個展示新技術的短片,該技術可將說話者講出來的英文翻譯成中文,並模仿說話者原本的聲音重新說一遍,也就是「同步口譯」。

在今年 10 月 25 號舉行的微軟亞洲研究院第十四屆「二十一世紀的演算」研討會上,微軟的首席研究長 Rick Rashid 公開展示了這項驚人的研究成果。這個軟體運作的概念很單純,但背後的技術卻不簡單。首先,在開始同步口譯之前,軟體蒐集並分析說話者的聲音資料,以模仿說話者的聲音。開始同步口譯後,對說話者講出的英文進行辨識,將聲音轉換成文字,接著翻譯成中文,最後將中文用電腦語音念出。

圖片來源:微軟亞洲研究院

Rashid 用英文說了:「I'm speaking in English and hopefully you'll hear me speaking Chinese in my own voice.」投影幕上便出現:「我是說英語,希望你能聽我說中國人自己的聲音。」Rashid 接著說:「Again, the results are not perfect.」而這次不只是中文字幕,同時軟體還模仿了 Rashid 的聲音並說出:「再次,結果並不完美。」

雖然 Google 也有類似的電腦語音功能,但最大的不同在於這個技術提供了一個完整的口譯功能,而且降低了辨識的錯誤率,甚至還能仿真說話者的聲音。Rashid 表示,辨識的錯誤率已經從一開始的 20% 下降到 12.5%。

Rashid 在研討會上提到了這個技術的未來願景:

"There's much work to be done in this area, but this technology is very promising and we hope in a few years we'll be able to break down the language barriers between people."

我們在這方面還有很多要努力,但這個技術大有可為,而且我們希望在未來幾年內就能打破人類之間的語言隔閡。

最後當然一定要來看看這段影片了,畢竟文字描述還是比不上親眼所見的震撼程度
(Demo 從 6 分 56 秒 開始)

[youtube http://www.youtube.com/watch?v=Nu-nlQqFCKg?rel=0]
(註一)Microsoft Research shows a promising new breakthrough in speech translation technology