上月底,谷歌才宣布旗下 給小朋友講故事功能即將引入安卓和IOS手機(︱嘿!谷歌,給我講個故事?。?nbsp;, 最近這家科技巨頭又有了另一項關于“語音”的研究突破 。
谷歌最近的一項新研究可以直接將一種語言的語音翻譯成為另一種語言的語音 , 但與大多數語音翻譯系統不同 , 不使用中間文本 , 只使用音頻 。這大大提升了翻譯速度人工智能機器翻譯,更重要的是,相比普通翻譯器,這項研究精準地還原了說話者聲音的節奏和音調 。
是幾年相關成果帶來的結晶,盡管它仍然處在實驗階段 。谷歌的研發人員和工作人員多年來一直在研究“同聲傳譯”翻譯器的可能性,但直到最近這些努力才有了收獲 。
谷歌表示當前的語音翻譯系統分為三個步驟:自動語音識別,將語音轉換為文本;機器翻譯,將文本轉換為另一種語言;最后是將翻譯好的文本生成語音 。盡管效果不錯 , 卻不完美,因為每一步都有可能發生不同的錯誤,呈現出來的翻譯效果可能會受這些錯誤的影響 。
翻譯模型示意圖
人類的認知過程和體驗常常被用來作為推進科技算法的指南 , 這次也不例外 。
就像能夠使用多種語言的人可以在腦海中隨意翻譯不同語言一樣,雖說不能完全確定這個過程到底是怎么樣的,但絕不是像目前的語音翻譯系統一樣,將語音信息拆分可視化成文本再轉化為另一種語言 。為此,研究人員開始研究將音頻的詳細頻率分解,從而將原語音的頻譜圖()直接轉化為目標語言的頻譜圖 。這是一個與上述三步驟完全不同的過程,有優勢,但也有弱點 。

文章插圖

文章插圖
最大的一個優勢是,盡管這個過程比較復雜人工智能機器翻譯,本質上還是一個一步到位的過程,這意味著,如果有足夠的處理能力,可以更快地工作 。但更對多數人來說更重要的是,這個過程可以很容易地保留源語音的聲音特征 。因此,通過翻譯出來的音頻不會像普通語音翻譯系統一樣“機器味”十足,反而保留了原始音頻的語氣和節奏 。
原語句和翻譯語句的頻譜圖()
這自然會對翻譯表達產生巨大的影響 。對于經常使用語音翻譯軟件的用戶來說,不僅可以翻譯內容,還能更上一層樓,還原說話者原本的語氣和說話習慣,確實是幫了大忙 。
研究人員承認,翻譯的準確性并不如傳統翻譯系統那么好,傳統翻譯系統有更多時間來磨練其準確性 。但是最終的翻譯效果,至少大部分能達到非常好的標準,而且能夠把情緒表達包含在翻譯里已經是一個絕對優勢了 。最后,雖然谷歌團隊謙虛地表示這項研究只是所采用方法的一個可行性起點,但對外界來說,這絕對是重要領域里的一個重大進步 。
此外,谷歌另一個已公開項目:也在研發中 。致力于通過人工智能更好地識別語音障礙人士的語音模式,以達到理解其所傳達信息的目的 。這些項目讓我們看見了谷歌希望打造一個更人性化,更平等 , 更方便的科技世界的愿景 , 我們也期待這一天的到來!
文字來源:Devin@
圖片來源:Bryce/ ,AI Blog
【TECHTIME︱谷歌新推智能“語音翻譯”Translatotron】本文到此結束 , 希望對大家有所幫助 。
- 谷歌 :我們有更強大的語言模型,升級版 Bard 聊天機器人即將上線
- Win10系統中谷歌瀏覽器安裝失敗的解決方法介紹
- 谷歌瀏覽器擴展推薦
- 一 事半功倍提效率,谷歌Chrome瀏覽器擴展程序推薦
- 可下載線刷 谷歌已掛出安卓5.0.1鏡像包
- 谷歌發布Android 5.0 底包驅動下載地址及安裝步驟
- 蘋果、谷歌和微軟將在所有主流平臺上實現無密碼登錄
- 小兒調養︱你以為娃開學就可以解放了嗎?真相扎心了
- 開學忙著搶座位的家長看過來!坐前排真的是在保護孩子們的視力嗎?︱健康中國出行
- 父母為孩子起名“谷歌”!小朋友已收到Google大禮包
