Google Cloud 語音轉文字及翻譯 : 音檔逐字稿翻譯

在本篇文章中,我們將介紹如何使用 Google Cloud 平台的 UI 介面,進行語音轉文字後,再透過 Python 串接翻譯API,進行音訊逐字稿的翻譯。與上一篇【Google Cloud 語音轉文字及翻譯 : 直播翻譯】有所區別,上一篇主要介紹如何進行直播翻譯,而本篇則是教授如何在 GCP 的 UI 介面上,進行音頻檔案的轉譯。本次我們要轉譯的語音檔案長達一個半小時,超過了 Google Cloud 在線轉譯的 10MB 限制,因此我們需要先將檔案上傳至 Cloud Storage。

Speech-to-text UI 介面

上傳完成後,打開 UI 介面並創建新的設定,輸入需要的語音資訊,如圖一所示。

語音轉文字及翻譯-介面

圖一

如果直接選擇已經上傳至 Cloud Storage 的檔案,則系統會自動填入語音類型、採樣率等等資訊,如圖二所示。

語音轉文字及翻譯-語音類型

圖二

接下來,在第二步中,我們需要填寫音檔中所使用的語言。英語就有英式英語、美式英語、香港英語、新加坡英語等不同方言,我們也可以選擇添加三種語言翻譯。使用者可以根據需要勾選相應的選項,例如將說話者的情感轉換成對應的表情,將描述的標點符號轉換為相應的符號,如圖三所示:

語音轉文字及翻譯-語言

圖三

第三步,根據您的需求勾選啟用模型自適應功能的選項,然後按下「提交」按鈕以開始處理檔案。如圖四所示,檔案開始進行處理。

語音轉文字及翻譯-提交

圖四

當檔案處理完畢時,檔案左側將顯示綠色勾勾。點擊綠色勾勾即可下載 transcript。您可以選擇要下載的檔案格式,包括 CSV 檔或 TXT 檔。如圖五所示。

語音轉文字及翻譯 - CSV/TXT檔

圖五

現在,我們已經成功地將語音檔案轉換為文字檔案。接下來,我們需要進行翻譯。本文採用的方法是直接從 Cloud Storage 下載 JSON 檔案,如圖六所示。接著,我們使用 Python 串接翻譯 API 進行翻譯。

語音轉文字及翻譯-使用 Python 串接翻譯 API

圖六

Translation API 

我們使用 new_speech.json 檔案,該檔案是從 Cloud Storage 下載下來的語音轉文字檔案。下一步的程式碼展示了我們使用 API 將英文轉譯為目標語言 zh-TW,使用 Neural Machine Translation(NMT)模型,並將結果儲存為 txt 檔案。如果您直接下載生成的 transcript 檔案,您可以選擇是否包含時間戳記、檔案類型等設定。相較於下載 json 檔案並串接 API 翻譯,直接下載 transcript 檔案能更直接地取得所需的檔案內容和類型,如圖七所示。

語音轉文字及翻譯- transcript 檔案

圖七

總結

綜合以上,本文詳細介紹了如何透過 Google Cloud 平台的 UI 介面進行語音轉文字和翻譯。使用者可先將檔案上傳至 Cloud Storage,再透過 UI 介面創建設定,填寫所需的語音資訊和語言選項,來進行轉文字的操作。最後,使用者可以下載轉換完成的 CSV 或 TXT 檔案。而如果需要進行翻譯的話,則可以使用 Python 串接翻譯 API,以將轉換完成的文字檔案進行翻譯。如果使用者需要直接取得所需的檔案內容和類型,也可以選擇下載 transcript 檔案。透過以上步驟,使用者可以輕鬆且迅速地進行語音轉文字和翻譯操作,並且可以根據個人需求進行更多的自訂設定。

最專業的技術團隊! 提供您最完善的技術教學和服務

思想科技 Master Concept

Leave Us Your Message.
We are ready to talk!

歡迎您與我們聯絡。
我們會協助您取得最佳解決方案!

歡迎您與我們聯絡。
我們會協助您取得最佳解決方案!

Leave Us Your Message.
We are ready to talk!

找不到您需要的? 加入我們的最新活動!

搶先了解
新趨勢