你能想像,只需錄音一分鐘,便可生成一位能說流利廣東話、聲線與你極為相似的 AI 數碼人嗎?DotAI小編最近親身試用了中國 AI 公司 Minimax 最新推出的語音複製技術——Speech 2,效果令人驚艷。
Minimax無需編寫程式、毋須訓練模型,新手亦可輕鬆上手。對於創作者、KOL、教育工作者,甚至對 AI 有興趣的普羅大眾來說,均是一個極具親和力的入門工具。
近期最受矚目的聲音合成平台:Minimax
Minimax 是一家來自中國的通用人工智能公司,致力於發展多模態 AI 技術。近月,其聲音合成模組在市場上迅速冒起,備受關注。最新版本的 Speech 2 模組提供以下主要功能:
✅ 支援廣東話、普通話、英語等多語言輸出
✅ 聲音複製功能(Voice Cloning)
✅ 自然語調及情感控制(包括快樂、悲傷、憤怒、恐懼等)
✅ 自動朗讀功能(Text-to-Speech)
✅ 最長支援 20 萬字中文文本輸入,適用於長篇小說或教學內容
其最大賣點為操作簡單、輸出自然,擺脫了過去機械感濃重的 AI 聲線;更可進一步微調語速、停頓及音調,使語音更具表現力與情感。
除了語音合成功能外,Minimax 亦提供其他 AI 能力,如圖像生成、文本創作等,顯示出其在通用人工智能領域的雄厚實力與發展潛力。
看完以上介紹,相信不少讀者都已經對 Minimax 的聲音複製功能感到相當好奇,甚至心動想一試。為了讓大家更容易了解整個使用流程,DotAI 編輯團隊率先使用Minimax的Speech 2功能進行實測,了解這項功能是否真的如此強勁!
DotAI Minimax 實測教學:聲音複製及數碼人製作流程
DotAI小編早前已測試 Minimax Speech 2功能,透過複製港版多啦A夢配音員林保全,以及DotAI行政總裁楊廣澤的聲音,為DotAI的Instagram Reels進行配音,朗讀DotAI在星島日報上撰寫的專欄文章《人人都話「識AI」 缺乏標準成職場盲點 參考6個階段成真正高手》,效果相當良好。

DotAI小編試用後,一致同意Minimax的操作簡便,即使缺乏技術背景的用戶亦能輕鬆上手。以下為教學流程:
🔹 第一步:註冊帳戶
瀏覽 Minimax 官方網站
免費註冊帳號,平台每日會提供免費積分予用戶試用各項功能
🔹 第二步:錄製聲音
在本次 DotAI 實測 中,我們發現 Minimax 的聲音複製功能相當直觀易用。整個錄音過程無需額外安裝程式或學習複雜技術,只需透過網頁操作即可完成,真正體現「Minimax 使用免門檻」的優勢。
選擇「Clone Your Voice」功能
錄製約 1 分鐘個人聲音,建議根據平台提供的範例文本進行錄音,以涵蓋多種語調與情緒
系統隨即進行聲線訓練,生成個人專屬 AI 聲音模型

🔹 第三步:輸入文字,生成語音或影片
根據我們的 Minimax 實測體驗,文字轉語音(Text-to-Speech)功能同樣表現出色。無論是短句還是長篇文章,系統皆能準確朗讀,語調自然流暢。
使用「Text-to-Speech」功能,支援:
手動輸入文字
上傳 Word 或 TXT 檔案(影片中亦示範如何上傳字幕檔 .srt)
調整語速、語調、情緒等細節
輸出為影片或音訊格式
系統最高支援輸入 20 萬個中文字,足以應對長篇文本處理。
你亦可以使用生成的聲線朗讀劇本、新聞、社交貼文,甚至是完整小說。

DotAI Minimax 評價
⭐ 推薦指數:🌕🌕🌕🌕🌗(4.5/5 顆星)
✅ 優點
聲音自然流暢,遠離機械聲的既定印象
操作門檻極低,新手亦能快速上手
多語言支援佳,廣東話合成效果尤其出色
價格親民,提供免費試用點數

🛠️ 可改善之處
情緒表現可更豐富細膩
系統介面中英文混雜,影響用戶體驗
某些冷門詞彙仍有發音準確度問題
Minimax 如何協助你的工作與創作?
Minimax 的聲音複製技術,不僅具娛樂性,更極具實用價值。無論是內容創作、商業應用、教學用途,甚至企業營運,都能帶來效率提升與創新應用。
內容創作者與 KOL
Minimax 是製作多語言影音內容的強大工具。你可將個人聲線應用於 YouTube 影片、IG Reels、TikTok 等平台的旁白製作,甚至應對不同情緒與語調需要。當無法自行錄音,或需大量內容配音時,Minimax 可成為你可靠的聲音替身,確保作品穩定輸出,維持質素。
以 DotAI 為例,我們經常製作有關 AI 工具教學的社交媒體短片及 YouTube 解說影片。透過 Minimax 聲音複製功能,我們可以快速生成標準旁白,甚至使用「情感語氣」強化語調表達,節省錄音時間之餘,亦確保語音品質一致,適用於多平台發佈。
商業應用層面
AI 聲音可大規模應用於客戶服務,例如處理常見查詢,提升效率同時提供溫暖自然的回應聲線。企業在製作產品解說影片時,僅需上傳文本內容,即可快速輸出高質素旁白,節省製作與人力成本。對需要覆蓋多市場語系的企業來說,多語言聲音克隆功能更是極大優勢。
DotAI經常會為 AI 產品製作功能解說影片,透過 Minimax 的 Text-to-Speech 模組,我們可根據不同語言市場,快速切換旁白語系,例如廣東話、普通話及英文版本,無需額外請配音員,大幅提升內容本地化效率。
教育與出版領域
教師可使用個人聲線製作網上教學影片、有聲教材或電子書語音版本,增強學習體驗與學生投入度。語音同步生成字幕,協助學習者配合節奏進行學習。出版社及內容平台則可將長篇文章自動轉換為語音內容,擴展至 Podcast 或有聲書等市場。
對DotAI團隊來說,透過 Minimax 的語音合成功能,可以幫助我們將課程講義快速轉換為語音版本,方便讀者一邊聽一邊學;長篇內容亦可應用於開發 Podcast 版本,擴展內容的多元載體與使用場景。
AI 聲音創作的新時代:你準備好未?
Minimax 展現了 AI 聲音合成技術的最新高度,尤其在廣東話語系的支援方面,屬市場上極罕見的高質選擇。隨着技術不斷進步,未來功能勢將更加完善,為各類用戶帶來更多驚喜與應用潛力。
不論你是內容創作者、教育工作者、企業推廣人員,還是對 AI 充滿好奇的用家,Minimax 絕對值得你一試。
其他文章