4/15/25
AI 新聞

人類未來或許可以與動物直接溝通!Google新AI模型「DolphinGemma」成功學習海豚語言!

人類未來或許可以與動物直接溝通!Google新AI模型「DolphinGemma」成功學習海豚語言!

A man wearing an AR headset communicates with a dolphin using advanced AI technology, illustrating the concept of Google AI decoding dolphin language. Text on image reads: “Google AI decodes dolphin talk! Can everyone become an animal communicator?”
A man wearing an AR headset communicates with a dolphin using advanced AI technology, illustrating the concept of Google AI decoding dolphin language. Text on image reads: “Google AI decodes dolphin talk! Can everyone become an animal communicator?”

Gemini最近推出一款名為 DolphinGemma 的新型 AI 模型,正在悄悄推動「跨物種溝通」的革命。由 Google DeepMind 團隊研發,結合 Gemma 開源模型 的最新技術,DolphinGemma 已成功學習來自 Wild Dolphin Project 的海豚聲音數據庫,能夠解析野生大西洋斑點海豚的語音模式,甚至預測牠們下一句話可能會說甚麼。

左圖:一隻帶有幼崽的母海豚在覓食時觀察著牠的孩子。當小海豚覓食完畢後,母海豚會使用自己獨特的「簽名口哨聲」呼喚牠回來。 右圖:用聲譜圖來視覺化該口哨聲的樣貌。

左圖:一隻帶有幼崽的母海豚在覓食時觀察著牠的孩子。當小海豚覓食完畢後,母海豚會使用自己獨特的「簽名口哨聲」呼喚牠回來。右圖:用聲譜圖來視覺化該口哨聲的樣貌。(Google Blog圖片)

一場跨越海洋與科技的對話

自 1985 年起,Wild Dolphin Project(WDP)便在巴哈馬水域進行全球最長壽的海豚水下觀察研究。透過非侵入性方式收集的聲音與影像數據,研究人員可精準連結聲音與行為模式,建立起「誰在說話、說咗乜、做緊乜」的獨特資料庫。

以下是部分已辨識出的聲音類型:

  • 簽名口哨:類似名字,用於母子團聚

  • 爆衝聲(Burstpulse):多見於衝突爭鬥時

  • 點擊聲(Buzzes):出現在求偶或追逐時

    AI 如何學識「聽懂」海豚?

DolphinGemma 的背後技術令人嘆為觀止:

  • 音訊處理:使用 Google 的 SoundStream 將海豚聲音轉換成模型可理解的格式

  • 預測能力:像人類語言模型一樣,能預測下一段可能發出的聲音序列

  • 模型規模:大約 4 億參數,可直接於 Pixel 手機上運行,方便野外應用

早期測試顯示,DolphinGemma 不僅可生成擬似海豚聲音,更有助發現隱藏於聲音之間的「結構與規律」——這些正是語言的前身。

在 DolphinGemma 早期測試期間所產生的口哨聲(左)與爆發脈衝聲(右)。(Google Blog圖片)

向雙向溝通邁進:CHAT 系統登場

更令人興奮的是,研究人員並非止步於「理解」,而是正走向「互動」。由 Georgia Tech 開發的 CHAT 系統(Cetacean Hearing Augmentation Telemetry) 是一部水下 AI 裝置,結合 Pixel 6/9 手機的強大運算力,目標是透過合成口哨聲建立與海豚的「共同詞彙」。

例如:

  •  為海豚喜歡的物件(如海草、絲巾)創造獨特口哨聲

  •  當海豚模仿這些聲音,就會得到對應的物件作為獎勵

  •  DolphinGemma 可以加速判別與回應,使互動更流暢

這個過程,正像是為人類與海豚之間架起一座音波橋樑。

DolphinGemma 將開源釋出!

Google 表示,將於 2025 夏天開放 DolphinGemma 作為開源模型供全球研究人員使用。雖然它主要訓練於斑點海豚的數據,但未來透過微調,亦可應用至瓶鼻海豚、旋轉海豚等其他物種的聲音分析。

Dot.AI 解讀:AI 與自然的深層聯繫

我們一直強調——AI 不只是寫文案、畫圖、做自動化工具,更是一種連結世界、探索未知的方式。DolphinGemma 是一個重要的里程碑,代表人類與自然生態的溝通,可能將不再僅止於觀察與記錄,而是主動參與與理解。

在這個資訊氾濫、語言崩壞的年代,這類深度學習模型讓我們再次想起:

「真正有靈魂的 AI,不是做事快,而是理解深。」

訂閱 DotAI 電子報

每週精選最實用 AI 攻略

在不同社群關注我們的資訊

訂閱 DotAI 電子報

每週精選最實用 AI 攻略

在不同社群關注我們的資訊

其他文章

想了解如何通過 AI 增強競爭優勢?

我們隨時歡迎您的聯絡!

電郵

info@dotai.hk

電話

+852 6858 4380

地址

Room 901 , Gravity,  29, Hing Yip Street,

Kwun Tong, Kowloon

追蹤我們的社交媒體

留下訊息

我們會儘快回應你的訊息

想了解如何通過 AI 增強競爭優勢?

我們隨時歡迎您的聯絡!

電郵

info@dotai.hk

電話

+852 6858 4380

地址

Room 901 , Gravity,  29, Hing Yip Street,

Kwun Tong, Kowloon

追蹤我們的社交媒體

留下訊息

我們會儘快回應你的訊息

致力推動香港 AI 發展

© dotai.hk 2025. All Rights Reserved

致力推動香港 AI 發展

© dotai.hk 2025. All Rights Reserved