8/8/25
AI 新聞

OpenAI 正式發布GPT-5 ! 4 大實測案例+7大功能升級詳解

OpenAI 正式發布GPT-5 ! 4 大實測案例+7大功能升級詳解

OpenAI 最新推出的 GPT-5,不僅僅是速度更快或參數更大,而是正式邁入「統一智慧系統」的新階段。這個系統具備自我判斷能力,能根據問題的難易程度,自動選擇快速回應或進入深度思考模式,實現真正動態調節的 AI 智能回應機制。

我們觀察到,GPT-5 在多個高頻應用場景(包括程式生成、內容寫作、健康資訊解讀)皆有顯著提升,更關鍵的是,它開始具備「自我覺察」能力——能明確承認自身無法完成的任務、不再亂給答案,這種誠實與邏輯判斷力,為知識型 AI 的可信度立下新標準。

綜合多項測試指標,GPT-5 在 HealthBench、SWE-bench、GPQA 等標竿評估中皆創下新高,同時可於運算資源減少的情況下,完成更高層次的推理任務。對於中小企業、創作者與專業用戶而言,GPT-5 不僅更聰明、更可靠、更實用,更重要的是——已向所有使用者開放,包括免費用戶亦能立即體驗其核心能力。


GPT-5 懶人包進化重點

  1. 統一系統架構:可根據問題複雜度自動切換模型,提供最合適回應。

  2. 三大核心應用強化:寫作、程式開發、健康問題回答準確度顯著提升。

  3. 幻覺率大降:事實錯誤率比 GPT-4o 減少六倍,內容可信度提升。

  4. 更誠實透明:懂得承認限制,不再亂答虛假內容。

  5. 審美與前端程式表現提升:單句 prompt 生成美觀網站/遊戲成品。

  6. 多模態推理增強:圖像/圖表分析、空間邏輯與科學理解力更強。

  7. 寫作表現躍升:詩歌、自由文句構與情感層次均比以往更精細。

  8. 高風險領域安全提升:回應更靈活、不再死板拒絕,提供替代選項。

  9. 支援自訂聊天人格:用戶可設定冷靜、機械、安慰等風格回應。

  10. GPT-5 Pro 模式推出:針對困難任務提供超長思考與進階推理功能。


實測1|行銷企劃結構完整 但創意與人味不足

GPT-5 在語言生成方面的整體能力有所提升,尤其在詩歌創作、報告起草等結構性任務中展現更高準確性與語法穩定性。不過,DotAI 團隊亦曾實測讓 GPT-5 協助發想行銷企劃,發現其產出內容雖結構完整,卻缺乏創意連貫性,語句表現偏向中性與制式,難以真正勝任品牌寫作與情緒風格表達等場景。

GPT-5還是不懂平台生態與在地文化 例如,它完全不懂玩 Threads,也不理解香港市場的網絡生態、「流量密碼」。這些需要深度文化理解的創意,目前仍是它的盲區。



實測2|一行指令生成測驗網站,還能串接 WhatsApp

GPT-5 在程式設計領域的進展極為顯著。如影片中所示,它能根據單一指令,生成一個功能完整的互動式網站,用於測試使用者對特定主題(如「DotAI AI-In-One」課程)的了解程度,並處理從前端介面到外部應用連動的全部環節。

  • 生成特定主題的測驗應用 僅需一句話的指令,GPT-5 就能生成如影片中展示的完整問答遊戲,其內容是專門用於測試學員對「AI-In-One」課程(如行銷時數、會員權益等)的熟悉度。這包含了動態題目、計分與互動動畫等核心功能。

  • 整合個人化結果與分享功能 它不僅能設計出美觀的介面,還能整合實用功能。例如在測驗結束後,能自動產生包含個人分數的結果頁面,並觸發「WhatsApp 分享」按鈕,將含有課程測驗成績的訊息傳送出去。

  • 更可靠的底層技術 此等應用的背後,是其強大的程式碼修正能力。GPT-5 在修正真實世界程式錯誤的業界測試(SWE-bench)中創下紀錄,證明其產出的程式碼不僅功能客製化,也更加穩定可靠。


實測3|遊戲開發實測從文字到可玩的「行銷遊戲」

這次的實測充分展示了 GPT-5 在遊戲開發與商業邏輯整合上的驚人躍進。

只向他說一句簡單遊戲製作,GPT-5 像個開發夥伴跟我對話,先教我怎麼把課程銷售訊息融入遊戲。我同意後,5分鐘就做出包含角色、音效的完整遊戲。最關鍵的是,它最後還自動寫好營銷訊息,成功發送課程優惠券,完成了整個銷售閉環


實測4|遊戲開發實測從文字到可玩的「行銷遊戲」

使用者提出需求:「建立一個『DotAI 學生白板』,需要有畫圖工具、橡皮擦、儲存功能,並可以置入公司 Logo。」

GPT-5 不僅完美生成了所有指定功能,在面對複雜指令時,即使 AI 一度「卡關」,它並不會就此停住。相反,它會主動與使用者溝通,提出「我們先完成一個核心功能,再逐步疊加」的建議,引導使用者分步完成,最終成功建構出整個應用。


升級1|統一智慧系統正式登場

GPT-5 最大的技術飛躍,來自全新設計的「統一智慧系統」架構。與以往用戶需自行選擇不同模型(如 GPT-4、GPT-4o、o3)相比,GPT-5 已全面整合所有模型類型,實現自動判斷的新交互方式。用戶無需再手動選擇模型,GPT-5 會根據問題的類型與難度,動態切換以下三種運作模式:

  1. 🔹 快答模式:回應速度更快,適合日常問題與快速資訊查詢。

  2. 🔹 深度思考模式(GPT-5 Thinking):遇到需要邏輯推理、多步驟處理的任務,自動開啟「思考模式」。

  3. 🔹 即時決策路由:GPT-5 會分析問題類型、內容長度、指令語氣(如「請深入思考」)等,實時決定使用哪個處理模式。

這個「內建判斷力」背後其實是一套不斷學習的路由系統,會根據使用者的選擇、對話偏好與實際使用行為進行自我調整。例如:你經常手動切換到 GPT-5 Thinking 模式,它就會提早啟用「深度解題」機制,省去你每次重新設定的工夫。

📌 DotAI 編輯觀察:

GPT-5 不再只是工具,更像一位能「觀察你怎麼問」的 AI 夥伴。這種能力,對需要日常寫報告、做產品研究、寫策略建議的知識工作者而言,真正省時又省腦。


升級2|健康領域表現更準確,亦更貼近地區語境

GPT-5 在健康領域的表現,堪稱其本次升級中最具突破性的亮點之一。根據 OpenAI 提出的 HealthBench 標準測試結果,GPT-5 在各類健康問題處理上的正確率大幅提升,並能更主動地針對用戶描述進行風險預測、問題澄清與建議判斷。

與以往模型不同,GPT-5 並非僅提供單一答案,而是會結合用戶知識背景、所在地區與相關醫療建議,提供更具針對性與安全性的回應。它也更懂得分辨醫學資訊中可能的風險,若遇到無法明確回答的問題,會主動指出資訊限制,避免誤導或過度自信。

這種主動查缺補漏的「健康助理」角色,並非取代醫療專業人員,而是協助使用者在與醫生互動之前,能更有準備、更具理解力地面對診斷與治療選項。

📌 DotAI 編輯觀察:

GPT-5 不再只是「回答醫療問題」,而是進化為一個能預判你忽略的細節、提醒潛在風險的健康思考夥伴。對於香港用戶來說,它亦可根據本地語境與制度作出更準確建議,安全性明顯提升。


升級3|40 多項專業任務超越專家水準

GPT-5 在處理高難度、具經濟價值的知識工作方面,已達專家等級水準。在最新的實測中,GPT-5 在 40 多個專業領域(如法律、物流、銷售、工程)中的表現,往往優於人類業界從業者。尤其在進階模式 GPT-5 Pro 中,其表現更被外部專家評為「可作為決策輔助的重要參考來源」。

根據官方資料,在 GPQA(博士級科學問答)、SWE-bench Verified(軟體工程錯誤修復)、Humanity’s Last Exam(跨學科人文與科學問答)等指標中,GPT-5 均創下目前最高紀錄。這代表它不僅能正確回答專業問題,更具備跨模態理解、推理、協作與任務規劃的能力。

此外,GPT-5 能同時整合多種工具(如搜尋、終端、程式編輯器),進行多步驟任務與條件推理,並可根據提示靈活調整操作流程,在處理變動性極高的實務情境中展現極高適應力。


📌 DotAI 編輯觀察:

GPT-5 的進階推理能力已不再只是輔助寫報告,更可實質協助企業處理跨部門決策問題,例如法規判讀、複雜報價分析、供應鏈最佳化等任務。對知識密集型產業來說,它正快速變成一項不可忽視的生產力資產。


升級4|幻覺率大降 內容可信度提升

GPT-5 在安全性與回應誠實度方面,展現出明顯進步。相較以往只會「拒絕回答」或提供模糊資訊的 AI 模型,GPT-5 採用全新的安全訓練策略「安全補全」(Safe Completion Paradigm),當遇到具有雙重用途或難以判斷意圖的問題時,不會一概拒絕,而是提供部分答案或高層次描述,並清楚交代限制與替代建議。

此外,在處理虛假資訊與模型幻覺方面,GPT-5 的事實錯誤率為 GPT-4o 的六分之一,並能自我辨識哪些任務因缺乏工具或限制條件而無法完成,明確提示「此任務無法執行」,而非虛構執行結果。這種「不懂就講、不會就說」的能力,是 GPT 系列首次具備的真誠回應機制。

在避免過度迎合方面,GPT-5 同樣表現突出。針對刻意設計以測試模型討好傾向的 prompt,其迎合率由 GPT-4o 的 14.5% 降至 GPT-5 的 6% 以下。這讓回應更中立、專業,也更具可預期性。


📌 DotAI 編輯觀察:

GPT-5 不再是「你講乜就點頭」的 AI,而是會主動指出邏輯問題、限制條件,甚至糾正你的假設。這種誠實與自覺,正是企業導入 AI 協作時最渴望的一種風格轉變。


升級5|減少迎合性並優化風格

GPT-5 修正了前代模型過度迎合、奉承的問題,使用更少不必要的表情符號,讓對話體驗更深思熟慮。開發團隊透過新的評測與訓練方法,在確保用戶滿意度的同時,大幅降低了模型的附和傾向,使其回應更具建設性與專業性。

在針對性評測中,GPT-5 的迎合性回覆比例從 14.5% 顯著降至 6% 以下。此外,新版本支援用戶自訂聊天人格,可根據需求設定為冷靜、機械、安慰等不同回應風格


升級6|從免費版到 Pro、API 全面開放

雖然 GPT-5 已全面開放予所有 ChatGPT 用戶使用,但不同版本在實際使用上仍有明顯限制,尤其是 GPT-5 Thinking(深度推理模式)屬高資源運算功能,使用次數會因帳戶級別而受限:

📌 注意事項:

  • 若系統偵測到濫用(如自動化、大量併發、共享帳號、商業轉售等),可能會凍結帳號或限制功能

  • OpenAI 保留根據實際情況調整帳戶限制與使用權限的權利


API 版本與定價(每百萬 tokens)

開發者可透過 API 使用完整上下文支援(最高可達 400K tokens),並調整 reasoning_effort(推理深度)與 verbosity(輸出詳略度)等參數,自行配置模型效能與回應風格。


哪些第三方平台提供免費試用 GPT-5 ?

除了 ChatGPT 官方平台,現時亦有多個第三方平台提供免費試用 GPT-5 的入口,例如:

  • Microsoft Copilot:Microsoft Copilot現已整合GPT-5,支援於Windows 11、Edge瀏覽器以及Microsoft 365全系列(含Office文件等)。


  • Perplexity.ai:Perplexity已上線GPT-5模型,用戶可在提問時自動體驗GPT-5的先進推理能力。


  • POE:POE平台已開放手動選取GPT-5模型進行對話,可支援中長篇內容生成,操作介面簡潔,適合多類型用戶快速上手。


GPT-5 不只是模型,而是一場 AI 協作新時代的開端

GPT-5 的推出,象徵生成式 AI 正從單點工具走向一個具備智慧決策、自我適應、跨模態理解能力的「夥伴型 AI」。它不再只是資訊的提供者,更是可與你共同推進工作、優化流程與激發創意的協作助手。

然而,真正的關鍵不在於 GPT-5 有多強,而在於我們是否已準備好,讓自己與 AI 協作,建立屬於自己的 AI 操作能力與工作流。

📣 如果你想全面掌握這項新技能,DotAI 特別推出:

🎓 AI-in-One 實戰成長計劃|三大 AI 課程系列 × 全額學費回贈

全港唯一 AI 課程全額回贈計劃,涵蓋三大主題主線:

  • 🧠 職場 AI 應用

  • 📣 AI 數碼營銷

  • ⚙️ No-Code 商業應用開發

全年無限次重複參加實體課堂,完成 100 小時學習後,全額退回 HKD $13,999 報名費。讓你真正學得識、用得出,構建自己的 AI 工作方式。

🔗 立即了解課程詳情 |成為下一位真正「識用 GPT-5」的人才。

 DotAI Spot
AI 實戰成長社群

DotAI 全新學習體驗,陪伴您跨越 AI 學習迷惘

Mobile Image
Mobile UI
Camera
Mobile Image
Mobile UI
Camera
Mobile Image
Camera

 DotAI Spot
AI 實戰成長社群

DotAI 全新學習體驗,陪伴您跨越 AI 學習迷惘

Mobile Image
Mobile UI
Camera
Mobile Image
Mobile UI
Camera
Mobile Image
Camera

訂閱 DotAI 電子報

每週精選最實用 AI 攻略

在不同社群關注我們的資訊

訂閱 DotAI 電子報

每週精選最實用 AI 攻略

在不同社群關注我們的資訊

其他文章

想了解如何通過 AI 增強競爭優勢?

隨時歡迎聯絡我們!

電郵

info@dotai.hk

地址

Room 901 , Gravity,  29, Hing Yip Street,

Kwun Tong, Kowloon

追蹤我們的社交媒體

留下訊息

我們會儘快回應你的訊息

想了解如何通過 AI 增強競爭優勢?

隨時歡迎聯絡我們!

電郵

info@dotai.hk

地址

Room 901 , Gravity,  29, Hing Yip Street,

Kwun Tong, Kowloon

追蹤我們的社交媒體

留下訊息

我們會儘快回應你的訊息

致力推動香港 AI 發展

© dotai.hk 2025. All Rights Reserved

致力推動香港 AI 發展

© dotai.hk 2025. All Rights Reserved