Search
Close this search box.

離職風暴後 OpenAI 低調辦開發者大會,推 4 大更新 AI 更便宜

OpenAI、AI、更新

對於 OpenAI 來說,近期的公司變化確實充滿動盪,包括多位高階主管宣布離職、取得重大融資進展,以及低調召開第 2 屆開發者大會(DevDay),並為外界帶來 4 個重要的 AI 更新。

在開發者大會前的記者會上,OpenAI 產品長 Kevin Weil 強調,日前技術長 Mira Murati,以及研究長 Bob McGrew 的離職風波,將不會影響公司的未來發展;Kevin Weil 甚至稱他們是「出色的領導者」,不僅自他們身上學到了許多東西,更是 OpenAI 達成今日成就的關鍵因素。

只不過相較於去年的開發者大會,OpenAI 今年的活動卻顯得格外低調,不但沒有進行網路直播,甚至連執行長 Sam Altman 也沒有現身。

新增提示快取機制,減少開發者 50% 成本

OpenAI 今年在開發者大會推出的 4 項重大創新,包含視覺微調、即時 API、模型提煉與提示快取,共同目標都是為了降低開發者採用 OpenAI 服務的成本,並且加快 AI 應用的普及速度。

外媒認為,OpenAI 這次所帶來的特色與更新,其策略重點擺在增強開發者生態系統,而非直接於用戶端跟其他 AI 應用互相競爭。

首先在「提示快取」(Prompt Caching)方面,該功能會自動對模型最近處理的 token 輸入,為開發者提供 50% 的成本折扣,這將對經常重複使用上下文的 AI 應用帶來顯著支出節省。

其次「視覺微調」(Vision Fine-Tuning)則是為 GPT-4o 的影像辨識功能所打造,允許開發者未來使用 AI 模型時,藉由自定義調整以提高 AI 的視覺理解能力。

OpenAI 表示,視覺微調更新將會為自動駕駛汽車、醫學影像和視覺搜尋功能帶來深刻影響,例如主要於東南亞營運的食品外送與叫車公司 Grab,已經利用這項技術來改進旗下地圖服務,透過僅 100 個範例的訓練,就將車道計算準確性提高了 20%、限速標誌定位精度提高 13%。

進階語音功能開放整合,AI 可模仿人類對話

第三項更新「即時 API」(Realtime API)目前則處於公開測試階段,它讓開發人員能夠創造低延遲、多模態的 AI 體驗,尤其是在語音應用方面,開發者可以更輕鬆的將先前發布的進階語音功能,直接整合到應用程式中。

借助即時 API 功能,未來消費者將能夠與 AI 應用程式直接對話,並且透過自然語言進行溝通,未來 AI 甚至還懂得於講話的中途暫停,藉此模仿人類的對話方式。如健康應用 Healthify、語言學習平台 Speak 等,已經開始將即時 API 整合到產品之中。

只不過,目前即時 API 的定價結構並不便宜,處理每分鐘音訊輸入就需要 0.06 美元,每分鐘音訊輸出則是 0.24 美元,但對於希望打造語音應用相關程式的開發人員來說,OpenAI 服務的價值也許遠超於此。

導入模型提煉,透過大模型訓練小模型

最後在「模型提煉」(Model Distillation)」方面,這項功能被 OpenAI 視為一項嶄新變革,讓開發者可以用 OpenAI 的大型模型,對更小的模型進行「訓練」,創造出成本更低、速度更快的 AI,並且針對特定用途客製化。

OpenAI 舉例,例如一間小型醫療科技新創公司,為鄉下診所開發 AI 診斷工具,藉由模型提煉功能,該公司就可以訓練出一個較為緊湊的模型,使 AI 能夠於效能較弱的裝置執行,同時卻又不失去大型模型應該具備的多元診斷能力。

隨著 OpenAI 將從前鋒創新者,逐漸轉型成平台供應商,這家科技巨頭未來的成功,很大程度上將取決於開發者生態系的培養能力;藉由改進旗下工具、降低成本和應用領域擴展,OpenAI 確實正在為 AI 事業的遠期成長,逐漸定下基礎。

【推薦閱讀】

◆ OpenAI 虧損 1500 億!ChatGPT 可能漲價,擁千萬付費使用者仍不夠

◆ 【台灣 AI 年會登場】下個時代的關鍵產業是什麼?童子賢提 4 大方向

◆ 從 21 小時縮短到 4 小時,台新銀未來將用 AI 寫徵信報告

*本文開放合作夥伴轉載,資料來源:《VentureBeat》《TechCrunch》。首圖來源:Unsplash