人工智慧新創公司 OpenAI 於 10 月 2 日舉辦開發者大會(DevDay),不同於去年的盛大發表,今年的活動相對低調,著重於 API 服務的更新,並未推出重大新產品。OpenAI 宣布了四項主要的 API 更新:模型蒸餾、提示快取、視覺微調,以及全新的 Realtime API 服務。
模型蒸餾:小模型也能有大智慧
OpenAI 推出的模型蒸餾功能,讓開發者可以利用大型模型(如 GPT-4o 和 o1-preview)的輸出結果,來微調較小的模型(如 GPT-4o mini),提升小型模型的效能。OpenAI 表示,過去模型蒸餾是一個多步驟且容易出錯的過程,現在開發者可以透過 OpenAI 的 API 平台,更有效率地完成模型蒸餾。
提示快取:重複指令省錢又省時
OpenAI 也推出了提示快取功能,讓開發者可以重複使用常用的提示,而不用每次都支付全額費用。當 API 偵測到新的提示與先前儲存的提示相同時,就會自動將輸入成本降低 50%。對於 AI 應用程式開發者來說,這項功能可以節省不少成本。
視覺微調:讓 AI 更懂圖片
OpenAI 現在允許開發者使用圖片和文字來微調 GPT-4o 模型,這將增強模型理解和辨識圖片的能力,例如提升視覺搜尋功能、改善自駕車或智慧城市的物體偵測,以及更精準的醫學影像分析。
Realtime API:打造即時語音互動體驗
OpenAI 推出了全新的 Realtime API,讓開發者可以打造近乎即時的語音互動體驗。過去,開發者需要將語音轉錄成文字,再傳送到語言模型處理,最後再轉換成語音輸出,這個過程不僅耗時,也容易造成語氣、情緒和口音的流失。
Realtime API 可以直接處理音訊,無需串聯多個應用程式,因此速度更快、成本更低、反應更靈敏。該 API 也支援函數呼叫,這意味著應用程式可以執行像是訂購披薩或預約等工作。未來,Realtime API 也將支援影片等多模態體驗。
OpenAI 轉向平台供應商,API 服務成發展重點
OpenAI 此次開發者大會聚焦於 API 服務的更新,顯示出 OpenAI 正從單純的 AI 模型開發商,轉型為平台供應商,希望透過提供更完善的工具和服務,吸引更多開發者加入其生態系。
*本文開放合作夥伴轉載,資料來源:《VentureBeat》、《TechCrunch》首圖來源:Unsplash。



