多模態 AI 成為 2024 年大型科技公司的必爭戰場,除了要靠更強大的 AI 找出下一個殺手級服務,同時企業也得提供用戶更流暢的 AI 體驗,並且兼顧妥善保護用戶的個人隱私資料。這對 Google、Apple 等企業無疑是一個全新競爭門檻。
身為廣告搜尋巨頭,Google 抓準 AI 助理機會再次起飛
Google 在搜尋與廣告上的巨大成功是一個指標也是一個負擔沈重的轉型壓力,當 AI 時代來臨,Google 同樣需要專注於尋找企業的第二成長引擎,將 AI 創新轉化為可營利的產品與服務。Google 推出 Gemini AI 聊天機器人,預計將各種 Google 產品(信件、地圖、搜索引擎等)加入 Gemini,就可以享有 AI 自動回覆電子郵件,或根據拍攝的音樂會海報和 Google 日曆,判斷使用者是否有時間去聽音樂會等智慧服務。
Google 的如意算盤是這樣:下一階段的智慧手機大戰,不一定是比拼硬體規格,而是比拼軟體、AI 助理的智慧服務。多模態的人工智慧助理具有極大的商業前景,AI 可以更進入當下的場景狀況,並且透過語音、圖像、文字等多元內容與人類進行更自然的互動,而 Google 在搜索、Android 上的強勢地位,正可讓多模態 AI 助理來延續這樣的優勢。
Google 最近也開放 Gemini Live 的付費服務,目前在部分的三星 Galaxy 與 Pixel 手機上支援,每個月需要 19.99 美元的費用即可讓用戶享受最先進的 AI 行動助理服務。此舉也被外界視為測試用戶是否願意為 AI 助理付費,以及可否變成消費市場商品的關鍵財務指標。
Apple 官宣加入多模態 AI 戰場,變身 AI 指標股票
身為 Android 陣營的最大競爭對手,iOS 系統開發商 Apple 也在打 AI 手機生態系的主意,甚至願意為了 AI 而改變多年以來的低調風格,直接大力官宣要擁抱 AI 市場。
Apple 與瑞士洛桑聯邦理工學院(EPFL)合作,在 Hugging Face 平台上推出了多模態 AI 模型 4M 的公開版本。這個模型能夠處理和生成多種模態的內容。用戶可以通過系統從文字描述中創造圖像、執行複雜的物體檢測,甚至利用自然語言輸入來操作 3D 場景。
科技媒體《VentureBeat》指出,過往 Apple 都是透過產品來說話,極少如此公開透明宣傳企業的策略,甚至願意宣布與 OpenAI 建立合作夥伴關係——OepnAI 將支援 iPhone 和其他裝置上的新功能「Apple Intelligence」,這些都讓華爾街對於 Apple 的青睞持續升高,Apple 不但是一隻正夯的 AI 飆股,股價自五月起持續成長,甚至在財測上各家分析師對 Apple 2027 年收入和獲利成長的預期分別提高了 4 個和 8 個百分點。
當然踏入 AI 市場對這兩大巨頭並不能說輕而易舉,Apple 4M 的發佈自然引發 Apple 在訓練模型時是否能同時確保用戶隱私的疑慮,有鑒於模型訓練的特殊需求,Apple 要維持捍衛隱私這塊招牌必須得額外多下功夫。
Google 希望透過 AI 助理再造霸主地位,但過往 Alexa 、Siri 和 Google 的各種助理用戶體驗偏差,要如何定義 AI 時代的用戶體驗、真切地解決當下的客戶痛點,確保服務流程沒有體驗不一致的地方就會是外界最看重的地方。
只能說,這場大戰還沒完,好戲即將上場。
繼續閱讀《人機協作再進化!多模態 AI 來了》Highlight 其他內容:
多模態 AI 是什麼?探索它如何突破生成式 AI 實現多感官協作
*本文開放合作夥伴轉載,資料來源:《Venture Beat》、《Yahoo UK》。首圖來源:Pixlr AI Generated



