Google 在12/5 推出全新 AI 模型 PaliGemma 2,表示這是讓視覺 AI 變得更容易使用的重要一步。PaliGemma 2 能分析圖像,讓 AI 協助生成說明文字,並回答關於圖片中它所「看到」的人物問題。然而,外媒觀察到當中有個奇怪的功能──「識別」情緒的能力。
Google 部落格文章中寫道:「PaliGemma 2 可為圖像生成詳細、與上下文相關的說明,不僅僅是簡單的物體識別,還能描述動作、情緒和場景的整體敘述。」
報導指出,雖然 PaliGemma 2 的情緒識別功能並非開箱即用,需要使用者為此目的進行微調,但已經提供了公開可用的情緒偵測工具,引發專家們的強烈擔憂。
跟 AI 互動更直覺!Gartner 預測到 2027 年,40% 生成式 AI 解決方案將是多模態
專家憂心:情緒識別 AI 建立在不可靠的科學基礎上
牛津網路研究所數據倫理和人工智慧教授 Sandra Wachter 告訴《TechCrunch》,這讓他感到不安,「我發現假設我們可以『讀懂』人們的情緒是有問題的。」
多年來,科技巨頭都在試圖打造可以偵測情緒的 AI,用於從銷售訓練到預防事故的各種用途。然而,這些系統的科學基礎仍然站不住腳。這是因為,大多數情緒偵測都借鑒了心理學家 Paul Ekman 的早期研究──認為人類有 6 種基本情緒,但後續研究已對 Ekman的假設提出質疑,指出不同文化中情緒的表達和解讀存在重大差異。
倫敦瑪麗皇后大學 AI 研究員 Mike Cook 指出:「情緒偵測在一般情況下是不可能的,因為人們以複雜的方式體驗情緒。」他補充,雖然在某些情況下可能檢測到一些通用的情緒標誌,但這不是我們能夠完全「解決」的問題。
研究顯示,情緒檢測系統往往不可靠,並受到其設計者假設的偏見影響。2020 年的麻省理工學院研究顯示,分析臉部的模型可能會對某些表情,例如微笑,產生無意識的偏好。
Google 向《TechCrunch》表示,已進行了「廣泛的測試」來評估 PaliGemma 2 中的人口統計偏差,並指出其「惡意和褻瀆」行為的程度比產業標準更低。根據報導,Google 唯一揭露的標準是 FairFace──這是一組數萬人的頭像,而 Google 稱 PaliGemma 2 在 FairFace 上得分很高。
情緒檢測被監管盯上!Google 怎麼看這項產品風險?
PaliGemma 2 這類的具有情緒識別能力的開放模型,引起的最大擔憂是可能會被濫用或誤用,進而造成實際傷害。
非營利 AI 研究機構 AI Now 研究所的資深科學家Heidy Khlaaf 警告情緒識別能力將影響執法、人力資源、邊境管理等應用,「你的情緒決定你是否能找到工作、貸款,以及是否能被大學錄取。」
事實上,情緒檢測系統已引起了海外監管機構的關注,並試圖限制在高風險環境中使用這項技術。歐盟的《AI法案》已經禁止學校和企業雇主部署情緒檢測器,但不包括執法機構。
當被《TechCrunch》問及推出 PaliGemma 2 的風險時,Google 發言人表示, PaliGemma 2 背後有針對視覺問答和圖像說明的「代表性損害」測試,並強調他們對 PaliGemma 2 模型進行了關於倫理和安全的嚴格評估,包括兒童安全、內容安全性。

【推薦閱讀】
*本文初稿為 TechOrange 使用 AI 編撰,資料來源:《TechCrunch》,首圖來源:Google。



