Anthropic 宣布將協助開發能夠評估 AI 模型性能和影響的新型基準(benchmark),此計畫將向第三方組織提供資金,以創建能夠有效衡量 AI 模型高級功能的評估系統。
這項計畫可望提高 AI 領域的整體安全水準,並評估 AI 模型在完成網路攻擊、增強大規模殺傷性武器和操縱民眾等任務方面,有怎樣的能力。
此計畫可望促進開發更全面、更可靠的 AI 基準,推動 AI 安全和社會影響方面的研究,並促進 AI 的負責任發展。
不過,也有人質疑 Anthropic 的商業利益是否會影響其資助的評估的客觀性。還有人認為,Anthropic 所強調的「災難性」和「欺騙性」 AI 風險言過其實。

*本文開放合作夥伴轉載,資料來源:《TechCrunch》,首圖來源:Unsplash。



