Search
Close this search box.

Anthropic 領航 AI 評估新基準,推動資訊安全和責任發展

Anthropic 宣布將協助開發能夠評估 AI 模型性能和影響的新型基準(benchmark),此計畫將向第三方組織提供資金,以創建能夠有效衡量 AI 模型高級功能的評估系統。

這項計畫可望提高 AI 領域的整體安全水準,並評估 AI 模型在完成網路攻擊、增強大規模殺傷性武器和操縱民眾等任務方面,有怎樣的能力。

此計畫可望促進開發更全面、更可靠的 AI 基準,推動 AI 安全和社會影響方面的研究,並促進 AI 的負責任發展。

不過,也有人質疑 Anthropic 的商業利益是否會影響其資助的評估的客觀性。還有人認為,Anthropic 所強調的「災難性」和「欺騙性」 AI 風險言過其實。

*本文開放合作夥伴轉載,資料來源:《TechCrunch》,首圖來源:Unsplash