AISI、スケールAIと提携 モデル評価を強化

FEDSCOOPは2月10日、AI安全研究所(AI Safety Institute: AISI)がスケールAI社(Scale AI)を初の第三者評価機関に選定し、AIモデル評価の新たな仕組みを導入すると報じた。評価基準はAISIとスケールAI社の研究所(Safety, Evaluation, and Alignment Lab: SEAL)が共同で策定し、数学、論理的思考(推論)、AIコーディングなどの性能が評価対象となるという。同社の研究ディレクター、サマー・ユエ氏(Summer Yue)は「モデル開発者に効率的な技術評価手段を提供する画期的な一歩」と述べ、これまでオープンAI社(OpenAI)などの大手AI企業に限られていたモデル評価が、中小企業へ門戸が開かれた決定を高く評価した。企業側は自社のAIモデル基準に基づいた評価を行うことで安全性や性能の向上が可能になり、政府にとっても独自に評価基盤を構築する時間とコストを削減することができる。希望に応じて、評価結果の共有もできるといい、国際的にもAIの安全性向上に寄与すると期待されている。

FEDSCOOP “US AI Safety Institute taps Scale AI for model evaluation” (02/10/25)