AIリスク評価に新手法 「破滅の確率」に代わる確信度と妥当性を提唱

安全保障・新興技術センター(Center for Security and Emerging Technology: CSET)は5月、人工知能(AI)がもたらす壊滅的リスクの評価(Probability of Doom: P-doom)において、従来の「確率」のみに頼る手法を補完する、数学的に厳密な新しい不確実性評価ツールを発表した。AIリスクのようにデータや理論が乏しく、不確実性が高い分野では、専門家の主観的なP-doom評価だけでは不十分とし、「確信度(Belief)」と「妥当性(Plausibility)」という概念を用いた手法を紹介している。証拠に基づく確実性と、反証の不在に基づく可能性の範囲を明確に区別するもので、CSETは政策立案者に対し、リスクの発生根拠と否定根拠を問う2つの簡潔な質問を導入することで、より精緻な意思決定が可能になると提唱している。例えば、6面体のサイコロの3面しか確認できず、1面のみに星がある場合、星が出る確信度は6分の1であるが、未知の面を考慮した場合は6分の4となる(妥当性)とし、この乖離を基に、不確実性の程度を可視化できるという。

CSET ” Beyond P(doom) for AI Risk: Quantifying Uncertainty Without Probability” (05/05/26)