国防総省(Department of Defense)の最高デジタル及び人工知能局(Chief Digital and Artificial Intelligence Office: CDAO)は、軍事医薬という観点で、大規模言語モデル(LLM)チャットボットの使用に焦点を当てた「クラウドソースによるAIレッド・チーム確証プラグラム(Crowdsourced AI Red-Teaming (CAIRT) Assurance Program)」パイロットを成功裏に完了した。CAIRTプログラムは、AI確証及びAIリスク軽減に関する手法を、草の根方式でクラウドソースによって生成するという国防総省の取り組みを支援するもので、プロジェクトはクラウドソースを通じて、大量のデータを引き出すことや、広範な関係者を関与させることが可能となる。CAIRT LLMパイロットは、アルゴリズム評価関連の慣行コミュニティの構築に取り組んでいる技術会社、ヒューメイン・インテリジェンス社(Humane Intelligence)が、国防医療局(Defense Health Agency)及びプログラム執行局/国防医療ケア管理システム(Program Executive Office, Defense Healthcare Management Systems: PEO DHMS)との協力により、実施した。ヒューメイン・インテリジェンス社は、敵対的な技法を使ってシステムの頑強性を内部的に試験するレッド・チーミング(red-teaming)手法を使い、具体的なシステム脆弱性を効果的に検出することに成功した。