革新的な分子AI学習データセット「OMol25」が公開 

HPCwireは5月14日、ローレンス・バークレー国立研究所(Lawrence Berkeley National Laboratory)とメタ社(Meta)の共同研究チームが、史上最大規模の分子シミュレーション・データセット「オープン分子2025(Open Molecules 2025:OMol25)」を公開したと報じた。複雑な化学反応を正確にモデル化する機械学習ツール開発に向け、1億点以上の3D分子スナップショットを含み、密度汎関数理論(Density functional theory: DFT)を用いて計算されている。従来の平均20~30原子の小規模なシミュレーションに比べ10倍大きく、最大350原子の複雑な分子構造をカバーしており、作成にはメタ社の技術インフラを活用し、従来の10倍以上となる60億CPUコア時間が費やされた。このデータセットにより、機械学習に基づく原子間ポテンシャルモデル(Machine Learned Interatomic Potentials: MLIPs)の開発も加速され、DFT計算の10,000倍高速で同等精度の予測が可能となり、エネルギー貯蔵技術や新薬開発などで革新的な進展が期待される。

HPCwire “Berkeley Lab Co-Leads Release of Record-Scale Molecular AI Training Dataset” (05/14/25)
https://www.hpcwire.com/off-the-wire/berkeley-lab-co-leads-release-of-record-scale-molecular-ai-training-dataset/