MolmoWebはAllen Institute for AI(Ai2)が2026年3月に公開したオープンソースのビジュアルWebエージェント。HTMLやアクセシビリティツリーを解析せず、ブラウザのスクリーンショット画像を直接見て次の操作を判断する点が特徴。WebVoyagerベンチマークで78.2%を記録し、GPT-4oベースのエージェントを上回ったと公式ブログで報告されている。モデル重み・訓練データ(36Kの人間デモと59万サブタスク)・訓練コード・評価ハーネス・アノテーション収集ツール・合成データ生成パイプライン・デモのクライアントコードまで一式がApache 2.0で公開されており、研究者や自社でWebエージェントを構築したい開発者が再現・改変できる。