AIエージェントやLLMの挙動を評価・監視し、幻覚、安全性、信頼性の問題を検出して本番導入を支援するAI評価プラットフォームです。