LLM向けデータの生成、クリーニング、評価、前処理を、オペレーターとパイプラインで一元化できるデータ準備フレームワークです。