Experiment Design for Stochastic Systems

AI systems are unpredictable: same query, different results on different runs

Same input → different outputs → more noise in your experiment