Центральная предельная теорема утверждает, что при большом числе повторных выборок среднего из одной и той же i.i.d. совокупности распределение выборочных средних стремится к нормальному.
Симуляции в R для шести различных распределений (равномерного, нормального, биномиального, бета, экспоненциального и хи-квадрат) показали, что при размере выборки 60 распределения средних действительно выглядят примерно нормальными.
При малом размере выборки (n=6) для построения доверительного интервала вместо нормального распределения нужно использовать t-распределение, иначе фактическая частота попадания истинного среднего в 95%-й интервальный доверительный интервал оказывается ниже ожидаемой.
Для сильно скошенных распределений (бета, экспоненциального, χ²) необходим больший размер выборки, чтобы CLT «сработала» и приблизила распределение средних к нормальному.
Сравнительная анимация Q–Q графиков показала, что равномерное распределение сближается с нормальным уже при n≈8, тогда как для экспоненциального требуется значительно больше наблюдений.
Get notified when new stories are published for "Hacker News 🇷🇺 Русский"