достаточным с большой вероятностью). Однако если совокупность распределена экспоненциально (рисунок 3-6), тогда может потребоваться и N = 100.
Центральная предельная теорема, этот поразительно простой и красивый факт, подтверждает важность нормального распределения.
Работа с нормальным распределением
При использовании нормального распределения часто требуется найти долю площади под кривой распределения в данной точке на кривой. На математическом языке это называется интегралом функции, задающей кривую. Таким же образом функция, которая задает кривую, является производной площади под кривой. Если у нас есть функция N(X), которая представляет процент площади под кривой в точке X, мы можем говорить, что производная этой функции N'(X) является функцией самой кривой в точке X.
Мы начнем с формулы самой кривой N' (X). Данная функция выглядит следующим образом:
где U
S =стандартное отклонение данных;
Х = наблюдаемая точка данных;
ЕХР ()
Эта формула даст нам значение для оси Y, или высоту кривой, при любом данном значении X.
Часто мы будем говорить о точке на кривой, ссылаясь на ее координату X, и будем смотреть, на сколько стандартных отклонений она удалена от среднего. Таким образом, точка данных, которая удалена на одно стандартное отклонение от среднего, считается смещенной на одну
Более того, часто имеет смысл из всех точек данных вычесть среднее. При этом центр распределения сместится в начало координат. В этом случае точка данных, которая смещена на одно стандартное отклонение вправо от среднего, имеет значение 1 на оси X.
Если мы вычтем среднее из точек данных, а затем разделим полученные значения на стандартное отклонение точек данных, то преобразуем распределение в
U = среднее значение данных;
S = стандартное отклонение данных;
Х = наблюдаемая точка данных;
ЕХР() = экспоненциальная функция.
Уравнение (3.16) дает нам число
Рисунок 3-7 показывает нормальную кривую, заданную предедущим уравнением. Отметьте, что высота стандартной нормальной кривой составляет 0,39894, поскольку из уравнения (3.15а) мы получаем:
Отметьте, что кривая
Затем надо разделить полученный результат на стандартное отклонение:
-20/20=-1
Теперь мы можем сказать, что, когда точка данных равна -9, среднее равно 11, а стандартное отклонение составляет 20, число стандартных единиц равно -1. Другими словами, мы находимся на одно стандартное отклонение от пика кривой, и, так как это значение отрицательно, оно находится слева от пика. Чтобы увидеть, где это будет на самой кривой (то есть насколько высока кривая при одном стандартном отклонении слева от центра, или чему равно значение кривой на оси Y для значения -1 на оси X), надо подставить полученное значение в уравнение (3.15а):
Таким образом, высота кривой при Х=-1 составляет 0,2419705705. Функция N'(Z) также часто выражается как:
и ATN()
U = среднее значение данных;
S = стандартное отклонение данных;
Х = наблюдаемая точка данных;
ЕХР()
Не искушенные в статистике люди часто находят концепцию стандартного отклонения (или квадрата ее величины,
где М
S
Можно сказать, что при нормальном распределении среднее абсолютное отклонение равно стандартному отклонению, умноженному на 0,7979.
(3.18) S = М * 1 / 0,7978845609
=М* 1,253314137, где S = стандартное отклонение;
М = среднее абсолютное отклонение.
Мы можем также сказать, что при нормальном распределении стандартное отклонение равно среднему абсолютному отклонению, умноженному на 1,2533. Так как дисперсия всегда является стандартным отклонением в квадрате (а стандартное отклонение является квадратным корнем дисперсии), мы можем задать преобразование между дисперсией и средним абсолютным отклонением.
(3.19) М = V ^ (1/2) * ((2 / 3,1415926536)^ (1/2))
= V ^ (1/2)* 0,7978845609,
где М = среднее абсолютное отклонение;
V = дисперсия.
(3.20) V = (М * 1,253314137)^ 2,
где V =дисперсия;
М = среднее абсолютное отклонение.
Так как стандартное отклонение в стандартной нормальной кривой равно 1, мы можем сказать, что среднее абсолютное отклонение в стандартной нормальной кривой равно 0,7979. Более того, в