,sr„. -0,5 | 0,0 | 43 |
ь | 0,5 | 69 |
0,5 | 1,0 | 38 |
1,0 | 1,5 | 7 |
1,5 | 2,0 | 2 |
2,0 | 2,5 | 0 |
2,5 | 3,0 | 2 |
Отметьте, что на хвостах распределения находятся пробелы, т.е. области, или ячейки, где нет эмпирических данных. Эти области сглаживаются, когда мы приспосабливаем наше регулируемое распределение к данным, и именно эти сглаженные области вызывают различие между параметрическим и эмпирическим оптимальным f. Почему же наше характеристическое распределение при всех возможностях регулировки его формы не очень хорошо приближено к фактическому распределению? Причина состоит в том, что наблюдаемое распределение имеет слишком много
так как направление вогнутости никогда не изменяется. Объект, имеющий форму буквы S, лежащий на боку, имеет одну точку перегиба, т.е. точку, где вогнутость изменяется. Рисунок 4-11 показывает нормальное распределение. Отметьте, что в колоколообразной кривой, такой как нормальное распределение, есть две точки перегиба. В зависимости от значения SCALE наше регулируемое распре деление может иметь ноль точек перегиба (если SCALE очень низкое) или две точки перегиба. Причина, по которой наше регулируемое распределение не очень хорошо описывает фактическое распределение сделок, состоит в том, что реальное распределение имеет слишком много точек перегиба. Означает ли это, что полученное характеристическое распределение неверно? Скорее всего нет. При желании мы могли бы создать функцию распределения, которая имела бы больше двух точек перегиба. Такую функцию можно было бы лучше подогнать к реальному распределению. Если бы мы создали функцию распределения, которая допускает неограниченное количество точек перегиба, то мы бы точно подогнали ее к наблюдаемому распределению. Оптимальное f, полученное с помощью такой кривой, практически совпало бы с эмпирическим. Однако чем больше точек перегиба нам пришлось бы добавить к функции распределения, тем менее надежной она была бы (т.е. она хуже представляла бы будущие сделки). Мы не пытаемся в точности подогнать параметрическое ik наблюдаемому, а стараемся лишь определить, как распределяются наблюдаемые данные, чтобы можно было предсказать с большой уверенностью будущее оптимальное 1(если данные будут распределены так же, как в прошлом). В регулируемом распределении, подогнанном к реальным сделкам, удалены
Поясним вышесказанное на примере. Предположим, мы используем доску Галтона. Мы знаем, что асимптотически распределение шариков, падающих через доску, будет нормальным. Однако мы собираемся бросить только 4 шарика. Можем ли мы ожидать, что результаты бросков 4 шариков будут рас пределены нормально? Как насчет 5 шариков? 50 шариков? В асимптотическом смысле мы ожидаем, что наблюдаемое распределение будет ближе к нормальному при увеличении числа сделок. Подгонка теорети ческого распределения к каждой точке перегиба наблюдаемого распределения не даст нам большую степень точности в будущем. При большом количестве сделок мы можем ожидать, что наблюдаемое распределение будет сходиться с ожидаемым и многие точки перегиба будут заполнены сделками, когда их число стремится к бесконечности. Если наши теоретические параметры точно отражают распределение реальных сделок, то оптимальное f, полученное на основе теоретического распределения, при будущей последовательности сделок будет точнее, чем оптимальное f, рассчитанное эмпирически из прошлых сделок. Другими словами, если наши 232 сделки представляют распределение сделок в будущем, тогда мы можем ожидать, что распределение сделок в будущем будет ближе к нашему «настроенному» теоретическому распределению, чем к наблюдаемому, с его многочисленными точками перегиба и «зашумленностью» из-за конечного количества сделок. Таким образом, мы можем ожидать, что будущее оптимальное f будет больше похоже на оптимальное f, полученное из теоретического распределения, чем на оптимальное f, полученное эмпирически из наблюдаемого распределения.
Итак, лучше всего в этом случае использовать не эмпирическое, а параметрическое оптимальное f. Ситуация аналогична рассмотренному случаю с 20 бросками монеты в предыдущей главе. Если мы ожидаем 60% выигрышей в игре 1:1, то оптимальное f= 0,2. Однако если бы у нас были только эмпирические данные о последних 20 бросках, 11 из которых были выигрышными, наше оптимальное f составило бы 0,1. Мы исходим из того, что параметрическое оптимальное f ($5062,71 в этом случае) верно, так как оно оптимально для функции, которая «генерирует» сделки. Как и в случае только что упомянутой игры с броском монеты, мы допускаем, что оптимальное f для следующей сделки определяется параметрической генерирующей функцией, даже если параметрическое f отличается от эмпирического оптимального f.
Очевидно, что ограничительные параметры оказывают большое влияние на оптимальное f. Каким образом выбирать эти ограничительные параметры? Посмотрим, что происходит, когда мы отодвигаем верхнюю границу. Следующая таблица составлена для нижнего предела 3 сигма с использованием 100 равноотстоящих точек данных и оптимальных параметров для 232 сделок: