,sr„. -0,5 0,0 43
ь -' 0,0 0,5 69
0,5 1,0 38
1,0 1,5 7
1,5 2,0 2
2,0 2,5 0
2,5 3,0 2

Отметьте, что на хвостах распределения находятся пробелы, т.е. области, или ячейки, где нет эмпирических данных. Эти области сглаживаются, когда мы приспосабливаем наше регулируемое распределение к данным, и именно эти сглаженные области вызывают различие между параметрическим и эмпири­ческим оптимальным f. Почему же наше характеристическое распределение при всех возможностях регулировки его формы не очень хорошо приближено к фактическому распределению? Причина состоит в том, что наблюдаемое распределение имеет слишком много точек перегиба. Параболу можно направить ветвями вверх или вниз. Однако вдоль всей параболы направление вогнутости или выпуклости не изменяется. В точке перегиба направление вогнутости изменяется. Парабола имеет 0 точек перегиба,

Рисунок 4-10 Регулируемое распределение для 232 сделок

Рисунок 4-11 Точки перегиба колоколообразного распределения

так как направление вогнутости никогда не изменяется. Объект, имеющий форму буквы S, лежащий на боку, имеет одну точку перегиба, т.е. точку, где вогну­тость изменяется. Рисунок 4-11 показывает нормальное распределение. Отметьте, что в колоколообразной кривой, такой как нормальное распределение, есть две точ­ки перегиба. В зависимости от значения SCALE наше регулируемое распре­ деление может иметь ноль точек перегиба (если SCALE очень низкое) или две точки перегиба. Причина, по которой наше регулируемое распределение не очень хорошо описывает фактическое распределение сделок, состоит в том, что реальное распределение имеет слишком много точек перегиба. Означает ли это, что полученное характеристическое распределение не­верно? Скорее всего нет. При желании мы могли бы создать функцию рас­пределения, которая имела бы больше двух точек перегиба. Такую функцию можно было бы лучше подогнать к реальному распределению. Если бы мы создали функцию распределения, которая допускает неограниченное коли­чество точек перегиба, то мы бы точно подогнали ее к наблюдаемому распре­делению. Оптимальное f, полученное с помощью такой кривой, практически совпало бы с эмпирическим. Однако чем больше точек перегиба нам при­шлось бы добавить к функции распределения, тем менее надежной она была бы (т.е. она хуже представляла бы будущие сделки). Мы не пытаемся в точности подогнать параметрическое ik наблюдаемому, а ста­раемся лишь определить, как распределяются наблюдаемые данные, чтобы можно было предсказать с большой уверенностью будущее оптимальное 1(если данные бу­дут распределены так же, как в прошлом). В регулируемом распределении, подо­гнанном к реальным сделкам, удалены ложные точки перегиба.

Поясним вышесказанное на примере. Предположим, мы используем дос­ку Галтона. Мы знаем, что асимптотически распределение шариков, падаю­щих через доску, будет нормальным. Однако мы собираемся бросить только 4 шарика. Можем ли мы ожидать, что результаты бросков 4 шариков будут рас­ пределены нормально? Как насчет 5 шариков? 50 шариков? В асимптотическом смысле мы ожидаем, что наблюдаемое распределение будет ближе к нормальному при увеличении числа сделок. Подгонка теорети­ ческого распределения к каждой точке перегиба наблюдаемого распределения не даст нам большую степень точности в будущем. При большом количестве сде­лок мы можем ожидать, что наблюдаемое распределение будет сходиться с ожидае­мым и многие точки перегиба будут заполнены сделками, когда их число стремится к бесконечности. Если наши теоретические параметры точно отражают распределение реальных сделок, то оптимальное f, полученное на основе теоретического распреде­ления, при будущей последовательности сделок будет точнее, чем оптимальное f, рассчитанное эмпирически из прошлых сделок. Другими словами, если наши 232 сделки представляют распределение сделок в будущем, тогда мы можем ожидать, что распределение сделок в будущем будет ближе к нашему «настроенному» теоретическому распределению, чем к наблюдаемому, с его многочисленными точками перегиба и «зашумленностью» из-за конечного количества сделок. Таким образом, мы можем ожидать, что буду­щее оптимальное f будет больше похоже на оптимальное f, полученное из теоре­тического распределения, чем на оптимальное f, полученное эмпирически из на­блюдаемого распределения.

Итак, лучше всего в этом случае использовать не эмпирическое, а пара­метрическое оптимальное f. Ситуация аналогична рассмотренному случаю с 20 бросками монеты в предыдущей главе. Если мы ожидаем 60% выигрышей в игре 1:1, то оптимальное f= 0,2. Однако если бы у нас были только эмпири­ческие данные о последних 20 бросках, 11 из которых были выигрышными, наше оптимальное f составило бы 0,1. Мы исходим из того, что параметрическое оптимальное f ($5062,71 в этом случае) верно, так как оно оптимально для функ­ции, которая «генерирует» сделки. Как и в случае только что упомянутой игры с броском монеты, мы допускаем, что оптимальное f для следующей сделки опре­деляется параметрической генерирующей функцией, даже если параметрическое f отличается от эмпирического оптимального f.

Очевидно, что ограничительные параметры оказывают большое влияние на оптимальное f. Каким образом выбирать эти ограничительные парамет­ры? Посмотрим, что происходит, когда мы отодвигаем верхнюю границу. Следующая таблица составлена для нижнего предела 3 сигма с использова­нием 100 равноотстоящих точек данных и оптимальных параметров для 232 сделок:

Добавить отзыв
ВСЕ ОТЗЫВЫ О КНИГЕ В ИЗБРАННОЕ

0

Вы можете отметить интересные вам фрагменты текста, которые будут доступны по уникальной ссылке в адресной строке браузера.

Отметить Добавить цитату