х 1 (a 0 (x 0 ))... Px n-1 x n (a n-1 (x 0 , x 1 ,..., x n-1 ))

  Пусть:  

  где функция f (d, х ) ³ 0 и f (d, 0) = 0 (если точка {0} является поглощающим состоянием и f (d, x ) = I, d Î D, x = 1,..., N, то V a (x ) есть матем. ожидание времени попадания из точки х в точку 0). Функцию

 

  называется ценой, а стратегию а * – оптимальной, если  = V (x ) для всех х Î Е.

  При довольно общих предположениях о множестве D устанавливается, что цена V (x ) удовлетворяет следующему уравнению оптимальности (уравнению Беллмана):

  ,

  где

.

  В классе всех стратегий наибольший интерес представляют т. н. однородные марковские стратегии, характеризуемые одной функцией а (х ) такой, что a n (x 0 ,..., x n ) = a (x n ) при всех n = 0, 1,...

  Следовательно, критерий оптимальности (или достаточное условие оптимальности) может быть использован для проверки того, что данная однородная марковская стратегия является оптимальной: пусть существуют функции a * = а* (х ) и V* = V* (x ) такие, что для любого d Î D

  0 = f (x, a* (x )) + L a *V* £ f (x, d ) + L d V* (x

Добавить отзыв
ВСЕ ОТЗЫВЫ О КНИГЕ В ИЗБРАННОЕ

0

Вы можете отметить интересные вам фрагменты текста, которые будут доступны по уникальной ссылке в адресной строке браузера.

Отметить Добавить цитату