Cтраница 1
Итерационный алгоритм нахождения стратегий состоит из двух последовательно выполняемых процедур. [1]
Представим итерационный алгоритм нахождения стратегий для процесса с одним эргодическим классом в следующем виде. [2]
Теорема 3.6. Итерационный алгоритм нахождения стратегий эквивалентен алгоритму линейного программирования. [3]
Следовательно, итерационный алгоритм нахождения стратегий является лишь специальным случаем алгоритма линейного программирования, обладающего тем свойством, что его ведущие операции выполняются одновременно над многими ( не более чем N) переменными. В разделе 1.2 было уже показано, что эти подстановки для многих переменных приводят к улучшенной стратегии. Kt, удовлетворяющая (1.41), то придется решать систему из N линейных уравнений (1.35), что является недостатком метода. [4]
Ниже мы приведем итерационный алгоритм нахождения стратегий для марковских процессов принятия решений с переоценкой, который был впервые предложен Ховардом [63] и поэтому иногда называется итерационным алгоритмом Ховарда. [5]
Здесь будет приведен итерационный алгоритм нахождения стратегий для процесса с одним эргодическим классом. Методы данной главы являются частным случаем методов, представленных в гл. Предположение о наличии лишь одного эргодического класса позволяет упростить выкладки. [6]
Теорема 2.4 порождает следующий итерационный алгоритм нахождения стратегий. [7]
Ему же принадлежит и соответствующий итерационный алгоритм нахождения стратегий. [8]
Третий метод является обобщением ховардовских итерационных алгоритмов нахождения стратегий. [9]
Таким образом, приходим к следующему итерационному алгоритму нахождения стратегий. [10]
Следующая теорема очевидна, если рассмотреть итерационный алгоритм нахождения стратегий. [11]
Из теоремы 5.3 следует, что итерационный алгоритм нахождения стратегий сходится к a - оптимальной стратегии за конечное число шагов, поскольку число всех стационарных стратегий конечно. [12]
Теорема 5.2 играет важную роль в обосновании итерационного алгоритма нахождения стратегий. [13]
Ранее, в разделе 1.2, был приведен итерационный алгоритм нахождения стратегий. В разделе 1.3 рассматриваемая задача была сформулирована как задача линейного программирования. Здесь будет показано, что указанные два алгоритма эквивалентны. [14]
Таким образом, если выполнено условие леммы 3.2, то итерационный алгоритм нахождения стратегий оказывается более эффективным. [15]