Cтраница 2
Из сформулированной выше задачи линейного программирования и теоремы 5.8 немедленно вытекает итерационный алгоритм нахождения стратегии. [16]
В этом разделе приводятся два численных примера и их решения с помощью итерационного алгоритма нахождения стратегий и алгоритма линейного программирования. [17]
Ниже будет сформулирована задача линейного программирования применительно к марковским процессам принятия решений ( соотношение между итерационным алгоритмом нахождения стратегий и алгоритмом линейного программирования рассматривается в следующем разделе) и приведен алгоритм ее решения. [18]
Марковские процессы принятия решений с переоценкой впервые были рассмотрены Ховардом [63], им же был предложен итерационный алгоритм нахождения стратегий. [19]
Следовательно, показана эквивалентность между итерационным алгоритмом и алгоритмом линейного программирования. Именно, итерационный алгоритм нахождения стратегий является специальным алгоритмом линейного программирования, в котором ведущие операции выполняются одновременно над многими ( N) переменными. [20]
Таккера для прямой и двойственной задач. Используя результаты раздела 1.4 и теорему 5.2, немедленно получаем итерационный алгоритм нахождения стратегий для полумарковского процесса с переоценкой. Заметим, что двойственные переменные (5.81) являются одновременно симплекс-множителями для прямой задачи. [21]
Поскольку в силу теоремы 2.1 существует стационарная оптимальная стратегия, максимизирующая средний доход, достаточно ограничиться рассмотрением лишь стационарных стратегий. Для рассматриваемых моделей мы найдем 1-оптимальные стратегии ( определение см. ниже), совпадающие со стратегиями, которые максимизируют не только средний доход, но и слагаемое, характеризующее смещение. В разделе 3.2 приводится итерационный алгоритм для нахождения оптимальной стратегии и обсуждаются свойства 1-оптимальных стратегий, а в разделе 3.3 - итерационный алгоритм для нахождения 1-оптимальной стратегии. В разделе 3.4 для общего случая формулируется задача линейного программирования и показывается, что двойственная к ней задача соответствует итерационному алгоритму нахождения стратегий. [22]