Книги
чёрным по белому
Главное меню
Главная О нас Добавить материал Поиск по сайту Карта книг Карта сайта
Книги
Археология Архитектура Бизнес Биология Ветеринария Военная промышленность География Геология Гороскоп Дизайн Журналы Инженерия Информационные ресурсы Искусство История Компьютерная литература Криптология Кулинария Культура Лингвистика Математика Медицина Менеджмент Металлургия Минералогия Музыка Научная литература Нумизматика Образование Охота Педагогика Политика Промышленные производства Психология Путеводители Религия Рыбалка Садоводство Саморазвитие Семиотика Социология Спорт Столярное дело Строительство Техника Туризм Фантастика Физика Футурология Химия Художественная литература Экология Экономика Электроника Энергетика Этика Юриспруденция
Новые книги
Цуканов Б.И. "Время в психике человека" (Медицина)

Суворов С. "Танк Т-64. Первенец танков 2-го поколения " (Военная промышленность)

Нестеров В.А. "Основы проэктирования ракет класса воздух- воздух и авиационных катапульных установок для них" (Военная промышленность)

Фогль Б. "101 вопрос, который задала бы ваша кошка своему ветеринару если бы умела говорить" (Ветеринария)

Яблоков Н.П. "Криминалистика" (Юриспруденция)
Реклама

Модели принятия решений в условиях неопределенности - Трухаев Р.И.

Трухаев Р.И. Модели принятия решений в условиях неопределенности — М.: Наука, 1981. — 258 c.
Скачать (прямая ссылка): modeliprinyatiyareshseniy1981.djvu
Предыдущая << 1 .. 75 76 77 78 79 80 < 81 > 82 83 84 85 86 87 .. 96 >> Следующая

раниченно.
Поставим задачу нахождения стратегии {ф}опт, при которой математическое ожидание потерь за весь процесс минимально. Введем вектор распределения вероятностей состояний процесса
P=(Po, pi........рт), где pi — вероятность состояния s(, р{^О,
т
2 Рк= 1. Обозначим через S3 (т+1)-й симплекс, тогда рей.
к^= О
Будем говорить, что вектор р на данном шаге задает процесс в том смысле, что в нем содержится вся информация о ходе процесса от начала вплоть до этого шага. Тогда процесс можно описать последовательностью преобразований вектора р при переходах с помощью матриц {Лф} р1+1=А*ч>1 рь (/=1, 2, ...), а при испытании источника информации — посредством операторов апостериорных распределений {Tv(p)} P;+i = Tv(pz), где
Tv(p)= (С <%, ql),
n.CfV
(fl = — (i=0, • • •» «*, V = 1, ..., S).
S pkSl
k—o
Здесь v — случайная величина с распределением
т
P(v) = ^pkgl (v= 1...............5).
k=Q
Обозначим через к вектор с компонентами {б*}*=о, где 8(= (1 г = k
— 1 п . , В частности, р = О отождествляем с попаданием в { и I =5= k
поглощающее состояние. Ясно, что Лф*0=0 для любого решения <реФ. Математическое ожидание потерь за один переход при принятии решения (реФ равно
т
fa (ф) Ри (ф) Pi = (U„, р),
г,/=о
где иф — вектор с компонентами
т
(U<p)o = °. (иФ)г = ^ Рг‘ (f = 1 ’ * • • ’ т)-
/=1
Математическое ожидание потерь при одном испытании источника (ф=ф) равно
т S
2 2 <^ = (с>р)>
k—o v=i
s
где с=(с0, с,........ст), ck= 3 cv/ghv. Для преобразований р
V=1
имеем
fp-v-Лфр при ф|=шеФ, р = |
lp->-Tv(p) при ф; = ф и показаний v источника,
т
Р (V) = 2 Ркёк-fo=o
Пусть .Р(р)— математическое ожидание потерь при оптимальной стратегии для бесконечношагового процесса, начавшегося из состояния с вектором р, рей. Тогда метод динамического программирования Беллмана [1] приводит к уравнению
р<п\ ¦ /min [(Ui” P) + FKP)]> /1ч
F (р) — min j vs® _ (1)
1{(е, p) + Al[F(Tv(p))]} при ф=ф,
S т
F(0) = О, ре Q, М [F (Tv(p))l = 2 F(Tv (Р)) S Pkgl
V=1 k= о
Первая строка в правой части (1) представляет собой математическое ожидание проигрыша при оптимальном продолжении через переход, вторая строка — при продолжении через испытание источника. Минимум достигается при некоторой стратегии
Ф0ПТ(Р)
-опт _ f Ф. если реОф.феФ,
ф ~ 1 ф, если р «= Й~,
где Йф, ci Q, ( (J Оф) U ^ф=
т ФеФ v
2. СВОЙСТВА И РЕШЕНИЯ ОЦЕНОЧНОГО ФУНКЦИОНАЛА
Рассмотрим в пространстве Rm+i единичный куб Q = {р: 0=^ /=0, т}, QczQ. Преобразования рф=Лф*р, p~v **
= Tv(p) переводят Q-^Q, Q-^Q соответственно (ф^Ф, v=l, ... ..., S), так что обе части уравнения (1) оказываются определены на Q. Докажем существование однородного решения, непрерывного при р->0 (p^Q). Для этого рассмотрим процесс последовательных приближений. Для каждого ф^Ф положим
К (Р) = (U„, Р) + F; (л; р), Fl (0) = 0. (2)
Решение уравнения (2) существует, единственно и равно F^°(p) = ((E—J[v)~lUv, р), где Ж„ определена в разделе 1; U,— вектор тХ 1, (U9)i= (Up)i, i= 1, ..., т; р= (ри рг, ..., рт). Определим рекуррентно приближения F{р) i=0, 1, ...
F° (р) = min (р),
ф?:Ф
[ min [(иф> p) + ^(Лфр)],
F1^ (p) = min ч>еф
l [(с, p) + M [Fl (Tv (p))], t' = 0, .oo,pe=Q.
(3)
Условие F<(0) = 0 автоматически выполнено, так как F,(0)=0 и Лф*0=0 для любого ф^Ф, 7\,(0)=0 для любого v=l, ..., 5. Непрерывность ^(р) t=0, 1, ... при peQ очевидна по индукции. Если peQ и фе<2, то F^(tp)=tF% р),
Fi+1 (t р) = min | <РеФ
1(с^р) + УИГ(Тг(^Р)],
5 т
M[^(Tv(^p))] = ^ ^(tv(p))S tp< = tM [F‘'(Tv(p))],
V=1 k—0
так как
f min [(Uq,, *p) + f* (Лф/р)],
(Tv (*P))t = ¦
tPiil
PiSi
m m
S tp^l 2 ркй
kj= о k=o
В силу предположения индукции Р(Лфф) =Р(Мфр) = = tFi(A4,p), поэтому из рекуррентного соотношения следует, что Fi+l(tp)=tF+l( р).
Итак, для каждого 1=0, 1, ... F*(р) является однородной функцией при peQ. Поскольку
Предыдущая << 1 .. 75 76 77 78 79 80 < 81 > 82 83 84 85 86 87 .. 96 >> Следующая