Теория принятия решений
Покупка
Основная коллекция
Издательство:
СибАДИ
Год издания: 2022
Кол-во страниц: 85
Дополнительно
Вид издания:
Учебно-методическая литература
Уровень образования:
ВО - Бакалавриат
Артикул: 817454.01.99
Предназначено для обучающихся 1-4 курсов всех форм обучения, изучающих дисциплины «Теория принятия решений», «Современные методы оптимизации», «Математическое моделирование и теория принятия решений», «Компьютерные технологии в науке и производстве». Содержит теоретический материал и задания для самостоятельной работы и проведения лабораторных работ студентов. Может быть использовано преподавателями в качестве дидактического материала. Имеет интерактивное оглавление в виде закладок. Подготовлено на кафедре «Автоматизированные системы и цифровые технологии».
Тематика:
ББК:
УДК:
ОКСО:
- ВО - Бакалавриат
- 01.03.02: Прикладная математика и информатика
- 02.03.02: Фундаментальная информатика и информационные технологии
ГРНТИ:
Скопировать запись
Фрагмент текстового слоя документа размещен для индексирующих роботов
УДК 004.9 ББК 73.6 З97 Согласно 436-ФЗ от 29.12.2010 «О защите детей от информации, причиняющей вред их здоровью и развитию» данная продукция маркировке не подлежит. Рецензент канд. физ.-мат. наук, доц. Л.Н. Романова (СибАДИ) Работа утверждена редакционно-издательским советом СибАДИ в качестве учебно-методического пособия. З97 Зырянова, Светлана Анатольевна. Теория принятия решений : учебно-методическое пособие [Электронный ресурс] / С.А. Зырянова, Т.А. Юрина. – Электрон. дан. – Омск : СибАДИ, 2022. – Режим доступа: http://bek.sibadi.org/MegaPro, для авторизованных пользователей. – Загл. с экрана. Предназначено для обучающихся 1–4 курсов всех форм обучения, изучающих дисциплины «Теория принятия решений», «Современные методы оптимизации», «Математическое моделирование и теория принятия решений», «Компьютерные технологии в науке и производстве». Содержит теоретический материал и задания для самостоятельной работы и проведения лабораторных работ студентов. Может быть использовано преподавателями в качестве дидактического материала. Имеет интерактивное оглавление в виде закладок. Подготовлено на кафедре «Автоматизированные системы и цифровые технологии». Текстовое (символьное) издание (3,2 Мб). Системные требования: Intel, 3,4 GHz; 150 Мб; Windows XP/Vista/7; 1 Гб свободного места на жестком диске; программа для чтения pdf-файлов: Adobe Acrobat Reader; Foxit Reader Редактор Н.И.Косенкова Техническая подготовка Л.Р. Усачева Издание первое. Дата подписания к использованию 23.05.2022 Издательско-полиграфический комплекс СибАДИ. 644080, г. Омск, пр. Мира, 5 РИО ИПК СибАДИ, 644080, г. Омск, ул. 2-я Поселковая, 1 ФГБОУ ВО «СибАДИ», 2022
~ 3 ~ Введение При проектировании сложных технических систем, создании сложных промышленных комплексов и управлении ими, планировании развития городов, выборе программ развития экономики и энергетики регионов, организации новых экономических зон, анализе экологических ситуаций, а также в других сферах деятельности человека возникают задачи принятия наилучших решений. Принятие решений в профессиональном отношении представляет собой особый вид человеческой деятельности, который состоит в обоснованном выборе наилучшего в некотором смысле варианта или нескольких предпочтительных вариантов из имеющихся возможных. Математическая теория принятия решений в сложных ситуациях, которую часто называют теорией принятия решений (ТПР), занимается разработкой общих методов анализа ситуаций принятия решений. Общая схема процесса принятия решений включает следующие основные этапы: Этап 1. Предварительный анализ проблемы. На этом этапе определяются: главные цели; уровни рассмотрения, элементы и структура системы (процесса), типы связей; подсистемы, используемые ими основные ресурсы и критерии качества функционирования подсистем; основные противоречия, узкие места и ограничения. Этап 2. Постановка задачи. Постановка конкретной задачи принятия решений (ЗПР) включает: формулирование задачи; определение типа задачи; определение множества альтернативных вариантов и основных критериев для выбора из них наилучших; выбор метода решения ЗПР. Этап 3. Получение исходных данных. На данном этапе устанавливаются способы измерения альтернатив. Это либо сбор количественных (статистических) данных, либо методы математического или имитационного моделирования, либо методы экспертной оценки. Этап 4. Решение ЗПР с привлечением математических методов и вычислительной техники, экспертов и лица, принимающего решение. Этап 5. Анализ и интерпретация полученных результатов.
~ 4 ~ 1. ТЕОРИЯ ИГР 1.1. Предмет и задачи теории игр В процессе целенаправленной человеческой деятельности возникают ситуации, в которых интересы отдельных лиц (участников) либо прямо противоположны (антагонистичны), либо, не будучи непримиримыми, все же не совпадают. Примерами таких ситуаций являются спортивные игры, арбитражные споры, борьба между блоками избирателей за своих кандидатов и т. п. Здесь каждый из участников сознательно стремится добиться наилучшего результата за счет другого участника. Подобного рода ситуации встречаются и в различных сферах производственной деятельности. Так как цели противоположны, а результат мероприятия каждой из сторон зависит от действий конкурента, то эти действия называют конфликтными ситуациями. При этом ни одна из сторон не может полностью контролировать положение, так как и той и другой стороне решения приходится принимать в условиях неопределенности. Так, при определении объема выпуска продукции на одном предприятии нельзя не учитывать размеров выпуска аналогичной продукции на других предприятиях. В реальных условиях нередко возникают ситуации, в которых антагонизм отсутствует, но существуют противоположные тенденции. Например, для нормального функционирования производства, с одной стороны, необходимо наличие запасов разнообразных ресурсов, но с другой, – стремление к чрезвычайному увеличению этих запасов вызывает дополнительные затраты по их содержанию и хранению. Формализованная (схематизированная) модель конфликтной ситуации называется игрой. Раздел математики, изучающий конфликтные ситуации на основе их математических моделей, называется теорией игр. Цель теории игр – выработка рекомендаций для различного поведения игроков в конфликтной ситуации, то есть выбор оптимальной стратегии для каждого из них. Методы и рекомендации теории игр разрабатываются применительно к таким специфическим конфликтным ситуациям, которые обладают свойством многократной повторяемости. Если конфликтная ситуация реализуется однократно или ограниченное число раз, то рекомендации теории игр теряют смысл.
~ 5 ~ Результат игры – победа или поражение, которые не всегда имеют количественное выражение. Исход игры – это значение некоторой функции, называемой функцией выигрыша (платежной функцией), которая может задаваться либо аналитическим выражением, либо таблично (платежной матрицей). Величина выигрыша зависит от стратегии, применяемой игроком. Стратегия – это совокупность правил, однозначно определяющих последовательность действий игрока в каждой конкретной ситуации, складывающейся в процессе игры. Всякая игра состоит из отдельных партий. Партией называют каждый вариант реализации игры определенным образом. В партии игроки совершают конкретные ходы. Ход – это выбор и реализация игроком одного из допустимых вариантов поведения. Ходы бывают личные (сознательные) и случайные. При личном ходе игрок самостоятельно и осознанно выбирает и реализует ту или иную чистую стратегию. Например, в шахматах каждый ход является личным. Случайный ход – результат, получаемый не решением игрока, а каким-либо механизмом случайного выбора. Например, покупательский спрос, задержка с поставкой материалов и т. п. Классификация игр: по количеству игроков; по количеству стратегий (конечные или бесконечные); в зависимости от взаимоотношений участников (бескоалиционные или некооперативные – участники не имеют права заключать соглашения, и коалиционные или кооперативные); по характеру выигрышей (игры с нулевой суммой – если один из игроков выигрывает ровно столько, сколько проигрывает другой и с ненулевой суммой); по виду функции выигрыша (матричные – при двух участниках – выигрыши первого игрока задаются матрицей, биматричные – выигрыши каждого игрока задаются своей матрицей, непрерывные, выпуклые и др. – различаются видом аналитического выражения платежной функции); по количеству ходов игры (одноходовые – выигрыш распределяется после одного хода каждого игрока и многоходовые – выигрыш распределяется после нескольких ходов); в зависимости от объема имеющейся информации (игры с полной и неполной информацией).
~ 6 ~ Игры, в которых участники стремятся добиться для себя наилучшего результата, сознательно выбирая допустимые правилами игры способы действий, называют иногда стратегическими. Однако нередко приходится моделировать ситуации, в которых один из участников безразличен к результату игры. Такие игры называют играми с природой, понимая под термином «природа» всю совокупность внешних обстоятельств, в которых сознательному игроку (его называют иногда «лицом, принимающим решение», или «статистиком», а соответствующую игру – статистической) приходится принимать решение. 1.2. Решение матричных игр в чистых стратегиях Для решения все возможные варианты (исходы) игры сводятся в прямоугольную таблицу – платежную матрицу, в которой строки соответствуют различным стратегиям игрока А, столбцы – стратегиям игрока В, qij называется ценой игры (табл. 1.1). Таблица 1.1 – В1 В2 … Вn А1 q11 q12 … q1n А2 q21 q22 … q2n … … … … … Аm qm1 qm2 … qmn I способ Для нахождения оптимальной стратегии необходимо проанализировать все возможные стратегии и рассчитывать на то, что разумный противник на каждую из них будет отвечать такой, при которой выигрыш игрока А минимален. Обычно минимальные числа в каждой строке обозначаются αi и выписываются в виде добавочного столбца матрицы (табл. 1.2). Таблица 1.2 – В1 В2 … Вn αi А1 q11 q12 … q1n α1 А2 q21 q22 … q2n α2 … … … … … … Аm qm1 qm2 … qmn αi βj β1 β2 … βj –
~ 7 ~ В каждой строке будет свое } { min ij j i q . Предпочтительной для игрока А является стратегия, при которой αi обращается в максимум, то есть } { max i i или } { min max ij j i q , где α – максиминный выигрыш (максимин), а соответствующая ей стратегия – максиминная. Если придерживаться максиминной стратегии, то при любом поведении стороны В (конкурента) гарантирован выигрыш, во всяком случае не меньше α. Поэтому α называют также нижней ценой игры – тот гарантированный минимум, который можно обеспечить при наиболее осторожной (перестраховочной) стратегии. Аналогичные распределения можно провести и для конкурента В, который должен рассмотреть все свои стратегии, выделяя для каждой из них максимальные значения проигрыша: } { max ij i j q (последняя строка матрицы). Из всех значений βj находят минимальное: } { max min ij i j q , которое дает минимаксный проигрыш, или минимакс. Такая β-стратегия – минимаксная, придерживаясь которой сторона В имеет гарантию, что в любом случае проиграет не больше β. Поэтому β называют верхней ценой игры. Если α = β = С, то число С называют чистой ценой игры, или седловой точкой. Для игры с седловой точкой нахождение решения состоит в выборе пары максиминной и минимаксной стратегий, которые являются оптимальными, так как любое отклонение от этих стратегий приводит к уменьшению выигрыша первого игрока и увеличению проигрыша второго игрока по сравнению с ценой игры С. Пример Конструктор получил задание разработать определенное новое изделие. В результате исследований он определил три возможных варианта изделия И1, И2, И3, каждый из которых может быть реализован каким-либо из трех техпроцессов Т1, Т2, Т3.
~ 8 ~ Если первый вариант конструкции И1 реализуется по первой технологии Т1, то внешний вид изделия оказывается наилучшим и оценивается экспертами в 9 баллов, а при реализации по второй технологии – в 6 баллов, по третьей – в 5 баллов и т. д., платежная матрица игры имеет вид . 8 5 7 7 7 8 5 6 9 А Решение Оформим данные задачи в виде таблицы (табл. 1.3). Таблица 1.3 Конструкция Технология } { min ij j i q Т1 Т2 Т3 И1 И2 И3 9 8 7 6 7 5 5 7 8 5(Т3) 7 (Т2 или Т3) 5(Т2) } { max ij i j q 9 7 8 – Конфликтная ситуация возникает из-за того, что затраты на реализацию каждого конструкторско-технологического решения (варианта) не одинаковы. Для простоты полагаем, что затраты пропорциональны внешнему виду (чем выше балл, тем больше затраты). Конструктор должен представить только один вариант – самый красивый. Но он понимает, что тогда найдутся сторонники самого дешевого варианта («экономисты»). Поэтому его задача выбрать оптимальный вариант по внешнему виду и стоимости. Если конструктор выберет И1, то экономисты будут настаивать на технологии Т3. На вариант И2 будет ответ Т2 или Т3 и т. д. Очевидно, что с точки зрения конструктора преимущество имеет вариант И2, но даже при неблагоприятных обстоятельствах получится изделие, оцениваемое в 7 баллов (выигрыш 7), а может быть даже 8, если удается уговорить экономистов на вариант Т1. С точки зрения экономистов в смысле снижения затрат: при выборе технологии Т1 в варианте И1 затраты наибольшие – 9 баллов, при Т2 в И2 (7), при Т3 в И3 (8). То есть для экономистов оптимальным является техпроцесс Т2, так как он требует меньших затрат при различных вариантах конст
~ 9 ~ рукции. Следовательно, стратегия Т2И2 с выигрышем 7 – наиболее выгодная сразу для обеих сторон – максимальный выигрыш И совпадает с минимальным проигрышем Т. Важно помнить, что в матричной игре может быть несколько седловых точек. И еще: седловой элемент qij является наименьшим в i-й строке и наибольшим в j-м столбце, поэтому если игрок В отклонится от своей минимаксной стратегии, его проигрыш может только увеличиться. Аналогично отклонение игрока А от своей максиминной стратегии ведет к уменьшению его выигрыша. Таким образом, наиболее предпочтительные стратегии в игре с седловой точкой обладают свойством устойчивости, создают ситуацию равновесия. Отсюда следует, что если в матрице игры существует седловой элемент, то наилучшими для игроков являются наиболее предпочтительные чистые стратегии. II способ (принцип доминирования) Если в платежной матрице А все элементы строки Аi не меньше соответствующих элементов строки Аk, а по крайней мере один строго больше, то строка Аi называется доминирующей, а строка Аk – доминируемой (аналогично для столбцов). Таким образом, можно уменьшить размеры платежной матрицы путем удаления из нее доминирующих столбцов и доминируемых строк. Пример Найти цену игры, заданной платежной матрицей . 8 5 7 7 7 8 5 6 9 А Решение В матрице А первый столбец доминирует над вторым, поэтому его можно изъять из платежной матрицы. В результате получится матрица . 8 5 7 7 5 6 1 А
~ 10 ~ В матрице А1 вторая строка доминирует над первой, следовательно, первую строку можно изъять. В результате платежная матрица принимает вид . 8 5 7 7 2 А В матрице А2 второй столбец доминирует над первым и его можно изъять. В результате получим матрицу . 5 7 3 А В матрице А3 первая строка доминирует над второй, значит вторую строку можно изъять. В результате получим матрицу А4 из одного элемента. А4=(7). Этот элемент и определяет решение задачи. 1.3. Решение матричных игр в смешанных стратегиях Однако не все матрицы имеют седловую точку. Тогда решение находят, применяя смешанные стратегии, то есть, чередуя случайным образом несколько чистых стратегий (гибкая тактика). Согласно основному неравенству теории игр нижняя цена игры никогда не может быть больше верхней цены игры, т.е. . Следовательно, если нижняя цена игры – это то, что игрок А согласен получить в результате игры, а верхняя цена игры – это то, что игрок В согласен отдать игроку А в процессе игры, тогда в случае отсутствия седловой точки возникает желание у обоих игроков рискнуть, чтобы получить больший выигрыш в игре. То есть игрокам надо так выбирать свои чистые стратегии в очередной партии, чтобы партнер не догадался о них. Этого можно добиться только тогда, когда сам не знаешь, какую стратегию будешь использовать при очередном ходе. Анализ игры без седловой точки показывает, что игрок А выигрывает больше максимина α, получаемого им при максиминной стратегии, если в ходе игры будет пользоваться не одной, а несколькими чистыми стратегиями, т.е. будет смешивать чистые стратегии. Аналогично игрок В проигрывает меньше минимакса β, выплачиваемого им игроку А, при минимаксной стратегии, если он будет использовать свою смешанную стратегию.