Основы теории надежности систем
Покупка
Издательство:
Издательский Дом НИТУ «МИСиС»
Автор:
Смирнов Александр Петрович
Год издания: 2018
Кол-во страниц: 118
Дополнительно
Вид издания:
Учебное пособие
Уровень образования:
ВО - Магистратура
ISBN: 978-5-87623-782-8
Артикул: 752961.01.99
Рассмотрены основы теории надежности сложных систем и практические методы расчета показателей надежности в применении к информационным системам. Особое внимание уделено моделированию систем для оценки надежности. Показаны особенности применения аналитических моделей надежности и область применения статистических (имитационных) моделей. Дано подробное описание статистического эксперимента по определению показателей надежности, а также способы вычисления оценок точности и достоверности полученных результатов. Предназначено для бакалавров по направлению подготовки 09.03.02 «Информационные системы и технологии» и магистрантов по направлениям подготовки 09.04.01 «Информатика и вычислительная техника» и 09.04.03 «Прикладная информатика».
Тематика:
ББК:
УДК:
ОКСО:
- ВО - Бакалавриат
- 09.03.02: Информационные системы и технологии
- ВО - Магистратура
- 09.04.01: Информатика и вычислительная техника
- 09.04.03: Прикладная информатика
ГРНТИ:
Скопировать запись
Фрагмент текстового слоя документа размещен для индексирующих роботов
МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РФ ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ АВТОНОМНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ОБРАЗОВАНИЯ «НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ ТЕХНОЛОГИЧЕСКИЙ УНИВЕРСИТЕТ «МИСиС» ИНСТИТУТ ИНФОРМАЦИОННЫХ ТЕХНОЛОГИЙ И АВТОМАТИЗИРОВАННЫХ СИСТЕМ № 2333 Кафедра автоматизированных систем управления А.П. Смирнов ОСНОВЫ ТЕОРИИ НАДЕЖНОСТИ СИСТЕМ Курс лекций Рекомендовано редакционно-издательским советом университета Москва 2018
УДК 004 С50 Р е ц е н з е н т канд. техн. наук, проф. Е.П. Потоцкий Смирнов А.П. С50 Основы теории надежности систем : курс лекций / А.П. Смирнов. – М. : Изд. Дом НИТУ «МИСиС», 2018. – 118 с. ISBN 978-5-87623-782-8 Рассмотрены основы теории надежности сложных систем и практические методы расчета показателей надежности в применении к информационным системам. Особое внимание уделено моделированию систем для оценки надежности. Показаны особенности применения аналитических моделей надежности и область применения статистических (имитационных) моделей. Дано подробное описание статистического эксперимента по определению показателей надежности, а также способы вычисления оценок точности и достоверности полученных результатов. Предназначено для бакалавров по направлению подготовки 09.03.02 «Информационные системы и технологии» и магистрантов по направлениям подготовки 09.04.01 «Информатика и вычислительная техника» и 09.04.03 «Прикладная информатика». УДК 004 А.П. Смирнов, 2018 ISBN 978-5-87623-782-8 НИТУ «МИСиС», 2018
ОГЛАВЛЕНИЕ 1. Основные понятия теории надежности систем ................................. 6 1.1. Два типа случайных воздействий................................................. 6 1.2. Основные определения теории надежности систем ................... 9 1.2.1. Надежность систем ................................................................. 9 1.2.2. Формулировка цели системы .............................................. 10 1.3. Показатели надежности элементов системы ............................ 12 1.3.1. Теоретическое определение показателей надежности элементов ......................................................................................... 12 1.3.2. Статистическая оценка показателей надежности элементов ......................................................................................... 15 1.4. Показатели надежности системы ............................................... 16 1.4.1. Понятие обслуживаемой системы ....................................... 16 1.4.2. Функциональная надежность и надежность достижения цели ............................................................................. 17 2. Статистические закономерности процессов отказа элементов системы .................................................................................................... 22 2.1. Процесс отказа базового элемента ............................................. 22 2.2. Процесс отказа функционального элемента ............................. 23 2.3. Обоснование наиболее вероятного закона распределения интервала безотказной работы функционального элемента .......... 23 2.4. Исследование поведения функции t для различных законов распределения ....................................................................... 25 2.5. Обсуждение адекватности различных законов распределения реальному функционированию элементов............. 30 3. Аналитические модели функциональной надежности системы .... 33 3.1. Понятие аналитических моделей надежности .......................... 33 3.2. Теоретико-множественные основания вычисления показателей надежности .................................................................... 34 3.2.1. Аксиомы теории вероятностей ............................................ 34 3.2.2. Обоснование аксиом теории вероятностей ........................ 35 3.2.3. Табличная форма представления сложного события ........ 37 3.2.4. Аналитическое обоснование формул вычисления вероятности безотказной работы для простых моделей надежности ...................................................................................... 39 3.3. Статические модели функциональной надежности ................. 43 3.3.1. Понятие статической модели .............................................. 43
3.3.2. Модель системы без резервирования элементов ............... 44 3.3.3. Модель системы с параллельным включением резервных элементов ...................................................................... 45 3.3.4. Модель системы с последовательным замещением элементов ......................................................................................... 46 3.3.5. «Структура m из M» ............................................................. 47 3.4. Динамические модели надежности системы ............................ 49 3.4.1. Понятие динамической модели. Переход состояний ........ 49 3.4.2. Динамическая модель надежности простейшей обслуживаемой системы ................................................................ 52 3.4.3. Динамическая модель при неэкспоненциальных законах распределения интервалов ............................................... 56 3.4.4. Динамическая модель надежности обслуживаемой системы из нескольких элементов ................................................ 60 3.4.5. Пример записи уравнений Чепмена–Колмогорова и их решения для системы с обслуживанием .............................. 63 3.4.6. Вычисление показателей надежности системы ................. 68 4. Статистическое моделирование функциональной надежности системы .................................................................................................... 75 4.1. Понятие имитационной модели надежности и принципы ее построения ...................................................................................... 75 4.1.1. Определение имитационной модели надежности ............. 75 4.1.2. Принципы построения алгоритма ....................................... 76 4.1.3. Описание алгоритма имитационной модели ..................... 77 4.1.4. Воспроизведение случайных интервалов ........................... 82 4.2. Точность и достоверность оценок показателей надежности по статистическим данным ................................................................ 84 4.2.1. Закон распределения оценки p* вероятности события и расчет доверительных интервалов ............................................. 84 4.2.2. Оптимальность оценки p* .................................................... 88 4.2.3. Оптимальная оценка среднеквадратичного отклонения σ*[p*] ............................................................................ 90 4.2.4. Достоверность законов распределения интервалов .......... 94 4.3. Проведение имитационного эксперимента на модели ............. 98 4.3.1. Исходные данные и план эксперимента ............................. 98 4.3.2. Оценка адекватности имитационной и аналитической моделей .......................................................................................... 100
4.3.3. Результаты имитационного моделирования надежности системы с неэкспоненциальными законами распределения интервалов .......................................... 102 4.3.4. Исследование стационарности потока отказов системы при неэкспоненциальных законах распределения интервалов ..................................................................................... 106 4.3.5. Проверка гипотез о виде закона распределения интервала до отказа ...................................................................... 108 4.3.6. Вычисление закона распределения интервала безотказной работы системы ....................................................... 111 4.4. Обсуждение основных целей и результатов имитационного моделирования....................................................... 114 Библиографический список ................................................................. 117
1. ОСНОВНЫЕ ПОНЯТИЯ ТЕОРИИ НАДЕЖНОСТИ СИСТЕМ 1.1. Два типа случайных воздействий Усложнение и количественный рост задач, связанных с удовлетворением потребностей человека, привели к соответствующему усложнению технических и технологических систем, создаваемых для решения этих задач. Большие затраты при создании системы, часто ее уникальность, а также ожидаемый эффект от решения задачи делают недопустимым срыв этого решения как результат воздействия случайных факторов. Поэтому надежность системы – это один из главных критериев, по которым оценивается качество системы. Итак, надежность системы зависит от действия случайных факторов. Можно выделить два различных типа случайных воздействий. Рассмотрим их на примерах. Пример 1: лампочка накаливания. Раскаленная металлическая спираль подвешена в вакууме. В результате постепенного поверхностного испарения спираль становится все тоньше, пока в какомнибудь месте не достигнет критического сечения. Место перегорания зависит от случайного расположения дефектов микроструктуры материала. Время до перегорания зависит от случайных скоростей испарения, также связанных с указанными дефектами микроструктуры. Пример 2: автомобиль. Несущие и ходовые металлические конструкции автомобиля испытывают механические нагрузки, приводящие к постепенному развитию микротрещин, первоначально имеющихся в металле вследствие несовершенства технологии. В конце концов, какая-нибудь деталь ломается. Время и место поломки зависит от нагрузки и случайного расположения микротрещин. Пример 3: конвертер. Огнеупорная кладка конвертера день за днем выгорает случайным образом в зависимости от дефектов структуры огнеупорного кирпича, поверхности и случайного температурного поля. Если не производить предупредительных ремонтов, через некоторое время произойдет авария. Пример 4: интегральная схема. Находясь под постоянным воздействием случайных электромагнитных полей, колебаний температуры и влажности, интегральная схема постепенно приобретает механические дефекты, а потом и дает функциональные сбои.
Замечание. Если рассматривать расположение микроэлементов в структуре материала указанных конструкций как систему, то можно сказать, что случайность здесь заложена в структуру системы. Она проявляется в надежности посредством действия нагрузки. Здесь характерно относительно большое время функционирования до отказа и эволюционный характер развития дефектов под действием нагрузки. При этом сама нагрузка может быть как случайной, так и регулярной. Это не существенно, так как эффект ее действия, в основном, является интегральным по времени. Таков первый тип действия случайных факторов. Их можно назвать внутренними. Это неподдающиеся контролю дефекты технологии, возникшие в процессе изготовления изделия. Рассмотрим примеры второго типа действия. Пример 5: космический летательный аппарат. Попав в поток метеоритов, аппарат получает сильный удар в обшивку. В результате компьютер дает временный сбой и на две секунды отключается приемник сигналов управления. Но именно в этот момент приходит сигнал на коррекцию траектории. Коррекция не проводится, задание не выполнено. Пример 6: участок «сталь–прокат» с разливкой в изложницы. Начинается выполнение суточного графика, в котором указаны моменты выпуска плавок в конвертерном цехе, марки стали и типы изложниц. Это определяет порядок дальнейшей обработки плавок. В результате погрешностей при взвешивании и химическом анализе шихты происходят сбои по маркам стали, меняющие очередь плавок. В результате разницы во времени кристаллизации скапливается непредвиденная очередь в стрипперном отделении. Часть плавок переохлаждается и дольше, чем планировалось, занимает место в ячейках нагревательных колодцев. Имеются случайные вариации времени раздевания слитков и транспортировки составов с плавками. В результате напряженной обстановки на разливочной площадке возникает привар слитков, что усугубляет трудности стрипперного отделения. Освобожденные от слитков составы опаздывают к запланированному началу сборки и транспортировки на разливочную площадку. В результате суточный график не выполнен, хотя все агрегаты работали исправно. Пример 7: компьютерная сеть. Из-за внешних радиопомех в линиях связи в сети возникают необнаруживаемые ошибки, приводящие к временному нарушению работы системы коммутации пакетов. Это приводит к скоплению их на коммутаторах и увеличению време
ни обработки. В результате срочные пакеты задержаны. Это равносильно отказу и влечет штрафные санкции. Замечание. В примерах 5–7 система во время функционирования находится в поле действия внешних случайных факторов, которые могут нарушать или не нарушать исправное состояние элементов системы, но в любом случае могут привести к невыполнению системой ее задачи. Подводя итоги сказанному, заметим, что первый тип действия случайных факторов характерен для элементов систем и связан с их физическими свойствами. Надежность при этом может повышаться совершенствованием технологии изготовления материалов и конструкции. Второй же тип характерен для самих систем в процессе их функционирования. Надежность здесь может быть повышена не столько за счет изменения структуры системы, сколько за счет совершенствования подсистемы получения и обработки информации о действии случайных факторов и совершенствования подсистемы управления. Указанные подсистемы являются, как правило, функциональными элементами автоматизированных систем. Автоматизированная система включает в себя одну или несколько автоматических подсистем, способных действовать автономно, и человека, находящегося во взаимодействии с этими подсистемами и имеющего функции контроля состояния и управления (включая изменение архитектуры системы). Условно можно разделить все системы на производственные и непроизводственные, считая производственной ту систему, которая производит некоторый товар. Примером непроизводственной системы является оборонная система. Поскольку и информация в настоящее время является товаром, то в указанной классификации информационные системы можно было бы отнести к производственным. Аналогия особенно сильно видна в сетях (где пакеты проходят «технологическую обработку»), если учесть, что общие свойства производственных систем (включая свойство надежности) нужно искать на уровне моделей массового обслуживания. Однако в информационных системах есть технологические особенности, отличающие их от производственных систем. В данном курсе лекций рассматриваются теоретические проблемы оценки надежности систем.
1.2. Основные определения теории надежности систем 1.2.1. Надежность систем Определение 1. Надежность – это свойство системы противостоять случайным внешним воздействиям, препятствующим достижению поставленной перед системой цели. Для того чтобы система могла теоретически достигнуть цели, она должна в первую очередь быть в работоспособном состоянии. Это означает, что должен функционировать хотя бы некоторый минимальный набор элементов и связей. Определение 2. Минимальный набор элементов и связей, который обеспечивает движение системы к цели, называется функционально необходимым набором. Само движение обеспечивается управляющей подсистемой, в которую заложен алгоритм управления. Этот алгоритм в связи с действием случайных факторов не может полностью гарантировать достижение цели, даже если все его функции выполняются нормально. В этой связи говорят о надежности управления. Определение 3. Надежность управления – свойство алгоритма управления нейтрализовать влияние случайных факторов и обеспечить достижение цели при условии, что имеется функционально необходимый набор. Для сложной системы существует обычно не одно, а множество работоспособных состояний. Таким образом, факт выполнения системой поставленной задачи является сложным событием, состоящим в достижении цели при условии, что система находится в одном из работоспособных состояний. Для обеспечения работоспособного состояния системы каждый из элементов функционально необходимого набора должен выполнять свою функцию. Под элементом понимают отдельное техническое устройство, а иногда и подсистему, состоящую из нескольких устройств, что определяется обычно целями расчетов и применяемыми методами. Определение 4. Выполнение функции состоит в том, что некоторые важные технические (или технологические) выходные параметры находятся в пределах, заданных техническими условиями, т.е. обеспечивающих функционирование других элементов. Например, блок питания вычислительного комплекса должен поддерживать с определенной точностью свои выходные напряжения и частоты. Вы
числительный комплекс, периодически решающий задачу управления, обязан выдавать решение внутри ограниченного интервала времени. В конструкции каждого технического устройства имеются нерасчленяемые (базовые) элементы с определенными физическими свойствами, предназначенные для относительно длительной работы. Длительность их работоспособного состояния определяется технологией изготовления и точностью поддержания заданных условий функционирования. Надежность таких элементов определяется (согласно ГОСТу) как способность выполнять требуемую функцию в заданных условиях в течение заданного периода времени. Фундаментальным понятием при определении надежности является понятие отказа, которое для конкретного объекта должно дать возможность отделить состояние отказа от работоспособного состояния. Для базового элемента – это, как правило, бывает очевидно. Определение 5. Отказом базового элемента называется потеря свойства выполнять требуемую функцию. Определение 6. Для более или менее сложного устройства, являющегося элементом системы, отказом называется выход хотя бы одного функционального параметра из заданных пределов. Определение 7. Отказом системы называется событие, состоящее в том, что система не достигает поставленной цели. 1.2.2. Формулировка цели системы Для уточнения определения отказа системы необходимо сформулировать ее цель. Это обычно делается индивидуально для конкретного экземпляра системы. Пример 1. Для информационной системы (ИС), решающей задачу коррекции траектории одноразового космического аппарата для исследования Венеры, цель может быть сформулирована так: выдать результат решения не позднее очередного момента коррекции траектории. В противном случае аппарат может быть потерян. Пример 2. Конвертерный цех, представляющий собой производственную систему (ПС), может произвести 55 плавок в сутки. По графику он должен сделать за сутки 50 плавок десяти различных марок стали с определенным числом плавок по каждой марке. Предположим, что ставится цель: произвести по каждой марке не меньше плавок, чем в графике (а такие цели реально ставятся). Ясно, что цех всегда работает вблизи своих предельных возможностей по мощно