Статистический анализ данных по цензурированным выборкам
Покупка
Новинка
Год издания: 2016
Кол-во страниц: 44
Дополнительно
Вид издания:
Учебное пособие
Уровень образования:
ВО - Бакалавриат
ISBN: 978-5-7038-4459-5
Артикул: 841916.01.99
Рассмотрены наиболее применяемые статистические критерии для работы с цензурированными данными, а также различные способы оценки параметров надежности. Даны основные определения и понятия, формулировки теорем.
Для студентов-магистров I курса МГТУ им. Н.Э. Баумана, обучающихся по специальности «Высшая математика».
Тематика:
ББК:
УДК:
ОКСО:
- ВО - Бакалавриат
- 01.03.01: Математика
- 01.03.04: Прикладная математика
- 02.03.01: Математика и компьютерные науки
- 02.03.02: Фундаментальная информатика и информационные технологии
- 03.03.01: Прикладные математика и физика
ГРНТИ:
Скопировать запись
Фрагмент текстового слоя документа размещен для индексирующих роботов
Московский государственный технический университет имени Н.Э. Баумана В.И. Тимонин, Л.М. Будовская, Н.Д. Тянникова Статистический анализ данных по цензурированным выборкам Учебное пособие 1
Т41 УДК 519.23 ББК 22.17 Т41 Издание доступно в электронном виде на портале ebooks.bmstu.ru по адресу: http://ebooks.bmstu.ru/catalog/109/book1463.html Факультет «Фундаментальные науки» Кафедра «Высшая математика» Рекомендовано Редакционно-издательским советом МГТУ им. Н.Э. Баумана в качестве учебного пособия Тимонин, В. И. Статистический анализ данных по цензурированным выборкам : учебное пособие / В. И. Тимонин, Л. М. Будовская, Н. Д. Тянникова. — Москва : Издательство МГТУ им. Н. Э. Баумана, 2016. — 41, [3] с.: ил. ISBN 978-5-7038-4459-5 Рассмотрены наиболее применяемые статистические критерии для работы с цензурированными данными, а также различные способы оценки параметров надежности. Даны основные определения и понятия, формулировки теорем. Для студентов-магистров I курса МГТУ им. Н.Э. Баумана, обучающихся по специальности «Высшая математика». УДК 519.23 ББК 22.17 МГТУ им. Н. Э. Баумана, 2016 Оформление. Издательство ISBN 978-5-7038-4459-5 МГТУ им. Н. Э. Баумана, 2016 2
ПРЕДИСЛОВИЕ Издание предназначено для магистров I курса факультета «Фундаментальные науки». Основное внимание уделено методам анализа зависимостей между функциями распределения результатов научных и технических экспериментов и условиями проведения этих экспериментов, в случае, когда часть данных оказывается неполной (цензурированной). Такие данные наиболее часто встречаются при испытаниях технических и биологических систем. Приведены статистические методы обработки цензурированных данных, наиболее часто используемые в практических приложениях. Они включают в себя как параметрические, так и непараметрические процедуры (оценку Каплана — Мейера функции надежности, модель Кокса пропорциональных интенсивностей и др.). В конце каждого раздела приведены контрольные вопросы и задачи для самостоятельного решения. В приложении даны некоторые математические сведения, необходимые для понимания выкладок. Предполагается знание студентами таких базовых понятий, как несмещенность, состоятельность и эффективность точечных оценок неизвестных параметров; размер критерия, его критическая область и др. Кроме того, студенты должны владеть основами теории надежности в объеме спецкурса «Теория надежности». Применяемые сокращения согласуются с аналогичными сокращениями в других изданиях. В силу большого количества численных методов, применяемых при обработке цензурированных данных, необходимо использование пакетов SAS или STATISTICA, изучение которых входит в спецкурс «Статистические программные комплексы». 3
1. ОСНОВНЫЕ ПОЛОЖЕНИЯ В пособии результатом эксперимента считается наработка до отказа (полная или неполная) технического изделия. Такая интерпретация исследуемых случайных величин наиболее удобна для понимания сути излагаемых методов. Конечно, это не всегда так: можно рассматривать результат эксперимента и как время жизни биологической системы (например, человека). Изложенные ниже методы часто называются методами анализа данных типа времени жизни. При анализе результатов испытаний технических систем (или результатов их эксплуатации) часто возникают ситуации, когда нет возможности точно измерить наработку до отказа всех находящихся под наблюдением изделий. Перечислим основные причины этого: снятие с испытаний или эксплуатации некоторых изделий по организационным причинам или из-за отказа составных частей, надежность которых не исследуется; перевод изделий из одного режима применения в другой в процессе испытаний или эксплуатации; периодический контроль изделий, приводящий к поступлению информации о надежности в виде числа отказов в интервалах наблюдений (группирование информации); высокая надежность изделий, не позволяющая за опреде- ленный период эксплуатации довести до отказа все изделия выборки и др. Простейшим примером цензурированных выборок являются данные испытаний на надежность по планам [NБT] или [NБr]. В первом случае испытания N образцов продолжаются в течение времени T и в процессе испытаний фиксируются моменты отказов . i О неотказавших образцах известно лишь то, что их наработки до отказа i > T. Во втором случае испытания продолжаются до 4
наступления r-го отказа ( ) r (т. е. известны первые r порядковых статистик из времен отказов (1) < (2) < < (3) <… < ( )). r Эти два типа цензурирования называются цензурированием типа I и типа II соответственно. Существует много других видов цензурирования данных, однако в дальнейшем, помимо типов I и II, в основном будут рассматриваться разновидности следующей схемы. Предположим, что под наблюдением находятся n технических объектов, чьи наработки до отказа есть случайные величины , i 1, , i n а наблюдение над i-м объектом прекращается в случайный момент времени , i если отказ не произошел ранее. Тогда в действительности наблюдаются min( , ), i i i X а также индикаторная переменная 1, i V если i i (объект нецензурирован); 0, i V если i i (объект цензурирован). Таким образом, моменты цензурирования i являются случайными величинами, причем распределение i не зависит от распределения наработки до отказа i и, вообще говоря, отличается от распределения . i Такое цензурирование называется случайным. Иногда нельзя точно фиксировать моменты i и , i а существует лишь возможность определять количество отказавших и цензурированных изделий на интервалах 1, [ ], i i T T 1, . i k В этом случае говорят о цензурировании группированием. Иная разновидность цензурирования возникает в том случае, когда одно или несколько изделий снимаются с испытаний (цензурируются) только в моменты отказов других изделий. Например, при отказе первого изделия в выборке снимаются с испытаний 1 r исправных изделий, при отказе следующего изделия — 2 r исправных изделия и т. д. Такое цензурирование называется прогрессивным. Заметим, что цензурирование также различают по факту наличия связей между функциями распределения i и i (не путать данное обстоятельство с независимостью i и ). i Если такая 5