Книжная полка Сохранить
Размер шрифта:
А
А
А
|  Шрифт:
Arial
Times
|  Интервал:
Стандартный
Средний
Большой
|  Цвет сайта:
Ц
Ц
Ц
Ц
Ц

Основы математической статистики

Покупка
Артикул: 809806.01.99
Доступ онлайн
500 ₽
В корзину
Изложены основные сведения по математической статистике, необходимые для решения практических задач. Приведен теоретический материал, примеры решения задач по математической статистике. Большинство задач решено с использованием программных сред Excel и Scilab. Для оценки уровня усвоения студентами пройденного материала предложены варианты заданий для самостоятельной работы. Предназначено для бакалавров, обучающихся по направлениям подготовки 01.03.02 «Прикладная математика и информатика», 10.03.01 «Информационная безопасность», 02.03.03 «Математическое обеспечение и администрирование информационных систем», 09.03.02 «Информационные системы и технологии», изучающих дисциплины «Теория вероятностей и математическая статистика», «Дополнительные главы теории вероятности и математической статистики». Подготовлено на кафедре информатики и прикладной математики.
Титов, А. Н. Основы математической статистики : учебно-методическое пособие / А. Н. Титов, Р. Ф. Тазиева ; Минобрнауки России, Казан. нац. исслед. технол. ун-т. - Казань : Изд-во КНИТУ, 2022. - 96 с. - ISBN 978-5-7882-3160-0. - Текст : электронный. - URL: https://znanium.com/catalog/product/2069263 (дата обращения: 30.04.2024). – Режим доступа: по подписке.
Фрагмент текстового слоя документа размещен для индексирующих роботов. Для полноценной работы с документом, пожалуйста, перейдите в ридер.
Министерство науки и высшего образования Российской Федерации

Казанский национальный исследовательский

технологический университет

А. Н. Титов, Р. Ф. Тазиева

ОСНОВЫ МАТЕМАТИЧЕСКОЙ 

СТАТИСТИКИ

Учебно-методическое пособие

Казань

Издательство КНИТУ

2022
УДК 519.22(075)
ББК 22.172я7

Т45

Печатается по решению редакционно-издательского совета 

Казанского национального исследовательского технологического университета

Рецензенты:

д-р техн. наук, проф. М. Х. Хайруллин
канд. экон. наук, доц. О. С. Семичева

Т45

Титов А. Н.
Основы математической статистики : учебно-методическое пособие / 
А. Н. Титов, Р. Ф. Тазиева; Минобрнауки России, Казан. нац. исслед. 
технол. ун-т. – Казань : Изд-во КНИТУ, 2022. – 96 с.

ISBN 978-5-7882-3160-0

Изложены основные сведения по математической статистике, необходимые 

для решения практических задач. Приведен теоретический материал, примеры решения 
задач по математической статистике. Большинство задач решено с использованием 
программных сред Excel и Scilab. Для оценки уровня усвоения студентами 
пройденного материала предложены варианты заданий для самостоятельной 
работы.

Предназначено для бакалавров, обучающихся по направлениям подготовки 

01.03.02 «Прикладная математика и информатика», 10.03.01 «Информационная 
безопасность», 02.03.03 «Математическое обеспечение и администрирование информационных 
систем», 09.03.02 «Информационные системы и технологии», 
изучающих дисциплины «Теория вероятностей и математическая статистика», 
«Дополнительные главы теории вероятности и математической статистики».

Подготовлено на кафедре информатики и прикладной математики.

ISBN 978-5-7882-3160-0
© Титов А. Н., Тазиева Р. Ф., 2022
© Казанский национальный исследовательский 

технологический университет, 2022

УДК 519.22(075)
ББК 22.172я7
СОДЕРЖАНИЕ

ВВЕДЕНИЕ....................................................................................................................4

1. ОСНОВНЫЕ ПОНЯТИЯ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ .....................5

1.1. Генеральная совокупность и выборка ..............................................................5
1.2. Вариационный, статистический и интервальный ряд. Гистограмма 
и полигон частот. Эмпирическая функция распределения...................................8
Задания для самостоятельной работы................................................................24

2. ОЦЕНКИ ПАРАМЕТРОВ РАСПРЕДЕЛЕНИЯ...................................................26

2.1. Точечные оценки и их свойства......................................................................26

2.1.1. Средние величины в статистике.............................................................29
2.1.2. Характеристики рассеяния ......................................................................30
2.1.3. Статистическое описание и выборочные характеристики
двумерного случайного вектора .........................................................................36

Задания для самостоятельной работы................................................................47
2.2. Интервальные оценки параметров распределения .......................................49

2.2.1. Доверительный интервал для математического ожидания................49
2.2.2. Построение доверительного интервала для дисперсии ........................61
2.2.3. Доверительный интервал для коэффициента корреляции ρ.................64

Задания для самостоятельной работы................................................................65

3. ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ ....................................................67

3.1. Проверка гипотезы о равенстве центров распределения двух 
нормальных генеральных совокупностей при известной дисперсии ................70
3.2. t-критерий..........................................................................................................72
3.3. F-критерий.........................................................................................................78
3.4. Критерий согласия 2 .......................................................................................79
3.5. Критерий среднего абсолютного отклонения (критерий Гири) ..................85
Задания для самостоятельной работы................................................................87
Задания для РГР по МС...........................................................................................88

ЛИТЕРАТУРА.............................................................................................................92

ПРИЛОЖЕНИЯ...........................................................................................................93

Приложение 1. Нормальное распределение .........................................................93
Приложение 2. Распределение Стьюдента ...........................................................94
Приложение 3. χ2-распределение...........................................................................95
ВВЕДЕНИЕ

Математическая статистика является разделом математики, изучаю-

щим методы сбора, систематизации и обработки экспериментальных данных 
и результатов наблюдений. Она опирается на методы теории вероятностей, 
поэтому при изложении материала данного пособия авторы предполагали, 
что читатель владеет базовыми знаниями по теории вероятностей. Необходимые 
сведения, требуемые для решения задач, можно найти в работах 
по теории вероятностей и математической статистике1.

Задача математической статистики состоит в том, чтобы с помощью 

имеющихся в ее распоряжении методов сбора и обработки статистических
данных по результатам конечного числа экспериментов снабдить исследователя 
информацией, которая может помочь ему сделать выводы, имеющие 
научную и практическую ценность.

В данном пособии рассмотрены теоретические и практические ас-

пекты решения задач по математической статистике: понятия генеральной 
и выборочной совокупностей, построение дискретных и интервальных вариационных 
рядов распределения, построение гистограмм и полигонов распределения 
случайных величин, получение точечных и интервальных оценок 
параметров распределения, проверка статистических гипотез о законах 
и параметрах распределения. При этом авторы стремились избегать громоздких 
математических выкладок и доказательств, сохранив при этом математическую 
строгость изложения материала, которое ведется на уровне, 
доступном студентам технических вузов.

В пособии приведено множество примеров, помогающих усвоению 

изложенного материала. Для выработки у студентов навыков обработки реальных 
данных с привлечением компьютерной техники при решении конкретных 
учебных задач там, где это возможно, показано, как можно решать 
предложенные задачи в Excel (Microsoft Office 2016) и Scilab (версия 6.1.0). 
После изложения теоретического материала в каждом разделе приводится 
решение типовых примеров. Заканчивается раздел задачами для самостоятельного 
решения. В конце пособия приведены задания для итоговой расчетной 
работы.

1 Колемаев В. А., Староверов О. В., Турундаевский В. Б. Теория вероятностей и математическая статистика. 
Москва: Высшая школа, 1991. 400 с.; Кобзарь А. И. Прикладная математическая статистика.
Москва: Физматлит, 2006. 816 с.; Ефимов А. В. Сборник задач по математике для втузов: в 3 ч. Ч. 3. 
Теория вероятностей и математическая статистика. Москва: Гл. ред. физ.-мат. лит., 1990. 428 с.; Михайлова 
О. В., Облакова Т. В. Теория вероятностей и случайные процессы. Ч. 1. Элементарная теория вероятностей. 
Москва: МГТУ имени Н. Э. Баумана, 2013. 60 с.; Титов А. Н. Тазиева Р. Ф. Решение задач 
теории вероятностей и математической статистики в среде Scilab. Казань: Изд-во КНИТУ, 2019. 120 с.; 
Титов А. Н., Тазиева Р. Ф. Основы теории вероятностей. Казань: Изд-во КНИТУ, 2021. 108 с.
1. ОСНОВНЫЕ ПОНЯТИЯ МАТЕМАТИЧЕСКОЙ 

СТАТИСТИКИ

1.1. Генеральная совокупность и выборка

Статистическое исследование состоит из трех основных этапов:
– статистическое наблюдение;
– первичная обработка, сводка и группировка результатов наблю-

дений;

– анализ полученных данных.
На первом этапе производят сбор сведений об изучаемых процес-

сах или явлениях. Полученные в результате статистического наблюдения 
данные являются исходным материалом для выполнения последующих 
этапов статистического исследования. Результатом статистического 
наблюдения будет получение данных, характеризующих каждую
единицу наблюдения. Эти результаты должны быть определенным образом 
обработаны, чтобы они стали пригодными для дальнейшего статистического 
исследования. 

Статистическая сводка включает в себя распределение исходных

данных по группам, качественно однородным по одному или нескольким 
признакам, и получение групповых итогов.

Для правильного выделения качественно однородных групп вы-

бирают основные, наиболее существенные для данного явления или
процесса признаки. В зависимости от числа и вида признаков, решаемых 
задач и исходных данных группировки подразделяются на следующие 
виды: простые и комбинационные; типологические, структурные
и аналитические; одномерные и многомерные; первичные и вторичные.

Одним из этапов группировки является построение рядов распре-

деления. Результаты статистической группировки и сводки излагаются
в виде статистических таблиц. Статистический анализ является заключительной 
стадией статистического исследования.

Характерным для статистических методов на этой стадии счита-

ется применение обобщающих показателей: абсолютных, относительных, 
средних величин и т. п.1

1 Ребро И. В., Носенко В. А., Короткова Н. Н. Прикладная математическая статистика для технических
специальностей. Волгоград: ИУНЯ ВолгГТУ, 2011. 149 с.
Чтобы получить максимально точные данные, например, о предпо-

чтениях какой-либо группы людей, нужно бы было опросить эту группу 
людей целиком. Однако, как правило, эта группа бывает достаточно большой 
и опрос занял бы много времени и стоил бы больших денег.

Задача математической статистики состоит в том, чтобы на осно-

вании знания некоторых свойств подмножества элементов, взятых из некоторого 
множества, сделать какие-либо утверждения о свойствах самого 
множества, называемого генеральной совокупностью. Например, 
если нас интересует успеваемость студентов нашего города по какой-
либо дисциплине (например, по математике), то генеральная совокупность – 
это все множество студентов города, изучающих эту дисциплину. 
Вместо того чтобы опрашивать всех, случайным образом отбирают 
некоторое количество студентов (производят выборку) и на основании 
изучения этой выборки делают вывод о том, что и вся генеральная 
совокупность обладает теми же свойствами, что и изученная выборка.

Для того чтобы заключение, полученное путем изучения вы-

борки, можно было распространить на всю генеральную совокупность, 
выборка должна обладать свойством репрезентативности, т. е. характеристики 
выборки должны соответствовать характеристикам генеральной 
совокупности в целом. Одна и та же выборка может быть репрезентативной 
и нерепрезентативной для разных генеральных совокупностей. 
Например, выборка, целиком состоящая из жителей города, владеющих 
престижным автомобилем, не репрезентирует все население 
этого города. Однако она будет репрезентативной, если изучается 
набор предпочтений наиболее состоятельных жителей города.

Для обеспечения репрезентативности выборки используют слу-

чайный отбор. Он предполагает обеспечение таких условий, чтобы каждый 
объект генеральной совокупности имел равные шансы попасть 
в выборку. Случайный отбор обеспечивает возможность попадания 
в выборку самых разных представителей генеральной совокупности. 

Выборки бывают зависимыми и независимыми. Независимые 

выборки характеризуются тем, что вероятность отбора любого объекта 
одной выборки не зависит от отбора любого из объектов другой выборки. 
Напротив, зависимые выборки характеризуются тем, что каждому 
объекту одной выборки поставлен в соответствие по определенному 
критерию объект из другой выборки. 

В генеральной совокупности исследуется некоторый признак, ко-

торый обусловлен случайностью и может носить качественный или количественный 
характер.
Количественным является признак, отдельные варианты кото-

рого имеют числовое выражение и отражают размеры, масштабы изучаемого 
объекта или явления. К количественным признакам, например, 
относят доход предприятия, площадь жилого помещения, цену товара, 
стаж работы. Количественные признаки в статистике преобладают над 
другими видами признаков, они наиболее информативны, именно на 
работу с данными признаками нацелена большая часть многообразного 
статистического инструментария. По характеру варьирования количественные 
признаки делятся на дискретные и непрерывные. Пример дискретного 
признака – число человек в семье. Варианты дискретных признаков 
выражаются в виде целых чисел. К непрерывным признакам относятся, 
например, возраст, величина заработной платы, стаж работы, 
время безотказной работы прибора.

Качественные признаки, в свою очередь, подразделяют на аль-

тернативные, атрибутивные и порядковые.

Альтернативным называется признак, имеющий только два вари-

анта значений. Например, продукция предприятия может соответствовать 
предъявляемым требованиям или быть бракованной, пол человека 
может быть мужским или женским, население страны или региона 
обычно делится на городское и сельское. Альтернативный признак может 
иметь и числовое выражение. Предположим, при анкетировании 
потребителей вопрос о доходах в анкете предполагал всего два варианта: «
до 50 тыс. рублей в месяц» и «50 тыс. рублей в месяц и более». 
В этом случае количественный признак был преобразован в альтернативный.


Атрибутивный признак в отличие от альтернативного имеет бо-

лее двух вариантов, которые при этом выражаются в виде понятий или 
наименований. К атрибутивным признакам относятся район проживания, 
вид продукции, специальность работника, цвет товара. Такие признаки 
имеют место в различных областях исследования, но в большей 
степени они характерны для информации, с которой работают маркетологи, 
социологи, психологи.

Порядковые признаки отличаются от атрибутивных тем, что они 

имеют несколько ранжированных, т. е. упорядоченных по возрастанию 
или убыванию, качественных вариантов. Примерами таких признаков 
являются уровень образования (начальное, общее среднее и т. д.), уровень 
квалификации, воинское звание, различного рода рейтинги. Отдельные 
варианты порядкового признака трудно соизмерить количественно. 
Например, понятно, что высшее профессиональное образо-
вание лучше, чем среднее профессиональное, но при этом нельзя утверждать, 
что оно лучше на 20 или 30 %. Водительская категория Е выше, 
чем водительская категория В, но количественных пропорций между 
ними не существует.

Следует отметить, что порядковый признак может иметь число-

вое выражение. В качестве примеров можно привести такие порядковые 
признаки, как разряд рабочего, тарифный разряд служащего, экзаменационные 
оценки. Студент, получивший четверку, не обязательно 
продемонстрировал ровно в два раза больше знаний по сравнению со 
студентом, получившим двойку. Рабочий 6-го разряда не обязательно 
в два раза больше вырабатывает продукции и в два раза больше зарабатывает 
по сравнению с рабочим 3-го разряда. В обозначении вариантов 
этих признаков цифры можно заменить буквами алфавита без какого-
либо снижения их информативности.

Приведенные примеры показывают, что изучаемые статистикой 

признаки, как правило, подвержены вариации. Вариация – это колебле-
мость, изменение величины признака в статистической совокупности, 
т. е. принятие единицами совокупности или их группами разных значений 
признака.

1.2. Вариационный, статистический и интервальный ряд. 
Гистограмма и полигон частот. Эмпирическая функция 

распределения

Под случайной выборкой объема n понимается выбор n объектов 

из генеральной совокупности, причем выбор отдельных объектов производится 
независимо один от другого. Результатом случайной выборки 
объема n является совокупность (х1,x2,…,xn)  значений признака.

Вариационным рядом выборки (х1,x2,…,xn) называется такой спо-

соб ее записи, при котором элементы упорядочивают по величине при-

знака, т. е. последовательность записывается в виде 

(1) (2) (3)
( )

,
,
,...,
,

n

x x x
x
где 

(1)
(2)
(3)
( )

...
.

n

x
x
x
x




Разность между максимальным и минимальным элементами вы-

борки

( )
(1)
n
x
x
−
называют размахом выборки.

При большом n (порядка сотен) простая статистическая совокуп-

ность (х1,x2,…,xn) перестает быть удобной формой записи статистического 
материала – она становится слишком громоздкой и малонагляд-
ной. Для придания статистическому материалу большей компактности 
и наглядности он должен быть подвергнут дополнительной обработке –
строится так называемый «статистический ряд».

Пусть в выборке (х1,x2,…,xn) есть одинаковые элементы. Перепи-

шем выборку в другом виде: (z1,z2,…,zk), где k – количество различных 
значений признака, причем каждое значение zi встречается ровно ni раз. 

Число ni называется частотой элемента zi. 

1

Очевидно, чт
.
о

k

i

i

n
n

=

=


Статистическим рядом называется совокупность пар (zi,ni). При 

большом объеме выборки ее элементы объединяются в группы, представляя 
результаты опытов в виде группированного статистического 
ряда. Для этого интервал, содержащий все элементы выборки, разбивают 
на m непересекающихся интервалов. Вычисления значительно
упрощаются, если интервалы имеют одинаковую длину. В дальнейшем, 
как правило, будем рассматривать только этот случай. После того как 
частичные интервалы выбраны, определяют частоты – количество ni
элементов выборки, попавших в i-й интервал. Наряду с частотами од-

новременно подсчитывают также накопленные частоты

1

i

j

j

n

=
, относи-

тельные частоты

in
n и накопленные относительные частоты

1

i

j

j

n

n

=

. По-

лученные результаты сводят в таблицу частот группированной выборки (
пример 1.1). Группировка выборки вносит погрешность в дальнейшие 
вычисления.

Пусть имеется выборка (х1,x2,…,xn) из генеральной совокупности 

с признаком Х. Распределение Х неизвестно. Для того чтобы получить 
первое представление об этом распределении в случае количественного 
признака, строят так называемую гистограмму. Для этого разбивают 
действительную ось на конечное число промежутков 
1,...,
.
m


Подсчи-

тывают частоты ni выборочных значений, попавших в i-й интервал
(
1,
).
i
m
=
Над 
i
 рисуют прямоугольники, высоты которых равны 
in

nh , 

где h – ширина интервала (напоминаем, что она постоянна). Полученный 
ступенчатый график называют гистограммой. Сумма площадей 
всех построенных прямоугольников равна единице.

При увеличении объема выборки n и уменьшении длины интер-

валов
i
 гистограмма относительных частот является статистическим 

аналогом плотности распределения fX(x) генеральной совокупности.

Полигон частот строят так же, как и гистограмму, но вместо пря-

моугольников середины верхних сторон прямоугольников соединяют 
прямыми линиями (рис. 1.8).

Пример 1.1. Построить таблицу частот и гистограмму для следу-

ющей выборки:

Решение. Согласно исходным данным ширина интервалов равна 

h = 10. Объем выборки n = 50. Строим таблицу частот:
Для построения гистограммы в Excel необходимо разместить на 

листе исходные данные (диапазон A1:G2):

Первая строка соответствует серединам интервалов, а вторая –

частотам. Для получения последней строки каждый элемент из диапазона 
A2:G2 разделим на nh (n = 50, h = 10). Получаем строку A3:G3. 
Для построения гистограммы вначале с нажатой клавишей Ctrl выделяем 
диапазон ячеек A1:G1 и A3:G3. Затем на вкладке «Вставка» (см. на 
рис. 1.1 стрелку, обведенную кружочком) необходимо вызвать окно 
«Мастер диаграмм» (рис. 1.2).

Рис. 1.1. Вкладка «Вставка»

Рис. 1.2. Окно «Мастер диаграмм»

Выбрав выделенный тип диаграммы и нажав кнопку «ОK», получаем
гистограмму относительных частот.
Доступ онлайн
500 ₽
В корзину