Книжная полка Сохранить
Размер шрифта:
А
А
А
|  Шрифт:
Arial
Times
|  Интервал:
Стандартный
Средний
Большой
|  Цвет сайта:
Ц
Ц
Ц
Ц
Ц

Математическая статистика

Покупка
Основная коллекция
Артикул: 753592.01.99
Практикум содержит такие темы программы, как выборочный метод, регрессионный анализ, статистическая проверка статистических гипотез, метод Монте-Карло, цепи Маркова. В каждом пункте приводятся необходимые теоретические сведения. Типовые задачи даются с подробными решениями. Представлено большое количество задач для самостоятельного решения. Предназначен для всех технических специальностей и направлений подготовки, включающих реализацию дисциплин «Теория вероятностей и математическая статистика» и «Математика».
Математическая статистика : практикум / сост. Н. А. Андреева, Р. В. Кузьменко, Е. В. Корчагина, Т. В. Меньших ; ФКОУ ВО Воронежский институт ФСИН России. - Воронеж : Научная книга, 2020. - 103 с. - Текст : электронный. - URL: https://znanium.com/catalog/product/1240998 (дата обращения: 22.11.2024). – Режим доступа: по подписке.
Фрагмент текстового слоя документа размещен для индексирующих роботов
ФЕДЕРАЛЬНАЯ СЛУЖБА ИСПОЛНЕНИЯ НАКАЗАНИЙ 
ФЕДЕРАЛЬНОЕ КАЗЕННОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ 
ВЫСШЕГО ОБРАЗОВАНИЯ 
ВОРОНЕЖСКИЙ ИНСТИТУТ ФСИН РОССИИ 
 
Кафедра математики и естественно-научных дисциплин 
 
 
 
 
 
 
 
 
 
 
 
 
МАТЕМАТИЧЕСКАЯ СТАТИСТИКА 
 
Практикум 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Воронеж 
2020 

УДК 517 
ББК 22.16 
     М33 
 
Рекомендовано методическим советом Воронежского института ФСИН 
России 18.02.2020, протокол № 6. 
 
Р е ц е н з е н т ы: 
начальник кафедры основ радиотехники и электроники  
ФКОУ ВО Воронежский институт ФСИН России, кандидат технических наук, 
доцент Р. Н. Андреев;  
заведующий кафедрой радиоэлектронных устройств и систем ФГБОУ ВО 
«Воронежский государственный технический университет» кандидат 
технических наук, доцент Д. В. Журавлев. 
 
Математическая статистика : практикум / [сост. Н. А. Андреева, 
Р. В. Кузьменко, Е. В. Корчагина, Т. В. Меньших] ; ФКОУ ВО 
Воронежский институт ФСИН России. – Воронеж, 2020. – 103 с. 
 
Практикум содержит такие темы программы, как выборочный 
метод, регрессионный анализ, статистическая проверка статистических 
гипотез, метод Монте-Карло, цепи Маркова. 
В каждом пункте приводятся необходимые теоретические сведения. 
Типовые задачи даются с подробными решениями. Представлено 
большое количество задач для самостоятельного решения. 
Предназначен для всех технических специальностей и направлений 
подготовки, включающих реализацию дисциплин «Теория вероятностей 
и математическая статистика» и «Математика». 
УДК 517 
ББК 22.16 
Издано в авторской редакции 
 
 
 
 
 
© Составление. Андреева Н. А., 
Кузьменко Р. В., Корчагина Е. В., 
Меньших Т. В., 2020 
© ФКОУ ВО Воронежский 
институт ФСИН России, 2020 

М33

ВВЕДЕНИЕ 
 
Математическая статистика – наука, изучающая методы обработки 
результатов 
наблюдений 
массовых 
случайных 
явлений, 
обладающих 
статистической устойчивостью, закономерностью, с целью выявления этой 
закономерности. 
Для 
вынесения 
более 
определённого 
заключения 
о закономерностях явлений математическая статистика опирается на теорию 
вероятностей. 
При 
обработке 
результатов 
наблюдений 
исследователь 
выдвигает ряд гипотез, предположений о том, что рассматриваемое явление 
можно описать той или иной вероятностной теоретической моделью. Далее, 
используя математико-статистические методы, он может дать ответ на вопрос, 
какую из гипотез или моделей следует принять. Именно эта модель считается 
закономерностью изучаемого явления. Правомерен такой вывод или нет, 
покажет практика использования выбранной модели. Таков типичный путь 
математико-статистического исследования.  
Каждая математическая теория есть инструмент, используемый для 
решения практических профессиональных задач. Целью данного практикума 
является приобретение навыков начинающими изучение математической 
статистики для использования теоретических знаний на практике. Также 
авторами показаны приемы решения задач с применением современных 
вычислительных и программных устройств, которые позволят существенно 
сократить 
процесс 
сбора 
и 
обработки 
информации, 
получение 
аппроксимирующих зависимостей и оценки результатов, расширить масштабы 
решаемых задач, продемонстрировать полученные выводы. 
Предлагаемый вашему вниманию практикум охватывает некоторые темы, 
изучаемые в рамках теории вероятностей и математической статистики. Здесь 
рассмотрены основные элементы современной статистистической теории, 
акцент 
делается 
на 
исследовании 
вопросов 
выборочного 
метода, 
регрессионного анализа, статистической проверки статистических гипотез, 
а также элементов моделирования случайных величин и случайных процессов. 

Раздел 1. ЭЛЕМЕНТЫ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ 
1.1. Выборочный метод 
Постановка задачи в общем виде 
Пусть требуется сделать вывод о большом количестве объектов, полное 
исследование или изучение которых невозможно. В этом случае исследование всех 
объектов заменяют исследованием некоторой их части. Далее под генеральной 
совокупностью понимается множество всех объектов, а под выборочной 
совокупностью (выборкой) − некоторая ее часть. Выборка, правильно отражающая 
свойства 
генеральной 
совокупности, 
называется 
репрезентативной. 
Для 
репрезентативности выборки необходимо, чтобы отбор объектов осуществлялся 
случайно. Объемом выборки называется количество ее объектов.  
Статистическое распределение выборки является оценкой неизвестного 
распределения генеральной совокупности. При больших значениях объема 
выборки статистическое распределение мало отличается от истинного 
распределения. 
Для выборки решаются следующие задачи: 
1) способ описания и геометрического представления выборок; 
2) вычисление выборочных числовых характеристик. 
Общий подход к решению задач описания и исследования выборок 

Пусть задана выборка 
( )
( )
( )
{
}
n
x
x
x
,...,
,
2
1
  объема n . Различные значения 
ix  

называются вариантами, а не убывающая последовательность вариант – 

вариационным рядом. Количество появления в выборке варианта 
ix  

называется частотой 
in  (
∑
=
=
k

i
in
n
1
), а значение 
n
n
p
i
i
/
*=
 – относительными 

частотами (частостями).  
В том случае, если изучаемый признак является непрерывным или число 
его значений велико, используют интервальный статистический ряд. Для этого 
все значения группируются по вхождению в одинаковые по длине интервалы 
[
)
1
0,x
x
, [
)
2
1,x
x
,…, [
)
k
k
x
x
,
1
−
. Длина интервала ( h ) определяется по формуле 

Стерджеса 

n
x
x
h
2

min
max
log
1 +

−
=
, где 
min
max
x
x
−
 – разность между наибольшим и 

наименьшим значениями признака, 
n
m
2
log
1+
=
 – число интервалов; начало 

первого интервала – 
2
min
h
x
xнач
−
=
. Во вторую строку статистического ряда 

заносят количество значений in , попавших в интервалы. 

Статистическое 
распределение 
дискретной 
случайной 
величины 
описывается полигоном частот, под которым понимают ломанную, 

соединяющей точки (
)
1
1,n
x
,(
)
2
2,n
x
,…,(
)
k
k n
x ,
; полигоном частостей − 

ломанной, соединяюшей точки (
)*
,
1
1 p
x
,(
)*
,
2
2 p
x
,…,(
)*
,
k
k p
x
.  
Варианты 
откладываются 
на 
оси 
абсцисс, 
а 
на 
оси 
ординат 
откладываются частоты (частости). 

Статистическое 
распределение 
непрерывной 
случайной 
величины 
описывается  
полигоном частот – ломанной, соединяющей середины интервалов 

n
x
x
x
,...,
,
2
1
; гистограммой частот (частостей) – ступенчатой фигурой, 

состоящей из прямоугольников, основаниями которых служат частичные 

интервалы, а высоты равны отношению 

h
ni  – плотность частоты (

h
pi *  – 

плотность частости). 
Площадь гистограммы частот равна объему выборки, а площадь 
гистограммы частостей равна единице. 

 
Выборочной средней 
X  называется среднее арифметическое всех 

значений выборки  
∑
∑
∑

=

=
=
⋅
=
⋅
=
=
+
+
+
=
k

i
i
i

k

i
i
i

n

i
i
n
p
x
n

n
x

n

x

n
x
x
x
X
1

1
1
2
1
*
...
. 

Выборочная дисперсия 
2
)
(
X
X
D
σ
=
 – среднее арифметическое квадратов 
отклонений значений выборки от выборочной средней X : 

(
)
(
)
(
)

n

X
x

n
X
x
X
x
X
x
X
D

n

i
n
n
X
∑
=
−
=
−
+
+
−
+
−
=
=
1

2
2
2
2
2
1
2
)
(
...
)
(
σ
. 

Для удобства вычисления используют следующую формулу 
( )

2
2
)
(
X
X
X
D
−
=
. 
Выборочное среднеквадратическое отклонение 
X
σ
 – квадратный 

корень из выборочной дисперсии 
)
(X
D
X =
σ
. 
Эти характеристики являются оценками разброса значений случайной 
величины относительно ее среднего значения. Но 
(
)
D X  имеет размерность 
квадрата случайной величины, а 
X
σ
 – размерность самой случайной величины. 
Исправленной выборочной дисперсией называется следующая величина 

)
(
1

2
X
D
n
n
S
−
=
, 
а 
исправленным 
выборочным 
среднеквадратическим 

отклонением называется следующая величина 
2
S
S =
. 
Размахом вариации называется число 
min
max
x
x
R
−
=
, где 
max
x
 – 

наибольшее значение вариации, 
min
x
 – наименьшее значение вариации. 

Мода 
*
o
M
 вариации – вариант, имеющий наибольшую высоту. Медиана 

*
e
M
 вариации – значение признака, приходящееся на середину ряда. 
 
Практические задачи описания и исследования выборок 
Задача 1. Построение полигонов и гистограмм для выборки 
Постановка задачи. 
Описание и геометрическое представление выборки осуществляется 
по следующему алгоритму: 
1. Для заданной выборки построить вариационный ряд, определить объем 
выборки. 
2. По вариационному ряду построить статистические распределения 
частот и частостей. 
3. По статистическим распределениям выборки построить полигоны 
частот и частостей. 
4. По статистическим распределениям выборки построить гистограмму 
частот. 
Применим данный алгоритм для решения некоторой типовой задачи 
математической статистики по построению полигонов и гистограмм для 
выборки. При этом используем возможности табличного процессора Excel. 
Пример. При сдаче экзамена по дисциплине «Теория вероятностей и 
математическая статистика» студенты получили следующие оценки: 3, 2, 5, 4, 
5, 4, 5, 4, 2, 3, 3, 3, 4, 4, 5, 4, 3, 4, 3, 4, 5, 4, 2, 3, 4. Необходимо исследовать 
данную выборку по приведённому алгоритму.   
 
Выполнение задания 
1. Из полученных оценок по экзамену составим вариационный ряд 2, 2, 2, 
3, 3, 3, 3, 3, 3, 3, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 5, 5, 5, 5, 5 и найдем объем выборки. 

Запускаем программу Excel, Вводим заданную выборку. Выделяем 
выборку, вызываем «Данные» → «Сортировка по возрастанию». Находим 
объем выборки с помощью встроенной функции «СЧЁТ()». 

 
2. Построим статистическое распределение частот и частостей. 
Для построения статистического распределения частот создадим таблицу, в 
первом столбце которой будут представлены варианты оценок, во втором – 
количества этих вариантов, найденные с помощью встроенной функции 
«СЧЁТЕСЛИ()». Для построения статистического распределения частостей 
создадим таблицу, в первом столбце которой будут представлены варианты 
оценок, во втором – частости появления вариантов в выборке.   

3. Построим полигоны частот и частостей. 

Вызываем «Вставка» → («Диаграммы») → «График» → «График». В появившемся 
поле нажимаем правую клавишу мыши и выбираем «Выбрать данные…». В окне 
«Выбор источника данных» в поле «Диапазон данных для диаграммы» вводим 
диапазон ячеек, соответствующих оценкам в статистическом распределении. В 
поле «Элементы легенды (ряды)» вводим диапазон ячеек, соответствующих 
количеству в статистическом распределении. В поле «Подписи горизонтальной оси 
(категории)» вводим диапазон ячеек, соответствующих оценкам в статистическом 
распределении. Нажимаем «ОК» → «ОК».  

 
Аналогично 
строим 
полигон 
частостей 
по 
статистическому 
распределению частостей.  

 
4. Построим гистограмму частот.  
Для этого нам необходимо найти наименьшее и наибольшее значения выборки, 
величину интервала по формуле Стерджеса, количество интервалов и 
начальное значение первого интервала. Воспользуемся для этого встроенными 
функциями «МАКС()», «МИН()» и формулами, приведенными выше.  

Найдем все границы интервалов с округлением до двух разрядов после запятой. 

Построим таблицу со столбцами «Интервалы», «Плотность частоты», 
«Частота». Заполним столбец «Интервалы», используя «Границы интервалов». 
Для заполнения значений в столбец «Частота» необходимо воспользоваться 
встроенной функцией «ЧАСТОТА()», выделив весь этот столбец (не включая 
названия), записать функцию и нажать комбинацию клавиш Shift+Ctrl+Enter. 
Для заполнения столбца «Плотность частоты» воспользуемся формулой, 
приведенной выше. 
 

 
 
Построим гистограмму частот. Выделяем столбцы «Интервалы» и 
«Плотность 
частоты», 
вызываем 
«Вставка» 
→ 
(«Диаграммы») 
→ 
«Гистограмма» → «Гистограмма с группировкой».  

Задание для самостоятельной работы 
Решить задачу 1 в соответствии со своим вариантом. 
№ 
Оценки 

1 
3 
2 
4 
3 3 
4 
4 5
4 5 3
4 4 3
4 5 4
4 5 5
4 5 3
3

2 
4 
3 
3 
4 5 
5 
5 4
5 4 4
5 5 4
3 4 4
5 3 4
3 2 3
5

3 
5 
5 
4 
5 4 
3 
4 3
3 4 5
4 3 4
4 5 4
4 5 4
5 5 4
3

4 
3 
4 
5 
4 3 
4 
3 4
4 4 4
2 3 2
3 3 4
5 4 2
3 4 3
3

5 
3 
2 
3 
5 3 
5 
5 5
5 4 5
3 4 3
2 2 3
2 3 3
3 4 3
4

6 
5 
3 
4 
2 3 
4 
2 3
4 2 3
4 4 4
3 2 3
4 4 4
3 2 2
4

7 
3 
4 
4 
4 4 
2 
5 5
4 5 4
3 3 3
3 4 5
2 3 5
4 3 2
4

8 
3 
3 
3 
3 4 
4 
2 3
4 5 4
3 2 3
2 4 5
5 4 3
4 5 4
3

9 
3 
4 
5 
4 3 
4 
5 4
3 5 5
5 2 2
3 3 4
5 5 4
3 3 2
3

10 
2 
3 
4 
3 3 
3 
3 3
4 5 4
5 5 5
4 3 4
5 3 4
2 3 4
5

 
Контрольные вопросы 
1. Дайте определение генеральной совокупности. 
2. Дайте определение выборки и объема выборки. 
3. Охарактеризуйте понятие репрезентативность выборки. 
4. Объясните, как формируется вариационный ряд. 
5. Объясните, как находятся частоты и частости вариантов выборки. 
6. Дайте определение статистического распределения выборки. 
7. Объясните, каким образом строятся полигоны частот и частостей. 
8. Объясните, каким образом строятся гистограммы частот и частостей. 
 
Задача 2. Нахождение выборочных числовых характеристик 
Постановка задачи. 
Нахождение числовых характеристик выборки осуществляется 
по следующему алгоритму: 
1. Для заданной выборки найти выборочное среднее, выборочную 
дисперсию, выборочное среднеквадратическое отклонение, исправленную 
выборочную дисперсию и исправленное среднеквадратическое отклонение по 
формулам. 
2. 
Для 
заданной 
выборки 
найти 
соответствующие 
числовые 
характеристики, используя встроенные функции программы Excel. 
3. Найти размах, моду и медиану выборки.