Книжная полка Сохранить
Размер шрифта:
А
А
А
|  Шрифт:
Arial
Times
|  Интервал:
Стандартный
Средний
Большой
|  Цвет сайта:
Ц
Ц
Ц
Ц
Ц

Основы математической статистики

Покупка
Основная коллекция
Артикул: 205400.05.01
Доступ онлайн
от 444 ₽
В корзину
В основу учебника положен семестровый курс лекций и практических занятий по математической статистике для студентов экономико-математического факультета РЭУ им. Г.В.Плеханова. Рассматриваются теория математической статистики и ее основные задачи; точечного и интервального оценивания, проверки статистических гипотез; корреляционно-регрессионный анализ и др. Все главы содержат примеры и задачи с решениями для самостоятельной работы. Отдельно приводится раздел с задачами для самостоятельного решения. Для студентов, аспирантов, специалистов-практиков и научных работников экономико-математического и общеэкономических специальностей.

Только для владельцев печатной версии книги: чтобы получить доступ к дополнительным материалам, пожалуйста, введите последнее слово на странице №257 Вашего печатного экземпляра.

Соколов, Г. А. Основы математической статистики : учебник / Г.А. Соколов. — 2-е изд. — Москва : ИНФРА-М, 2022. — 368 с. + Доп. материалы [Электронный ресурс].— (Высшее образование: Бакалавриат). — DOI 10.12737/3072. - ISBN 978-5-16-006729-2. - Текст : электронный. - URL: https://znanium.com/catalog/product/1844288 (дата обращения: 27.04.2024). – Режим доступа: по подписке.
Фрагмент текстового слоя документа размещен для индексирующих роботов. Для полноценной работы с документом, пожалуйста, перейдите в ридер.
ОСНОВЫ
МАТЕМАТИЧЕСКОЙ
СТАТИСТИКИ

Москва
ИНФРА-М
2022

Г.А. СОКОЛОВ

Рекомендовано учебно-методическим объединением
по образованию в области статистики и математических методов
в экономике в качестве учебника для студентов высших учебных 
заведений, обучающихся по направлению 38.03.01 «Экономика»

УЧЕБНИК

Второе издание

УДК 519.2(075.8)
ББК 22.172я73
       С 59

Р е ц е н з е н т ы : 
О.А. Косоруков, доктор технических наук, профессор Российского экономического 
университета им. Г.В. Плеханова;
Н.Г. Назаров, доктор технических наук, профессор Технического университета 
им. Н.Э. Баумана

А в т о р 
Соколов Григорий Андреевич, доктор технических наук, профессор, 
преподаватель Российского экономического университета им. Г.В. Плеханова

Соколов Г.А.
С 59 
  Основы математической статистики : учебник / Г.А. Соколов. — 
2-е изд. — Москва : ИНФРА-М, 2022. — 368 с. + Доп. материалы 
[Электронный ресурс].— (Высшее образование: Бакалавриат). — DOI 
10.12737/3072.

ISBN 978-5-16-006729-2 (print)
ISBN 978-5-16-101131-7 (online)

В основу учебника положен семестровый курс лекций и практических 
занятий по математической статистике для студентов экономико-
математического факультета РЭУ им. Г.В. Плеханова. Рассматриваются 
теория математической статистики и ее основные задачи; точечного и интер-
вального оценивания, проверки статистических гипотез; корреляционно-
регрессионный анализ и др. Все главы содержат примеры и задачи с реше-
ниями для самостоятельной работы. Отдельно приводится раздел с задачами 
для самостоятельного решения.
Для студентов, аспирантов, специалистов-практиков и научных работников 
экономико-математического и общеэкономических специальностей.

УДК 519.2(075.8)
ББК 22.172я73

ISBN 978-5-16-006729-2 (print)
ISBN 978-5-16-101131-7 (online)

ФЗ 
№ 436-ФЗ
Издание не подлежит маркировке 
в соответствии с п. 1 ч. 4 ст. 11

© Соколов Г.А., 2014

Материалы, отмеченные знаком 
, доступны 
в электронно-библиотечной системе Znanium.com

ПРЕДИСЛОВИЕ

В основу данного учебника положен курс математической ста-

тистики, разработанный автором для студентов экономико-матема-
тического факультета РЭУ им. Г.В. Плеханова. Курс читается студен-
там этого факультета уже более 20 лет и из года в год непрерывно 
совершенствуется.

В 2002 г. преподаватели кафедры высшей математики РЭУ Соко-

лов Г.А. и Гладких И.М. написали, а в 2004 г. издательство «Экзамен» 
выпустило учебник «Математическая статистика».

Авторы ставили перед собой цель предложить учебник для на-

чального, но достаточно серьезного изучения математической ста-
тистики студентам, имеющим подготовку по курсам высшей мате-
матики и теории вероятностей в объеме стандартных программ этих 
курсов. Прошедшие годы показали, что надежды авторов оправда-
лись сполна. Студенты прошлых лет приступали к диссертации или 
отправлялись за рубеж вместе с нашей книгой, а сегодняшние уже 
не могут ее купить. Настоящая книга написана по инициативе изда-
тельства «ИНФРА-М» на базе действующего (текущего) курса с уче-
том преемственности и углубления предыдущего.

В последние годы произошли значительные изменения в тре-

бованиях к уровню обучения студентов, поскольку теперь в вузах 
готовят бакалавров (а не специалистов) в полном соответствии  
с требованиями компетенции. В предлагаемом учебнике учтены 
особенности текущей программы бакалавриата, исправлены не-
точности и неоднозначности формулировок, упрощены доказа-
тельства неко то рых математических утверждений. В настоящем 
учебнике особенностям практического решения задач уделяется 
не меньшее внимание, чем обоснованию методов их решения: 
подробно проанализировано решение более 200 примеров и свыше 
140 задач рекомендовано для самостоятельного решения. Все это 
предоставляет заинтересованным и «продвинутым» студентам бо-
лее широкие возможности для самостоятельного изучения пред-
мета.

Предлагаемый учебник можно рассматривать как естественное 

продолжение учебника по теории вероятностей [11], поскольку 
теория вероятностей и математическая статистика представляют со-
бой две стороны одной медали. В теории вероятностей изучаются 
методы анализа массовых случайных явлений в предположении, что 
модели этих явлений известны полностью, а источником этого зна-
ния в большинстве случаев является математическая статистика, 

которая предполагает, что модель случайного явления известна лишь 
частично. Это незнание может варьировать в очень широких преде-
лах и, как следствие, порождает великое многообразие задач, реша-
емых теоретико-вероятностными методами.

Приведем два примера в каком-то смысле противоположных за-

дач. Рассматривается так называемая непараметрическая модель, т.е. 

семейство непрерывных функций F x
( )
{
},  удовлетворяющих ха-

рактеристическим свойствам функции распределения. Требуется 
построить последнюю с тем или иным приближением. Второй при-
мер: рассматривается так называемая параметрическая модель, т.е. 

семейство непрерывных функций F x θ
(
)
{
},  известных с точностью 

до значения параметра θ, равного либо θ1, либо θ2, θ2 ≠ θ1. Требуется 
с той или иной достоверностью определить, какому из этих значений 
равен неизвестный параметр θ.

Исходными данными для решения любых задач математической 

статистики служат результаты многократного наблюдения (измере-
ния) случайной величины.

Таким образом, любая задача математической статистики состоит, 

с одной стороны, в уточнении априорных сведений о модели случай-
ного явления (закона распределения или числовых характеристик 
случайной величины), а с другой — в получении информации, необ-
ходимой для принятия решений в условиях неопределенности и ри-
ска [2; 31].

Основное содержание учебника (8 глав) посвящено четырем осно-

вополагающим задачам математической статистики: точечному и 
интервальному оцениванию, проверке статистических гипотез и кор-
реляционно-регрессионному анализу.

Их методы решения должны по возможности удовлетворять двум, 

как правило, противоречивым требованиям: вычислительной прос-
тоте и высокому (оптимальному) качеству. Оба эти требования  
удается выполнить для двух семейств законов распределения: экспо-

ненциальному и hh  (читается: «аш на аш»). Важно подчеркнуть, что 

эти семейства в совокупности охватывают подавляющее большин-
ство практически применяемых законов. Что же касается законов 
распределения, не относящихся к названным семействам, то и они, 
естественно, не остаются без внимания. Однако рекомендуемые ме-
тоды решения задач математической статистики для них имеют за-
частую эвристический характер и не гарантируют оптимальности 
резуль татов.

Отметим некоторые особенности изложения материала по главам.

В главе 1 рассматриваются эмпирические законы распределения 

непрерывных и дискретных случайных величин — как основные 
формы представления результатов наблюдений, а также критерии 
А.Н. Колмогорова и К. Пирсона проверки гипотез о согласованности 
эмпирических и гипотетических законов распределения.

Главы 2–5 посвящены методам построения точечных оценок чи-

словых характеристик случайных величин, параметров законов рас-
пределения и функций от этих параметров. Рассмотрены выбо-
рочный метод и метод моментов (глава 2), достаточных статистик 
построения оптимальных оценок (глава 4) и максимального правдо-
подобия построения асимптотически оптимальных оценок (глава 5). 

В главе 3 вводятся в рассмотрение экспоненциальное и hh -семей-

ства законов распределения; обосновываются их свойства.

Методы интервального оценивания изложены в главе 6. Рассма-

триваются два метода: опорной случайной величины и общий. Опре-
деляются условия, при которых эти методы дают кратчайшие, наи-
кратчайшие и субкратчайшие доверительные интервалы (как точные, 
так и асимптотические).

Наиболее значительная по объему глава 7 посвящена построению 

критериев проверки параметрических гипотез. Для 7 пар гипотез 
обосновываются методы построения оптимальных (субоптимальных) 
критериев, являющихся решением задачи Неймана—Пирсона. При 
наличии мешающих параметров эти критерии, как правило, имеют 
право на существование, но без гарантии оптимальности.

Один из параграфов (7.6) главы 7 посвящен двойственности задач 

интервального оценивания и проверки гипотез (7.7; 7.8). Обосновывается 
алгоритм перехода от критерия (одностороннего или двусто-
роннего) проверки гипотез к доверительному интервалу (односто-
роннему или двустороннему) и наоборот. При этом, если критерий 
является оптимальным в смысле Неймана—Пирсона, то и двойственный 
ему доверительный интервал является оптимальным в том 
же смысле.

В главе 8 излагаются методы оценивания таких характеристик 

стохастической связи случайных величин как коэффициент корреляции (
парный, частный, множественный), корреляционное отношение, 
функция регрессии и основные свойства этих оценок. Одновременно 
в рамках линейного регрессионного анализа рассматриваются 
оценки однофакторной и многофакторной функций 
регрессии и их свойства.

Завершает учебник 12 приложений, в которые вынесены выводы 

некоторых законов распределения, доказательства ряда утверждений 
и некоторые вспомогательные сведения из математического анализа и 
линейной алгебры.

В пособии принята трехзначная нумерация формул, таблиц и ри-

сунков: номер главы, параграфа, формулы (также — рисунка, таб-
лицы). Примеры и задачи имеют порядковую нумерацию в соответ-
ствующих параграфах.

Библиографический список содержит свыше 60 наименований. 

В этот список наряду с серьезными монографиями [4, 5, 30, 32, 33, 35, 
37, 40, 56, 58] и т.д., входят учебные пособия [1, 2, 3, 12, 13, 15, 16, 17, 
20, 21] и даже элементарные брошюры [28, 42, 43, 45, 46] и т.д. Такая 
многоплановая библиография позволит читателю существенно по-
полнить свои знания по тем или иным разделам математической 
статистики; получить ответы на вопросы, оставшиеся после чтения 
предлагаемого учебника, и, наконец, — полезные разъяснения не-
которых математических утверждений.

Автор пользуется приятной возможностью высказать благодар-

ность своим друзьям, коллегам и ученикам за весьма полезные со-
веты, высказанные ими при обсуждении отдельных разделов книги 
и прежде всего канд. техн. наук В.Б. Соломоденко и канд. техн. наук, 
профессору И.М. Гладких.

СПИСОК ПРИНЯТЫХ СОКРАЩЕНИЙ

АДИ — асимптотический доверительный интервал

ВМ — выборочный метод
ВР — вариационный ряд

Д — дисперсия

ДИ — доверительный интервал
ДС — достаточная статистика

ДСВ — дискретная случайная величина

ЗР — закон распределения

ЗР ЭТ — закон распределения экспоненциального типа

КЗ — критическое значение
КК — коэффициент корреляции
КО — критическая область

КОТ — корреляционное отношение
ЛФР — линейная функция регрессии
МВЗ — множество возможных значений
ММ — метод моментов

ММП — метод максимального правдоподобия
МНК — метод наименьших квадратов

МО — математическое ожидание
НСВ — непрерывная случайная величина
ОВР — объединенный вариационный ряд
ОСВ — опорная случайная величина
ПДС — полная достаточная статистика

ПР — плотность распределения
ПС — порядковая статистика

ПСД — преобразование, стабилизирующее дисперсию
ПФМ — производящая функция моментов

РМ — регрессионная модель
СВ — случайная величина

СКО — среднее квадратическое отклонение
СНУ — система нормальных уравнений

УП — уравнение правдоподобия

ТАН — теория асимптотической нормальности
ФМ — функция мощности
ФП — функция правдоподобия
ФР — функция распределения

ФРЕГ — функция регрессии
ЦДИ — центральный доверительный интервал
ЦПТ — центральная предельная теорема

ЧХ — числовая характеристика

ЭПР — эмпирическая (выборочная) плотность распределения
ЭФР — эмпирическая функция распределения

ГЛАВА 1 

ЭМПИРИЧЕСКИЕ И ГИПОТЕТИЧЕСКИЕ 
ЗАКОНЫ РАСПРЕДЕЛЕНИЯ

1.1. 
ОСНОВНЫЕ ПОНЯТИЯ

Исходными данными для любого статистического исследова-

ния являются результаты n-кратного измерения (наблюдения) слу-
чайной величины. На протяжении всей этой книги (за исключением 
главы 8) будем предполагать, что все наблюдения — от 1 до n — осу-
ществляются в неизменных условиях (при неизменном законе рас-
пределения вероятностей) и независимо друг от друга. Эти допуще-
ния позволяют интерпретировать n-кратное наблюдение случайной 
величины x как однократное наблюдение случайного вектора 
ξ
ξ
ξ
1
1
,
,
,
,
n
n
= (
)
 
 

 где xi, ∀i взаимно независимы и одинаково рас-

пределены с функцией распределения Fx(x), т.е. xi являются так на-
зываемыми статистическими копиями случайной величины x. Слу-
чайный вектор x1,n называют априорной выборкой объема (размера) n 
из закона распределения Fx(x). Реализацию этой выборки будем обозначать 
через x
x
x
n
n
1
1
,
,
,
= (
)
 
 

 и называть апостериорной выборкой. 

Очевидно, вектор x1,n детерминирован. Эпитеты «априорная» и «апостериорная» 
часто опускают и, что еще хуже, обе выборки, как и 
функции от них, одинаково обозначают.

Множество x n
1,
{
} называют выборочным пространством. Измеримую [
11, гл. 4], практически кусочно-непрерывную функцию от 

выборки T
n
ξ1,
(
)  или T x n
1,
(
)  называют статистикой (с добавлением, 
при необходимости, эпитетов «априорная» или «апостериорная»). 
Априорная статистика как функция случайного вектора является 
случайной величиной, тогда как апостериорная статистика как 
функция от детерминированного вектора является неслучайной величиной. 
Если статистика T x n
1,
(
)  используется в качестве приближенного 
значения закона распределения F, числовой характеристики 
(ЧХ), параметра закона распределения θ или вообще оцениваемой 
величины t, то она называется оценкой и обозначается, как правило, 
той же буквой, но со звездочкой: F*, ЧХ, θ*, t*. Если оценка t* сходится 
по вероятности [11, гл. 8] к оцениваемой величине t, то она 
называется состоятельной. Несостоятельные оценки обычно не используются.

Если расположить элементы апостериорной выборки в порядке 

их возрастания (неубывания) 

 
x
x
x n
1
2
( )
( )
( )
≤
≤
≤
...
, 
(1.1.1)

то получим апостериорный вариационный ряд. Ему соответствует 
априор ный вариационный ряд

 
ξ
ξ
ξ
1
2
( )
( )
( )
≤
≤
≤
...
,
n
 
(1.1.2)

где ξ
ξ
( )
min
,
1 =

i
i  ξ
ξ
( )
,
( )
min
,
2
1
=

≠
i i
i  …, ξ
ξ
( )
max
.
n
i
i
=

Элементы вариационного ряда называют вариантами, или порядковыми 
статистиками. Индекс (l) — номер варианты в вариационном 
ряду — именуется рангом. Если вариационный ряд содержит n0 
попарно различных вариант, то его можно записать в виде:

 
x
x
x n
1
2
0
( )
( )
(
)
<
<
<
...
,

 
k
k
k n
1
2
0
( )
( )
(
)
≤
≤
≤
...
,

где k i( ) ≥1 — кратность элемента x(i) в выборке, 
k
n
i
i

n

( )
.

=∑
=

1

0

Красивый мысленный эксперимент, поясняющий смысл понятия 

вариационного ряда, рассмотрен в [43]. Представим себе кучу камней, 
каждый из которых характеризуется случайным параметром, 
например, весом x. Из этой кучи выбираются n камней с весами x1, 
x2, …, xn и упорядочиваются x
x
x n
1
2
( )
( )
( )
≤
≤
≤
...
.  Разложим камни  

в n ящиков: камень весом x(1) — в первый ящик, камень весом x(2) — 
во второй и т.д., камень весом x(n) — в ящик n. На каждом ящике 
обозначим ранг положенного в него камня. Повторив всю процедуру 
второй, третий и т.д. раз, мы обнаружим в ящике 1 самые легкие 
камни, в ящике 2 — более тяжелые, а в ящике n — самые тяжелые.

Веса камней одного и того же ранга (т.е. попавшие в ящик с одним 
и тем же номером) необязательно одинаковые. Более того, они 
случайные и подчиняются определенному закону распределения. 
Иначе говоря, они являются значениями некоторой случайной величины, 
называемой априорной порядковой статистикой.

1.2. 
ПОСТРОЕНИЕ ЭМПИРИЧЕСКИХ ЗАКОНОВ РАСПРЕДЕЛЕНИЯ

Предположим, что по выборке из закона распределения 

Fx(x) случайной величины x построен апостериорный вариационный 
ряд

x
x
x n
1
2
0
( )
( )
(
)
<
<
<
...
,

 
k
k
k n
1
2
0
( )
( )
(
)
≤
≤
≤
...
.

По этим данным требуется построить так называемые эмпирические (
выборочные) законы распределения, играющие роль оценок 
истинных (теоретических) законов распределения.

В основе такого построения лежат следующие соображения. Независимость 
наблюдений случайной величины x и неизменность 
условий их проведения позволяют рассматривать процесс наблюдений 
как последовательность испытаний Бернулли. Назовем наблюдение (
испытание) i успешным, если x
A
i( ) ∈
 и неудачным в противном 
случае. Здесь A — некоторое подмножество выборочного 
пространства. Вероятность успешного наблюдения обозначим через 
P(A). В качестве ее оценки естественно принять частоту этого события

 


P
A
v A
n

*
,
( ) =
( )

равную отношению случайного числа успешных наблюдений v(A) к 
общему числу наблюдений n, так как по теореме Бернулли [11, 8.2]

 

P
A
P A
n

p
*
,
( ) →
( )
→∞

т.е. является состоятельной оценкой.

По определению биномиального закона распределения [11, 4.6], 

 
ν A
nP
A
P A
n
( ) =
( ) ∈
( )
(
)
*
,
.
Бин
 
 
(1.2.1)

Апостериорное значение частоты ν( )
A
n
 принимается в качестве 

приближенного значения неизвестной вероятности P(A) события A:

 

P A
K A
n
( ) ≈
( ) .

Перейдем к построению эмпирических законов распределения, 

основанному на получении состоятельных оценок события A, заданного 
в том или ином виде.

Доступ онлайн
от 444 ₽
В корзину