Книжная полка Сохранить
Размер шрифта:
А
А
А
|  Шрифт:
Arial
Times
|  Интервал:
Стандартный
Средний
Большой
|  Цвет сайта:
Ц
Ц
Ц
Ц
Ц

Основы математической статистики

Покупка
Основная коллекция
Артикул: 205400.05.01
Доступ онлайн
от 444 ₽
В корзину
В основу учебника положен семестровый курс лекций и практических занятий по математической статистике для студентов экономико-математического факультета РЭУ им. Г.В.Плеханова. Рассматриваются теория математической статистики и ее основные задачи; точечного и интервального оценивания, проверки статистических гипотез; корреляционно-регрессионный анализ и др. Все главы содержат примеры и задачи с решениями для самостоятельной работы. Отдельно приводится раздел с задачами для самостоятельного решения. Для студентов, аспирантов, специалистов-практиков и научных работников экономико-математического и общеэкономических специальностей.

Только для владельцев печатной версии книги: чтобы получить доступ к дополнительным материалам, пожалуйста, введите последнее слово на странице №257 Вашего печатного экземпляра.

Соколов, Г. А. Основы математической статистики : учебник / Г.А. Соколов. — 2-е изд. — Москва : ИНФРА-М, 2022. — 368 с. + Доп. материалы [Электронный ресурс].— (Высшее образование: Бакалавриат). — DOI 10.12737/3072. - ISBN 978-5-16-006729-2. - Текст : электронный. - URL: https://znanium.com/catalog/product/1844288 (дата обращения: 22.11.2024). – Режим доступа: по подписке.
Фрагмент текстового слоя документа размещен для индексирующих роботов
ОСНОВЫ
МАТЕМАТИЧЕСКОЙ
СТАТИСТИКИ

Москва
ИНФРА-М
2022

Г.А. СОКОЛОВ

Рекомендовано учебно-методическим объединением
по образованию в области статистики и математических методов
в экономике в качестве учебника для студентов высших учебных 
заведений, обучающихся по направлению 38.03.01 «Экономика»

УЧЕБНИК

Второе издание

УДК 519.2(075.8)
ББК 22.172я73
       С 59

Р е ц е н з е н т ы : 
О.А. Косоруков, доктор технических наук, профессор Российского экономического университета им. Г.В. Плеханова;
Н.Г. Назаров, доктор технических наук, профессор Технического университета им. Н.Э. Баумана

А в т о р 
Соколов Григорий Андреевич, доктор технических наук, профессор, 
преподаватель Российского экономического университета им. Г.В. Плеханова

Соколов Г.А.
С 59 
  Основы математической статистики : учебник / Г.А. Соколов. — 
2-е изд. — Москва : ИНФРА-М, 2022. — 368 с. + Доп. материалы 
[Электронный ресурс].— (Высшее образование: Бакалавриат). — DOI 
10.12737/3072.

ISBN 978-5-16-006729-2 (print)
ISBN 978-5-16-101131-7 (online)

В основу учебника положен семестровый курс лекций и практических занятий по математической статистике для студентов экономикоматематического факультета РЭУ им. Г.В. Плеханова. Рассматриваются 
теория математической статистики и ее основные задачи; точечного и интервального оценивания, проверки статистических гипотез; корреляционнорегрессионный анализ и др. Все главы содержат примеры и задачи с решениями для самостоятельной работы. Отдельно приводится раздел с задачами 
для самостоятельного решения.
Для студентов, аспирантов, специалистов-практиков и научных работников 
экономико-математического и общеэкономических специальностей.

УДК 519.2(075.8)
ББК 22.172я73

ISBN 978-5-16-006729-2 (print)
ISBN 978-5-16-101131-7 (online)

ФЗ 
№ 436-ФЗ
Издание не подлежит маркировке 
в соответствии с п. 1 ч. 4 ст. 11

© Соколов Г.А., 2014

Материалы, отмеченные знаком 
, доступны 
в электронно-библиотечной системе Znanium.com

ПРЕДИСЛОВИЕ

В основу данного учебника положен курс математической ста
тистики, разработанный автором для студентов экономико-математического факультета РЭУ им. Г.В. Плеханова. Курс читается студентам этого факультета уже более 20 лет и из года в год непрерывно 
совершенствуется.

В 2002 г. преподаватели кафедры высшей математики РЭУ Соко
лов Г.А. и Гладких И.М. написали, а в 2004 г. издательство «Экзамен» 
выпустило учебник «Математическая статистика».

Авторы ставили перед собой цель предложить учебник для на
чального, но достаточно серьезного изучения математической статистики студентам, имеющим подготовку по курсам высшей математики и теории вероятностей в объеме стандартных программ этих 
курсов. Прошедшие годы показали, что надежды авторов оправдались сполна. Студенты прошлых лет приступали к диссертации или 
отправлялись за рубеж вместе с нашей книгой, а сегодняшние уже 
не могут ее купить. Настоящая книга написана по инициативе издательства «ИНФРА-М» на базе действующего (текущего) курса с учетом преемственности и углубления предыдущего.

В последние годы произошли значительные изменения в тре
бованиях к уровню обучения студентов, поскольку теперь в вузах 
готовят бакалавров (а не специалистов) в полном соответствии  
с требованиями компетенции. В предлагаемом учебнике учтены 
особенности текущей программы бакалавриата, исправлены неточности и неоднозначности формулировок, упрощены доказательства неко то рых математических утверждений. В настоящем 
учебнике особенностям практического решения задач уделяется 
не меньшее внимание, чем обоснованию методов их решения: 
подробно проанализировано решение более 200 примеров и свыше 
140 задач рекомендовано для самостоятельного решения. Все это 
предоставляет заинтересованным и «продвинутым» студентам более широкие возможности для самостоятельного изучения предмета.

Предлагаемый учебник можно рассматривать как естественное 

продолжение учебника по теории вероятностей [11], поскольку 
теория вероятностей и математическая статистика представляют собой две стороны одной медали. В теории вероятностей изучаются 
методы анализа массовых случайных явлений в предположении, что 
модели этих явлений известны полностью, а источником этого знания в большинстве случаев является математическая статистика, 

которая предполагает, что модель случайного явления известна лишь 
частично. Это незнание может варьировать в очень широких пределах и, как следствие, порождает великое многообразие задач, решаемых теоретико-вероятностными методами.

Приведем два примера в каком-то смысле противоположных за
дач. Рассматривается так называемая непараметрическая модель, т.е. 

семейство непрерывных функций F x
( )
{
},  удовлетворяющих ха
рактеристическим свойствам функции распределения. Требуется 
построить последнюю с тем или иным приближением. Второй пример: рассматривается так называемая параметрическая модель, т.е. 

семейство непрерывных функций F x θ
(
)
{
},  известных с точностью 

до значения параметра θ, равного либо θ1, либо θ2, θ2 ≠ θ1. Требуется 
с той или иной достоверностью определить, какому из этих значений 
равен неизвестный параметр θ.

Исходными данными для решения любых задач математической 

статистики служат результаты многократного наблюдения (измерения) случайной величины.

Таким образом, любая задача математической статистики состоит, 

с одной стороны, в уточнении априорных сведений о модели случайного явления (закона распределения или числовых характеристик 
случайной величины), а с другой — в получении информации, необходимой для принятия решений в условиях неопределенности и риска [2; 31].

Основное содержание учебника (8 глав) посвящено четырем осно
вополагающим задачам математической статистики: точечному и 
интервальному оцениванию, проверке статистических гипотез и корреляционно-регрессионному анализу.

Их методы решения должны по возможности удовлетворять двум, 

как правило, противоречивым требованиям: вычислительной простоте и высокому (оптимальному) качеству. Оба эти требования  
удается выполнить для двух семейств законов распределения: экспо
ненциальному и hh  (читается: «аш на аш»). Важно подчеркнуть, что 

эти семейства в совокупности охватывают подавляющее большинство практически применяемых законов. Что же касается законов 
распределения, не относящихся к названным семействам, то и они, 
естественно, не остаются без внимания. Однако рекомендуемые методы решения задач математической статистики для них имеют зачастую эвристический характер и не гарантируют оптимальности 
резуль татов.

Отметим некоторые особенности изложения материала по главам.

В главе 1 рассматриваются эмпирические законы распределения 

непрерывных и дискретных случайных величин — как основные 
формы представления результатов наблюдений, а также критерии 
А.Н. Колмогорова и К. Пирсона проверки гипотез о согласованности 
эмпирических и гипотетических законов распределения.

Главы 2–5 посвящены методам построения точечных оценок чи
словых характеристик случайных величин, параметров законов распределения и функций от этих параметров. Рассмотрены выборочный метод и метод моментов (глава 2), достаточных статистик 
построения оптимальных оценок (глава 4) и максимального правдоподобия построения асимптотически оптимальных оценок (глава 5). 

В главе 3 вводятся в рассмотрение экспоненциальное и hh -семей
ства законов распределения; обосновываются их свойства.

Методы интервального оценивания изложены в главе 6. Рассма
триваются два метода: опорной случайной величины и общий. Определяются условия, при которых эти методы дают кратчайшие, наикратчайшие и субкратчайшие доверительные интервалы (как точные, 
так и асимптотические).

Наиболее значительная по объему глава 7 посвящена построению 

критериев проверки параметрических гипотез. Для 7 пар гипотез 
обосновываются методы построения оптимальных (субоптимальных) 
критериев, являющихся решением задачи Неймана—Пирсона. При 
наличии мешающих параметров эти критерии, как правило, имеют 
право на существование, но без гарантии оптимальности.

Один из параграфов (7.6) главы 7 посвящен двойственности задач 

интервального оценивания и проверки гипотез (7.7; 7.8). Обосновывается алгоритм перехода от критерия (одностороннего или двустороннего) проверки гипотез к доверительному интервалу (одностороннему или двустороннему) и наоборот. При этом, если критерий 
является оптимальным в смысле Неймана—Пирсона, то и двойственный ему доверительный интервал является оптимальным в том 
же смысле.

В главе 8 излагаются методы оценивания таких характеристик 

стохастической связи случайных величин как коэффициент корреляции (парный, частный, множественный), корреляционное отношение, функция регрессии и основные свойства этих оценок. Одновременно в рамках линейного регрессионного анализа рассматриваются оценки однофакторной и многофакторной функций 
регрессии и их свойства.

Завершает учебник 12 приложений, в которые вынесены выводы 

некоторых законов распределения, доказательства ряда утверждений 
и некоторые вспомогательные сведения из математического анализа и 
линейной алгебры.

В пособии принята трехзначная нумерация формул, таблиц и ри
сунков: номер главы, параграфа, формулы (также — рисунка, таблицы). Примеры и задачи имеют порядковую нумерацию в соответствующих параграфах.

Библиографический список содержит свыше 60 наименований. 

В этот список наряду с серьезными монографиями [4, 5, 30, 32, 33, 35, 
37, 40, 56, 58] и т.д., входят учебные пособия [1, 2, 3, 12, 13, 15, 16, 17, 
20, 21] и даже элементарные брошюры [28, 42, 43, 45, 46] и т.д. Такая 
многоплановая библиография позволит читателю существенно пополнить свои знания по тем или иным разделам математической 
статистики; получить ответы на вопросы, оставшиеся после чтения 
предлагаемого учебника, и, наконец, — полезные разъяснения некоторых математических утверждений.

Автор пользуется приятной возможностью высказать благодар
ность своим друзьям, коллегам и ученикам за весьма полезные советы, высказанные ими при обсуждении отдельных разделов книги 
и прежде всего канд. техн. наук В.Б. Соломоденко и канд. техн. наук, 
профессору И.М. Гладких.

СПИСОК ПРИНЯТЫХ СОКРАЩЕНИЙ

АДИ — асимптотический доверительный интервал

ВМ — выборочный метод
ВР — вариационный ряд

Д — дисперсия

ДИ — доверительный интервал
ДС — достаточная статистика

ДСВ — дискретная случайная величина

ЗР — закон распределения

ЗР ЭТ — закон распределения экспоненциального типа

КЗ — критическое значение
КК — коэффициент корреляции
КО — критическая область

КОТ — корреляционное отношение
ЛФР — линейная функция регрессии
МВЗ — множество возможных значений
ММ — метод моментов

ММП — метод максимального правдоподобия
МНК — метод наименьших квадратов

МО — математическое ожидание
НСВ — непрерывная случайная величина
ОВР — объединенный вариационный ряд
ОСВ — опорная случайная величина
ПДС — полная достаточная статистика

ПР — плотность распределения
ПС — порядковая статистика

ПСД — преобразование, стабилизирующее дисперсию
ПФМ — производящая функция моментов

РМ — регрессионная модель
СВ — случайная величина

СКО — среднее квадратическое отклонение
СНУ — система нормальных уравнений

УП — уравнение правдоподобия

ТАН — теория асимптотической нормальности
ФМ — функция мощности
ФП — функция правдоподобия
ФР — функция распределения

ФРЕГ — функция регрессии
ЦДИ — центральный доверительный интервал
ЦПТ — центральная предельная теорема

ЧХ — числовая характеристика

ЭПР — эмпирическая (выборочная) плотность распределения
ЭФР — эмпирическая функция распределения

ГЛАВА 1 

ЭМПИРИЧЕСКИЕ И ГИПОТЕТИЧЕСКИЕ 
ЗАКОНЫ РАСПРЕДЕЛЕНИЯ

1.1. 
ОСНОВНЫЕ ПОНЯТИЯ

Исходными данными для любого статистического исследова
ния являются результаты n-кратного измерения (наблюдения) случайной величины. На протяжении всей этой книги (за исключением 
главы 8) будем предполагать, что все наблюдения — от 1 до n — осуществляются в неизменных условиях (при неизменном законе распределения вероятностей) и независимо друг от друга. Эти допущения позволяют интерпретировать n-кратное наблюдение случайной 
величины x как однократное наблюдение случайного вектора 
ξ
ξ
ξ
1
1
,
,
,
,
n
n
= (
)
 
 

 где xi, ∀i взаимно независимы и одинаково рас
пределены с функцией распределения Fx(x), т.е. xi являются так называемыми статистическими копиями случайной величины x. Случайный вектор x1,n называют априорной выборкой объема (размера) n 
из закона распределения Fx(x). Реализацию этой выборки будем обозначать через x
x
x
n
n
1
1
,
,
,
= (
)
 
 

 и называть апостериорной выборкой. 

Очевидно, вектор x1,n детерминирован. Эпитеты «априорная» и «апостериорная» часто опускают и, что еще хуже, обе выборки, как и 
функции от них, одинаково обозначают.

Множество x n
1,
{
} называют выборочным пространством. Изме
римую [11, гл. 4], практически кусочно-непрерывную функцию от 

выборки T
n
ξ1,
(
)  или T x n
1,
(
)  называют статистикой (с добавле
нием, при необходимости, эпитетов «априорная» или «апостериорная»). Априорная статистика как функция случайного вектора является случайной величиной, тогда как апостериорная статистика как 
функция от детерминированного вектора является неслучайной ве
личиной. Если статистика T x n
1,
(
)  используется в качестве прибли
женного значения закона распределения F, числовой характеристики 
(ЧХ), параметра закона распределения θ или вообще оцениваемой 
величины t, то она называется оценкой и обозначается, как правило, 
той же буквой, но со звездочкой: F*, ЧХ, θ*, t*. Если оценка t* сходится по вероятности [11, гл. 8] к оцениваемой величине t, то она 
называется состоятельной. Несостоятельные оценки обычно не используются.

Если расположить элементы апостериорной выборки в порядке 

их возрастания (неубывания) 

 
x
x
x n
1
2
( )
( )
( )
≤
≤
≤
...
, 
(1.1.1)

то получим апостериорный вариационный ряд. Ему соответствует 
априор ный вариационный ряд

 
ξ
ξ
ξ
1
2
( )
( )
( )
≤
≤
≤
...
,
n
 
(1.1.2)

где ξ
ξ
( )
min
,
1 =

i
i  ξ
ξ
( )
,
( )
min
,
2
1
=

≠
i i
i  …, ξ
ξ
( )
max
.
n
i
i
=

Элементы вариационного ряда называют вариантами, или поряд
ковыми статистиками. Индекс (l) — номер варианты в вариационном ряду — именуется рангом. Если вариационный ряд содержит n0 
попарно различных вариант, то его можно записать в виде:

 
x
x
x n
1
2
0
( )
( )
(
)
<
<
<
...
,

 
k
k
k n
1
2
0
( )
( )
(
)
≤
≤
≤
...
,

где k i( ) ≥1 — кратность элемента x(i) в выборке, 
k
n
i
i

n

( )
.

=∑
=

1

0

Красивый мысленный эксперимент, поясняющий смысл понятия 

вариационного ряда, рассмотрен в [43]. Представим себе кучу камней, каждый из которых характеризуется случайным параметром, 
например, весом x. Из этой кучи выбираются n камней с весами x1, 
x2, …, xn и упорядочиваются x
x
x n
1
2
( )
( )
( )
≤
≤
≤
...
.  Разложим камни  

в n ящиков: камень весом x(1) — в первый ящик, камень весом x(2) — 
во второй и т.д., камень весом x(n) — в ящик n. На каждом ящике 
обозначим ранг положенного в него камня. Повторив всю процедуру 
второй, третий и т.д. раз, мы обнаружим в ящике 1 самые легкие 
камни, в ящике 2 — более тяжелые, а в ящике n — самые тяжелые.

Веса камней одного и того же ранга (т.е. попавшие в ящик с од
ним и тем же номером) необязательно одинаковые. Более того, они 
случайные и подчиняются определенному закону распределения. 
Иначе говоря, они являются значениями некоторой случайной величины, называемой априорной порядковой статистикой.

1.2. 
ПОСТРОЕНИЕ ЭМПИРИЧЕСКИХ ЗАКОНОВ РАСПРЕДЕЛЕНИЯ

Предположим, что по выборке из закона распределения 

Fx(x) случайной величины x построен апостериорный вариационный ряд

x
x
x n
1
2
0
( )
( )
(
)
<
<
<
...
,

 
k
k
k n
1
2
0
( )
( )
(
)
≤
≤
≤
...
.

По этим данным требуется построить так называемые эмпириче
ские (выборочные) законы распределения, играющие роль оценок 
истинных (теоретических) законов распределения.

В основе такого построения лежат следующие соображения. Не
зависимость наблюдений случайной величины x и неизменность 
условий их проведения позволяют рассматривать процесс наблюдений как последовательность испытаний Бернулли. Назовем наблюдение (испытание) i успешным, если x
A
i( ) ∈
 и неудачным в про
тивном случае. Здесь A — некоторое подмножество выборочного 
пространства. Вероятность успешного наблюдения обозначим через 
P(A). В качестве ее оценки естественно принять частоту этого события

 

P
A
v A
n

*
,
( ) =
( )

равную отношению случайного числа успешных наблюдений v(A) к 
общему числу наблюдений n, так как по теореме Бернулли [11, 8.2]

 

P
A
P A
n

p
*
,
( ) →
( )
→∞

т.е. является состоятельной оценкой.

По определению биномиального закона распределения [11, 4.6], 

 
ν A
nP
A
P A
n
( ) =
( ) ∈
( )
(
)
*
,
.
Бин
 
 
(1.2.1)

Апостериорное значение частоты ν( )
A
n
 принимается в качестве 

приближенного значения неизвестной вероятности P(A) события A:

 

P A
K A
n
( ) ≈
( ) .

Перейдем к построению эмпирических законов распределения, 

основанному на получении состоятельных оценок события A, заданного в том или ином виде.

Доступ онлайн
от 444 ₽
В корзину