Математическая статистика. Практикум
Математическая статистика для экономистов: практическое руководство
Эта книга представляет собой практическое руководство по математической статистике, разработанное для студентов экономических специальностей. Она охватывает ключевые разделы дисциплины, предлагая как теоретические основы, так и практические примеры с использованием Microsoft Excel и языка R.
Основы и инструменты
В начале книги представлен справочный материал по языку R, включая основные команды, типы данных, операции с векторами и матрицами, а также примеры программирования пользовательских функций. Рассмотрены математические функции, функции округления и комбинаторные формулы, необходимые для работы со статистическими данными.
Обработка и визуализация данных
В книге рассматриваются методы первичной обработки статистических данных, включая построение вариационных и статистических рядов, а также методы визуализации данных, такие как полигоны частот, гистограммы и кумуляты. Подробно описаны способы построения гистограмм в Excel и R, а также методы выявления и обработки выбросов с использованием диаграмм размаха.
Выборочные характеристики и оценка распределений
Рассматриваются выборочные характеристики случайных величин, включая выборочное среднее, дисперсию, стандартное отклонение, медиану, моду, квартили, квантили, коэффициенты асимметрии и эксцесса. Приведены формулы для их вычисления, а также примеры использования в Excel и R. Отдельное внимание уделяется оценке функции распределения и плотности распределения.
Точечное и интервальное оценивание
В книге подробно рассматриваются методы точечного оценивания параметров случайных величин, включая метод моментов и метод максимального правдоподобия. Обсуждаются свойства оценок, такие как несмещенность, состоятельность и эффективность. Также рассматривается интервальное оценивание, включая методы получения доверительных интервалов для математического ожидания, дисперсии и вероятности события.
Проверка статистических гипотез
Рассматриваются методы проверки статистических гипотез, включая критерии согласия (хи-квадрат, Колмогорова), критерии однородности и независимости, а также непараметрические критерии (Уилкоксона и Манна — Уитни). Подробно описываются основные понятия, такие как статистическая гипотеза, ошибки первого и второго рода, наблюдаемый уровень значимости и мощность критерия.
Дисперсионный анализ
В заключительной главе представлено введение в дисперсионный анализ, включая методы однофакторного и двухфакторного дисперсионного анализа и их реализацию в Excel и R.
Текст подготовлен языковой моделью и может содержать неточности.
- ВО - Бакалавриат
- 38.03.01: Экономика
- 38.03.02: Менеджмент
- 38.03.03: Управление персоналом
- 38.03.04: Государственное и муниципальное управление
- 38.03.05: Бизнес-информатика
МАТЕМАТИЧЕСКАЯ СТАТИСТИКА. ПРАКТИКУМ Т.Г. АПАЛЬКОВА В.И. ГЛЕБОВ С.А. ЗАДАДАЕВ С.Я. КРИВОЛАПОВ К.Г. ЛЕВЧЕНКО УЧЕБНОЕ ПОСОБИЕ Москва ИНФРА-М 2025
УДК 519.22(075.8) ББК 22.172я73 А76 Р е ц е н з е н т ы: Н.В. Белотелов, кандидат физико-математических наук, доцент, старший научный сотрудник Федерального исследовательского центра «Информатика и управление» Российской Академии Наук; О.В. Шашков, кандидат физико-математических наук, доцент, доцент департамента математики Финансового университета при Правительстве Российской Федерации ISBN 978-5-16-017913-1 (print) ISBN 978-5-16-110927-4 (online) © Апалькова Т.Г., Глебов В.И., Зададаев С.А., Кривола пов С.Я., Левченко К.Г., 2023 Апалькова Т.Г. А76 Математическая статистика. Практикум : учебное пособие / Т.Г. Апалькова, В.И. Глебов, С.А. Зададаев [и др.]. — Москва : ИНФРА-М, 2025. — 254 с. — (Высшее образование). — DOI 10.12737/1896790. ISBN 978-5-16-017913-1 (print) ISBN 978-5-16-110927-4 (online) В учебном пособии приведены условия задач и решения примеров по основным разделам математической статистики с использованием Microsoft Excel и языка R. Соответствует требованиям федеральных государственных образовательных стандартов высшего образования последнего поколения. Для студентов высших учебных заведений, обучающихся по экономическим специальностям. УДК 519.22(075.8) ББК 22.172я73
Авторский коллектив Финансового университета при Правительстве Российской Федерации Апалькова Тамара Геннадьевна — кандидат экономических наук, доцент, доцент департамента математики. Глебов Владимир Ильич — кандидат физико-математических наук, доцент, доцент департамента математики. Зададаев Сергей Алексеевич — кандидат физико-математических наук, доцент, руководитель департамента математики. Криволапов Сергей Яковлевич — кандидат физико-математических наук, доцент, доцент департамента математики. Левченко Кирилл Геннадиевич — кандидат физико-математических наук, доцент департамента математики.
Основные обозначения ( ) A P — вероятность события A. ( ) | A B P — условная вероятность события A при условии события B. ( ) X F x — функция распределения случайной величины X. ( ) X f x — плотность распределения случайной величины X. ( ) X E — математическое ожидание случайной величины X. 2 ( ), X X σ Var — дисперсия случайной величины X. X σ — стандартное (среднее квадратическое) отклонение случайной величины X. ( ) k X ν — начальный момент k-го порядка случайной величины X. ( ) k X μ — центральный момент k-го порядка случайной величины X. X A — коэффициент асимметрии случайной величины X. X E — коэффициент эксцесса случайной величины X. med x — медиана случайной величины X. mod x — мода случайной величины X. xα — квантиль уровня α случайной величины X. 1 x α −α ω = — 100 % α -ная точка случайной величины X. Bin( ; ) n p — случайная величина, распределенная по биномиальному закону с параметрами n и p. Pois( ) λ — случайная величина, распределенная по закону Пуассона с параметром λ. Geom( ) p — случайная величина, распределенная по геометрическому закону с параметром p. ( ; ) a σ & — случайная величина, распределенная по нормальному закону с параметрами a и σ. zα — квантиль уровня α стандартной нормально распределенной случайной величины X. ( , ) a σ $& — случайная величина, распределенная по логнормальному закону с параметрами a и σ. Unif( ; ) a b — случайная величина, равномерно распределенная на отрезке [ ; ] a b . Exp( ) λ — случайная величина, равномерно распределенная по экспоненциальному закону с параметром λ. n T — случайная величина, распределенная по закону Стьюдента с числом степеней свободы n. ;n tα — квантиль уровня α случайной величины, распределенной по закону Стьюдента с числом степеней свободы n.
2n χ — случайная величина, распределенная по закону хи-квадрат с числом степеней свободы n. 2;n α χ — квантиль уровня α случайной величины, распределенной по закону хи-квадрат с числом степеней свободы n. ;n k F — случайная величина, распределенная по закону Фишера с числом степеней свободы n и k. ; ;n k fα — квантиль уровня α случайной величины, распределенной по закону Фишера с числом степеней свободы n и k. cov( , ) X Y — ковариация случайных величин X и Y. xy r — коэффициент корреляции случайных величин X и Y. ( )i x — элемен ты вариационного ряда. x — выборочное среднее. ( ) 2 2 1 ˆ 1 n i X i x x n = σ = − ∑ — выборочная дисперсия, смещенная оценка дисперсии генеральной совокупности. 2 ˆ ˆ X X σ = + σ — выборочное стандартное отклонение. ( ) 2 2 1 1 1 n i i s x x n = = − −∑ — исправленная (уточненная) выборочная дисперсия, несмещенная оценка дисперсии генеральной совокупности. 2 s s = + — исправленное выборочное стандартное отклонение.
Предисловие Учебное пособие содержит краткие теоретические сведения по основным разделам математической статистики. Каждый раздел снабжен примерами решения задач и содержит большое количество задач для самостоятельного решения. Для задач приведены ответы (если не предполагается случайного ответа). Цель предлагаемого пособия — помочь студентам, изучающим математическую статистику, приобрести навыки применения ее результатов к решению различных прикладных вопросов. Подбор материала является традиционным для курса математической статистики, излагаемого студентам экономических специальностей университетов, и включает предварительную обработку и визуализацию данных, точечное и интервальное оценивание параметров, проверку гипотез, элемен ты дисперсионного анализа. В главе 1 приводится справочный материал о математических средствах языка R, используемых в дальнейшем изложении. В главе 2 рассмотрены методы первичной обработки статистических данных, средства визуализации данных в R и Excel. В главе 3 рассмотрены выборочные характеристики случайных величин, методы получения описательной статистики средствами R и Excel. В главе 4 рассматриваются средства оценивания функции распределения и плотности распределения. Глава 5 посвящена точечному оцениванию основных параметров случайных величин. Подробно рассмотрены свойства получаемых оценок. В главе 6 рассматриваются два основных метода получения точечных оценок: метод момен тов и метод максимального правдоподобия. Глава 7 посвящена интервальному оцениванию. Рассмотрены методы получения интервальных оценок математического ожидания, дисперсии и вероятности события, в том числе с использованием соответствующих функций языка R. В главе 8 рассматриваются методы проверки гипотез. Изучены критерии, касающиеся математического ожидания, дисперсии и вероятности события: критерии согласия (хи-квадрат, Колмогорова, критерии нормальности); критерии однородности (хи-квадрат и Колмогорова — Смирнова) и независимости; непараметрические критерии Уилкоксона и Манна — Уитни. Глава 9 посвящена введению в дисперсионный анализ. Рассмотрены методы однофакторного и двухфакторного дисперсионного анализа и их реализации в Excel и R.
Пособие соответствует требованиям ФГОС ВПО к профессиональным образовательным программам по специальности 38.03.01 «Экономика». Предназначено для студентов экономических специальностей. В результате изучения материалов учебного пособия студент будет: знать • основные понятия теории вероятностей и математической статистики; • методы точечного и интервального оценивания параметров случайных величин; • способы проверки статистических гипотез о параметрах и законах случайных величин; уметь • выбирать вероятностные модели, подходящие для исследования соответствующих случайных признаков; • моделировать с помощью метода статистических испытаний случайные признаки, описывающие статистические системы; • использовать компьютерные технологии при реализации математических методов и моделей; владеть навыками • вычислительной работы в Excel и RStudio.
Глава 1. ВВЕДЕНИЕ В СРЕДСТВА ЯЗЫКА R Установка. Для установки R по ссылке https://cran.r-proect.org скачайте загрузчик R. Для установки RStudio по ссылке https:// www.rstudio.com/products/rstudio/downloads/ скачайте загрузчик RStudio. Оператором комментария является символ решетки #. Строчные и прописные буквы различаются. Для вывода на экран нужно набрать имя переменной или использовать функцию печать print(). Для вывода справки о функции с именем F — набрать ?F. Загрузка библиотек. Библиотеки, отсутствующие в базовой версии языка, необходимо установить один раз для каждого компьютера. Например, требуется библиотека Matrix. Команда для установки — install.packages("Matrix"). В дальнейшем всякий раз, когда нужно использовать этот пакет, необходимо в начале сессии запускать команду активации: library(Matrix). Арифметические операции. Присваивание: x < –10 или x = 10. Сложение, вычитание, умножение, деление, возведение в степень: +, −, *, /, ^. Целочисленное деление: целая часть — %/%; остаток от деления — %%. Типы данных. Логические (logical): TRUE — истина; FALSE — ложь. Проверка на равенство: ==. Пример 1.1 a <- 5 a == 4 FALSE Целочисленные (integer). Вещественные числа (numeric). Комплексные числа (complex). Текстовые (character). Списки (list). Проверить тип. Пример 1.2 x <- 1:7 is.integer(x) TRUE
Векторы. Могут содержать данные только одного типа. Способы задания векторов 1. Функция c(). Пример 1.3 c(1,3,7) print(c) 1,3,7 2. Совокупность последовательных целых чисел. Пример 1.4 1:10 1 2 3 4 5 6 7 8 9 10 5:0 5 4 3 2 1 0 3. Функция seq(from, to, by). Пример 1.5 seq(2, 14, 3) 2 5 8 11 14 4. Совокупность одинаковых чисел: rep(x, times). Пример 1.6 rep(0,5) 0 0 0 0 0 Индексирование Пример 1.7 a <- 11:20 print(a[3]) 13 print(a[6:8]) 16 17 18 print(a(c(2,4,6))) 12 14 16 Все, кроме первых пяти: print(a[−c(1:5)]) 16 17 18 19 20
С помощью условного оператора: print(a[a > 18]) 19 20 print(a[a > 10 & a < 15]) # & — ɥɨɝɢɱɟɫɤɨɟ "ɂ". 11 12 13 14 print(a[a == 12 | a == 20]) # | — ɥɨɝɢɱɟɫɤɨɟ "ɂɅɂ". 12 20 Атрибуты вектора Тип данных — функция mode(). Длина вектора — функция length(). Пример 1.8 a <- c(1,4,8) mode(a) "numeric" length(a) 3 Действия над векторами. Арифметические операции выполняются почленно: a <- c(1,2,3) b <- c(5,0,-1) print(a+b) 6 2 2 print(a*b) 5 0 -3 print(2^b) 32.0 1.0 0.5 Скалярное произведение векторов: crossprod(a,b) 2 Сортировка — функция sort() Пример 1.9 a <- c(7,3,5,9,6,3,4) b <- sort(a) print(b) 3 3 4 5 6 7 9 c <- sort(a, decreasing=TRUE) # ȼ ɩɨɪɹɞɤɟ # ɭɛɵɜɚɧɢɹ print(c) 9 7 6 5 4 3 3