Статистика (компьютеризированный курс)
Покупка
Основная коллекция
Тематика:
Социальная статистика
Издательство:
Российский государственный университет правосудия
Авторы:
Ловцов Дмитрий Анатольевич, Богданова Марина Валерьевна, Лобан Анатолий Владимирович, Паршинцева Лидия Сергеевна
Год издания: 2020
Кол-во страниц: 400
Дополнительно
Вид издания:
Учебник
Уровень образования:
ВО - Бакалавриат
ISBN: 978-5-93916-834-2
Артикул: 761732.01.99
В учебнике рассматриваются: предмет и организация современной статистики, основные статистические (математические) компьютеризированные методики, методы, модели и алгоритмы, а также раскрывается их применение в социально-экономической и правовой практике на основе использования стандартизованных программных средств информационно-компьютерных технологий. Содержание учебника отвечает требованиям ФГОС высшего образования по направлениям подготовки «Экономика», «Менеджмент», «Государственное и муниципальное управление». Предназначен для обучающихся по программам бакалавриата, а также может быть полезным для магистрантов, аспирантов, преподавателей и специалистов-практиков в области статистики.
Тематика:
ББК:
УДК:
ОКСО:
- ВО - Бакалавриат
- 38.03.01: Экономика
- 38.03.02: Менеджмент
- 38.03.04: Государственное и муниципальное управление
ГРНТИ:
Скопировать запись
Фрагмент текстового слоя документа размещен для индексирующих роботов
СТАТИСТИКА (КомпьюТерИзИровАнный КурС) учебник под редакцией профессора Д. А. Ловцова Москва 2020 федеральное государственное бюджетное образовательное учреждение высшего образования российский государственный университет правосудия
УДК 311 ББК 60.6 С 78 С 78 ISBN 978-5-93916-834-2 © Коллектив авторов, 2020 © Российский государственный университет правосудия, 2020 В учебнике рассматриваются: предмет и организация современной статистики, основные статистические (математические) компьютеризированные методики, методы, модели и алгоритмы, а также раскрывается их применение в социально-экономической и правовой практике на основе использования стандартизованных программных средств информационно-компьютерных технологий. Содержание учебника отвечает требованиям ФГОС высшего образования по направлениям подготовки «Экономика», «Менеджмент», «Государственное и муниципальное управление». Предназначен для обучающихся по программам бакалавриата, а также может быть полезным для магистрантов, аспирантов, преподавателей и специалистов-практиков в области статистики. Ловцов Д. А., Богданова М. В., Лобан А. В., Паршинцева Л. С. Статистика (компьютеризированный курс): учебник для вузов / Под ред. проф. Д. А. Ловцова. — М.: РГУП, 2020. — 400 с. ISBN 978-5-93916-834-2 А в т о р ы: Д. А. Ловцов (руководитель), зав кафедрой информационного права, информатики и математики РГУП, д-р техн. наук, профессор, Заслуженный деятель науки Российской Федерации; М. В. Богданова, профессор кафедры информационного права, информатики и математики РГУП, д-р экон. наук, доцент; А. В. Лобан, канд. техн. наук, доцент; Л. С. Паршинцева, доцент кафедры информационного права, информатики и математики РГУП, канд. экон. наук, доцент. Р е ц е н з е н т ы: В. А. Дементьев, д-р техн. наук, профессор, академик РАРАН (Институт точной механики и вычислительной техники РАН); В. А. Чевычелов, профессор кафедры экономики РГУП, д-р экон. наук, профессор.
Содержание Введение . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 Глава 1. Архитектура современной статистики. . . . . . . . . . . . . . . . . . . . . . . . . . 12 1.1. Определение, предмет и организация статистики. . . . . . . . . . . . . . . . . . 12 1.2. Основные функции и задачи государственной статистики. . . . . . . . . . 16 1.3. Структура, показатели и методы статистики . . . . . . . . . . . . . . . . . . . . . . 22 1.4. Отрасли и разделы правовой статистики. . . . . . . . . . . . . . . . . . . . . . . . . . 29 1.5. Поиск статистических данных с использованием информационно-компьютерных систем Росстата. . . . . . . . . . . . . . . . . . . . . . 32 Глава 2. Универсальные средства статистических исследований . . . . . . . . . 40 2.1. Инструменты статистической обработки и визуализации данных. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40 2.2. Основы работы в интегрированной среде разработки RStudio. . . . . . . 54 2.3. Введение в язык R статистической обработки данных. . . . . . . . . . . . . . 73 2.4. Информационные структуры статистического анализа . . . . . . . . . . . . 81 2.5. Ввод и вывод данных в среде программирования R . . . . . . . . . . . . . . . . 98 2.6. Управление данными с помощью среды R . . . . . . . . . . . . . . . . . . . . . . . .106 2.7. Графическое представление данных в среде R. . . . . . . . . . . . . . . . . . . . .111 2.8. Описательная статистика в среде R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .120 Глава 3. Статистическое наблюдение — первая стадия статистического исследования. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .124 3.1. Требования и этапы статистического наблюдения . . . . . . . . . . . . . . . .124 3.2. Программно-методические и организационно-контрольные аспекты статистического наблюдения . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .125 3.3. Виды и формы статистического наблюдения . . . . . . . . . . . . . . . . . . . . .129 3.4. Правовое и организационное обеспечение ведения судебной статистики . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .133 3.5. Первичный статистический учет: документы и программный комплекс . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .135 3.6. Управление данными с использованием прикладных программ Excel и Gretl. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .138 Глава 4. Статистическая сводка — начальный этап обобщения статистических данных . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .156 4.1. Систематизация и группировка данных. . . . . . . . . . . . . . . . . . . . . . . . . .156 4.2. Выполнение статистической сводки с использованием прикладных программ Excel и Gretl. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .168
Статистика 4 4.3. Графический метод анализа статистических данных с использованием прикладных программ Excel и Gretl. . . . . . . . . . . . . . . . .175 Глава 5. Обобщающие статистические показатели . . . . . . . . . . . . . . . . . . . . .192 5.1. Абсолютные величины . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .192 5.2. Относительные величины и их применение . . . . . . . . . . . . . . . . . . . . . .192 5.3. Средние величины . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .198 5.4. Структурные позиционные средние . . . . . . . . . . . . . . . . . . . . . . . . . . . . .201 5.5. Расчет обобщающих характеристик с использованием прикладных программ Excel и Gretl. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .202 Глава 6. Статистические распределения и их основные характеристики . . .207 6.1. Вариация признака в совокупности и значение ее изучения . . . . . . .207 6.2. Показатели центра распределения . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .208 6.3. Показатели вариации признака. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .210 6.4. Правило сложения дисперсий . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .213 6.5. Построение рядов распределения и расчет основных характеристик с использованием прикладных программ Excel и Gretl. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .215 Глава 7. Выборочное статистическое наблюдение . . . . . . . . . . . . . . . . . . . . . .244 7.1. Понятие выборочного наблюдения и его особенности . . . . . . . . . . . .244 7.2. Простая случайная выборка . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .245 7.3. Способы организации выборочного наблюдения . . . . . . . . . . . . . . . . .251 7.4. Проведение выборочного наблюдения и проверка гипотез с использованием прикладных программ Excel и Gretl. . . . . . . . . . . . . . . . .254 Глава 8. Основы корреляционно-регрессионного анализа волатильности. . .264 8.1. Понятие корреляционной связи . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .264 8.2. Этапы корреляционного анализа . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .265 8.3. Уравнение регрессии . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .274 8.4. Изучение корреляционных связей с использованием прикладных программ Excel и Gretl . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .278 Глава 9. Временные ряды . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .299 9.1. Виды и правила построения временных рядов. . . . . . . . . . . . . . . . . . . .299 9.2. Основные показатели динамики и методы их расчета . . . . . . . . . . . . .305 9.3. Компоненты временного ряда и его автокорреляционная функция . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .317 9.4. Теоретические основы моделирования временных рядов и прогнозирования . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .324 9.5. Моделирование временных рядов и прогнозирование с использованием прикладных программ Excel и Gretl. . . . . . . . . . . . . . . . .369 Литература. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .389 Приложение 1. Значения верхнего α процентного предела 2 χ α в зависимости от вероятности 2 2 ( ) P χ χ α > и числа степеней свободы 2 χ -распределения . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .391
Содержание Приложение 2. Таблица значений F-критерия Фишера при уровне значимости 0,05 α = . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .393 Приложение 3. Значения α-процентных пределов tα; k в зависимости от k степеней свободы и заданного уровня значимости α для распределения Стьюдента . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .395 Приложение 4. Система нормальных уравнений для нахождения параметров уравнений . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .397 Приложение 5. Значения dl и du критерия Дарбина-Уотсона на уровне значимости 0,05 α = (n — количество наблюдений; k — число переменных). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .398
Введение Развитие рыночной экономики в условиях построения информационного общества и глобальной цифровизации повышает требования к уровню статистической подготовки будущих экономистов, менеджеров, юристов, предпринимателей и др. Овладевая методами компьютеризированных статистических исследований, они могут более эффективно изучать тенденции рыночной конъюнктуры товаров и услуг для последующего принятия наиболее обоснованных (оптимальных) решений в сфере своей деятельности, в частности, в области имущественных отношений. Современная статистическая наука, во многом соблюдая преемственность, опирается на все достижения научно-технического прогресса и прежде всего на стремительно развивающиеся новые информационно-компьютерные технологии (ИКТ). Педагогическая эффективность изучения статистики в настоящее время напрямую зависит от уровня компьютеризации процесса обучения и внедрения учебных материалов нового типа — электронных или компьютеризированных. Статистика для экономистов, менеджеров и юристов — инструмент, позволяющий производить анализ осведомляющей (измерительной, контрольной, сигнальной) и другой информации и прогнозировать поведение объекта регулирования. Для овладения этим инструментом необходимо изучить предмет и методическую основу статистической науки. Впервые термин «статистика» (от лат. status — состояние, положение; итал. stato — государство и statista — знаток государства) был использован немецким ученым Готфридом Ахенвалем (1719–1772) в труде по государствоведению, выпущенном в 1749 г. Вместе с тем функции, выполняемые статистикой, известны давно, например, древнегреческий философ и ученый Аристотель (384–322 до н. э.) составил подробное численное описание большого числа государств и городов, включая их население, территории, земли и др. Проводились переписи населения в Древнем Китае, осуществлялось сравнение военного потенциала государств, велся учет имущества граждан в Древнем Риме и др. Первая
Введение 7 перепись на территории Руси была проведена монголами в 1245 г. в Киеве с целью наложения дани. Достаточно долгое время статистика была синонимом государствоведения. В конце XIX в. понятие «статистика» существенно расширилось и углубилось. Методы, основанные на теории вероятностей, нашли применение при исследовании социально-экономических явлений и процессов, в частности, уровня интенсификации производства, уровня жизни населения и его динамики, покупательского спроса, оплаты труда, производства и качества продукции и др. В России заметный вклад в развитие статистики внесли известные ученые В. Н. Татищев (1686–1750), М. В. Ломоносов (1711–1765), П. П. Чебышев (1821–1894), Н. А. Марков (1856–1922), A. M. Ляпунов (1857–1919) и др. В настоящее время статистика — интегрированная наука («мультидисциплина»), которая методами теории вероятностей и математической статистики изучает количественные стороны массовых явлений в конкретных условиях места и времени, помогая обнаруживать статистические тенденции и даже закономерности различных процессов общественной жизни и принимать соответствующие обоснованные управленческие решения [11, 12, 16]. Основными теоретическими и прикладными отраслями (направлениями, дисциплинами) современной статистической науки являются следующие: y общая статистика (теория статистики) — самостоятельная научная дисциплина, разрабатывающая и систематизирующая общие понятия, категории, принципы, приемы, формально-математические методы статистического исследования естественнонаучных и общественных явлений и модели, предназначенные для организации, сбора, стандартной записи, систематизации и обработки (главным образом, с помощью ИКТ [10, 20]) статистических данных с целью их удобного представления, интеграции и получения тем самым научных и практических выводов [7, 18, 28, 29]; y математическая статистика — раздел математики, изучающий и разрабатывающий формально-математические методы систематизации, обработки и исследования статистических данных (является источником развития формально-математического аппарата общей статистики) [9]; y экономическая статистика — дисциплина, изучающая явления и процессы в области национальной экономики (структуру, пропорции,
Статистика 8 взаимосвязи производственных отраслей и элементов общественного воспроизводства, особенности распределения производительных сил; материальных, трудовых и финансовых ресурсов и др.) и разрабатывающая систему показателей, характеризующих ее состояние [14, 17, 27]; y социальная статистика (включая юридическую статистику [13, 22, 24, 26]) — дисциплина, изучающая население, социальные явления и процессы, которые характеризуют условия жизнедеятельности людей, их взаимоотношения в процессе труда и в непроизводственной деятельности и разрабатывающая систему показателей, отражающих различные аспекты социальных отношений [27]; y эконометрика и высшие методы статистики — одно из направлений экономико-математических методов анализа (например, регрессионного, временных рядов и др.), которое заключается в статистическом измерении (оценивании) параметров математических выражений, характеризующих некоторую экономическую концепцию о взаимосвязи и развитии регулируемого объекта, явления, и в применении полученных таким путем эконометрических моделей для конкретных экономических выводов и др. [31]. Статистическая информация является важнейшей составной частью государственного информационного ресурса [10]. При этом представляется актуальным для всех будущих специалистов социально-гуманитарной сферы деятельности овладение методами правовой статистики. Правовая статистика играет важную роль в комплексном исследовании деликтности (от лат. delictum — нарушение, проступок) или правонарушаемости, преступности, судимости и других массовых юридически значимых общественных явлений и процессов, раскрывая их уровень, динамику и структуру, а также при разработке мер социально-правового регулирования, при совершенствовании правовой системы государства, развитии законодательства и др. Правовая статистика наряду с экономической, социально-демографической, культурной и др. представляет собой относительно самостоятельную отрасль общей статистики как универсальной науки о массовых явлениях и процессах любой физической природы. В своем развитии современная правовая статистика прошла три исторических этапа, начиная с судебной статистики (изучающей судимость) [1], а затем — правовой (изучающей преступность) [24, 26], которые можно рассматривать как относительно самостоятельные отрасли правовой статистики. Предметом правовой статистики являются
Введение 9 формализованные количественно-качественные показатели правовой (регулируемой правом) и иной юридически значимой деятельности (включающей, например, способы и обстоятельства совершения, меры предупреждения и методы раскрытия преступлений; обстоятельства совершения правонарушений и др.), свидетельствующие о соблюдении или нарушении действующих правовых норм. В прошлом также широко были распространены такие названия правовой статистики, как моральная и уголовная, что объясняется практическим акцентированием статистических исследований на изучении преступлений, самоубийств, пьянства и алкоголизма, проституции и других форм отклоняющегося поведения. Один из родоначальников научной статистики бельгийский ученый А. Кетле1 в своей работе «О человеке и развитии его способностей, или опыт социальной физики» писал: «Во всем, что касается преступлений, одни и те же числа воспроизводятся с поразительным и не подлежащим сомнению постоянством… Это постоянство, с которым одни и те же преступления из года в год совершаются в том же самом порядке и влекут за собой в одинаковых размерах одни и те же наказания, есть один из излюбленнейших фактов, какие сообщает нам статистика уголовных судов… Печальное положение человеческого существования! Мы наперед можем вычислить, сколько индивидуумов обагрит свои руки в крови себе подобных, сколько будет подделывателей, сколько отравителей, почти так же, как можно вычислить количество рождений и смертей, которые должны иметь место» [33]. Выявление на основе обработки многоаспектных статистических данных объективных тенденций и закономерностей развития массовых общественных явлений и процессов позволяет обеспечивать обоснованный социальный прогноз количественно-качественных показателей правовой и иной юридически значимой деятельности, а также оценить многие скрытые общественные явления, например, так называемую латентную преступность и др. В условиях формирования «цифрового» государства роль статистики как специфического канала обратной информационной связи в государственной системе социально-экономического и правового регулирования общественных отношений неизмеримо возрастает, поскольку 1 Кетле Адольф (1796–1874) — бельгийский математик, астроном, социолог, метеоролог.
Статистика 10 внедрение эффективных программных средств ИКТ [5, 19, 30] обеспечивает все большую полноту, достоверность, многоаспектность и доступность актуальной статистической информации. Кроме того, постоянный рост объемов собираемых разнородных статистических данных, усложнение их взаимосвязи, развитие методов их многоаспектного анализа для использования при прогнозировании обусловливают необходимость перехода в XXI в. к вычислительной статистике, обеспечивающей применение сложных нелинейных статистических моделей, таких, например, как искусственные нейронные сети, стратифицированные иерархические модели и др. (рис. В.1) [10, 21]. Предлагаемый компьютеризированный учебник отвечает требованиям ФГОС высшего профессионального образования по направлениям подготовки «Экономика», «Менеджмент», «Государственное и муниципальное управление» и соответствует программам различных учебных курсов дисциплины «Статистика», читаемых в Российском государственном университете правосудия с 2001 г. [13, 17, 18] и базирующихся на знаниях, полученных студентами в результате изучения учебных дисциплин «Математика», «Математика и информатика» (в первую очередь таких разделов, как теория вероятностей и теория множеств). Цель настоящего учебника — помочь студентам сосредоточить свое внимание на наиболее важных теоретических и практических вопросах современной компьютеризированной статистической науки в условиях рыночной экономики при построении информационного общества. В учебнике раскрываются предмет и организация современной статистики, рассматриваются основные статистические (математические) компьютеризированные методики, методы, модели и алгоритмы, а также их применение в социально-экономической и правовой практике на основе использования стандартизованных программных средств ИКТ [2–4, 6].В приложении приведены вспомогательные формульные и численные таблицы. Учебник предназначен для студентов бакалавриата вузов, а также может быть полезным для магистрантов, аспирантов, преподавателей и специалистов-практиков в области статистики. Авторы признательны академику РАРАН, доктору технических наук, профессору Валерию Александровичу Дементьеву (Институт точной механики и вычислительной техники РАН) и доктору эконономических наук, профессору Валерию Александровичу Чевычелову (Российский государственный университет правосудия) за доброжелательное рецензирование и конструктивные рекомендации.