Книжная полка Сохранить
Размер шрифта:
А
А
А
|  Шрифт:
Arial
Times
|  Интервал:
Стандартный
Средний
Большой
|  Цвет сайта:
Ц
Ц
Ц
Ц
Ц

Статистический анализ с применением программных средств

Покупка
Новинка
Основная коллекция
Артикул: 855446.01.99
В учебном пособии рассмотрены базовые понятия дисциплины «Статистический анализ с применением программных средств», изложены основы описательной статистики, дисперсионного, корреляционного и регрессионного анализа, моделей временных рядов. Теоретический материал сопровождается примерами решения задач в MS Excel. Предназначено для обучающихся по специальности 38.05.02 «Таможенное дело», а также может быть рекомендовано для студентов направления подготовки 38.03.01 «Экономика», аспирантов, магистрантов и всех тех, кто интересуется вопросами статистического анализа данных.
Статистический анализ с применением программных средств : учебное пособие / Н. В. Ширкунов, М. М. Цвиль, Е. В. Родительская, И. М. Турланова. – Москва : РИО Российской таможенной академии, 2021. - 141 с. – ISBN 978-5-9590-1222-9. - Текст : электронный. - URL: https://znanium.ru/catalog/product/2203133 (дата обращения: 27.03.2025). – Режим доступа: по подписке.
Фрагмент текстового слоя документа размещен для индексирующих роботов
Государственное казенное образовательное учреждение  
высшего образования
«Российская таможенная академия»
Статистический анализ  
с применением 
программных средств
Учебное пособие
Москва
2021


УДК 311
ББК 65.051.03
 
С78
Д о п у щ е н о 
учебно-методическим советом Российской таможенной академии  
к использованию в образовательном процессе для обучающихся  
по специальности 38.05.02 «Таможенное дело»
А в т о р с к и й  ко л л е к т и в :
Н.В. Ширкунова, заведующий кафедрой таможенной статистики Российской таможенной академии, канд. экон. наук, доцент (глава 2);
М.М. Цвиль, доцент кафедры информатики и информационных таможенных технологий Ростовского филиала Российской таможенной академии, канд. физ.-мат. наук, доцент 
(глава 4);
Е.В. Родительская, доцент кафедры таможенной статистики Российской таможенной академии, канд. экон. наук, доцент (глава 1);
И.М. Турланова, доцент кафедры таможенной статистики Российской таможенной 
академии, канд. экон. наук (глава 3)
Р е ц е н з е н т ы :
И.Ю. Глебкова, доцент Департамента учета, анализа и аудита Финансового университета при Правительстве РФ, канд. экон. наук, доцент;
И.В. Добрынина, профессор кафедры (высшей математики) Академии гражданской 
защиты МЧС России, д-р физ.-мат. наук, доцент
С78  
Статистический анализ с применением программных средств: учебное пособие / Н.В. Ширкунова, М.М. Цвиль, Е.В. Родительская, И.М. Турланова. М.: РИО 
Российской таможенной академии, 2021. 140 с.
ISBN 978-5-9590-1222-9
В учебном пособии рассмотрены базовые понятия дисциплины «Статистический анализ с применением программных средств», изложены основы описательной статистики, 
дисперсионного, корреляционного и регрессионного анализа, моделей временных рядов. 
Теоретический материал сопровождается примерами решения задач в MS Excel.
Предназначено для обучающихся по специальности 38.05.02 «Таможенное дело», 
а также может быть рекомендовано для студентов направления подготовки 38.03.01 «Экономика», аспирантов, магистрантов и всех тех, кто интересуется вопросами статистического анализа данных.
УДК 311
ББК 65.051.03
ISBN 978-5-9590-1222-9
© Российская таможенная академия, 2021


Предисловие
Анализ данных входит в область профессиональной деятельности 
таможенников. Статистический анализ с применением MS Excel является 
основой анализа больших данных в таможенных органах.
Овладение статистическими методами анализа и обработки информации играет важную роль в системе таможенного образования и способствует успешному освоению других дисциплин.
Структура учебного пособия, наличие практических примеров решения 
задач позволят использовать его как для подготовки к практическим занятиям, так и для самостоятельного изучения дисциплины.
Изучение дисциплины «Статистический анализ с применением программных средств» дает возможность обучающимся по специальности 
«Таможенное дело» расширить свои знания в области статистики, обработки и анализа данных.
Содержание учебного пособия соответствует рабочей программе дисциплины и включает методы описательной статистики, дисперсионный 
анализ, статистические методы изучения взаимосвязей явлений и процессов, статистические методы изучения динамики явлений и процессов.
Учебное пособие не только способствует формированию компетенции 
«владение навыками применения методов сбора и анализа данных таможенной статистики внешней торговли и специальной таможенной статистики», но и позволяет оценить уровень сформированности данной компетенции.
Материал в учебном пособии представлен в логической последовательности. По каждой теме изложены основы теории, разобраны практические 
задачи. Для оценки уровня сформированности компетенции главы содержат контрольные вопросы, тестовые задания и задания для самостоятельной работы.


Глава 1  
Методы описательной статистики
1.1. Статистические функции
К статистическим функциям относятся функции, которые можно 
использовать при проведении статистического анализа. Большая часть этих 
функций приведена в Excel в мастере функций, категория Статистические.
Функции для вычисления средних значений
Функции СРЗНАЧ(), СРГАРМ(), СРГЕОМ() возвращают среднее значение (среднее арифметическое, гармоническое, геометрическое соответственно) аргументов.
Виды средних величин различаются прежде всего тем, какое свойство, 
какой параметр исходной варьирующей массы индивидуальных значений 
признака должен быть сохранен неизменным.
Средней арифметической величиной называется такое среднее значение 
признака, при вычислении которого общий объем признака в совокупности 
сохраняется неизменным.
Формула средней арифметической величины имеет вид:
 
1
1
2
(
) :
n
i
i
n
x
x
x
x
x
n
n
=
=
+
+
+
= ∑

, 
(1.1)
где x  – средняя величина;
n – численность совокупности;
xi – варианта признака.
По формуле (1.1) вычисляются средние величины первичных (объемных) признаков, когда известны индивидуальные значения признака. Если 
изучаемая совокупность велика, то исходная информация группируется по 
изучаемому признаку и в таких случаях для вычисления средней величины 
применяют формулу средней арифметической взвешенной:


1
1
n
i
i
i
n
i
i
x f
x
f
=
=
= ∑
∑
, 
(1.2)
где fi – частота;
п – число групп.
Если необходимо, чтобы неизменной оставалась при осреднении сумма 
величин, обратных индивидуальным значениям признака, то средняя величина является гармонической средней:
 
гарм
i
i
i
w
x
w
x
= ∑
∑
, 
(1.3)
где wi = xi fi.
Основное применение геометрическая средняя находит при определении средних темпов роста, и она дает наиболее правильный по содержанию 
результат осреднения, если задача состоит в нахождении такого значения 
признака, которое качественно было бы равноудалено как от максимального, так и от минимального значения. Вычисляется средняя геометрическая по формуле:
 
1
2
3 ...
геом
n
n
x
x x x
x
=
. 
(1.4)
В MS Excel реализованы статистические функции, вычисляемые только 
по простым формулам:
СРЗНАЧ(число1;[число2];…)
СРГЕОМ(число1;[число2];…)
СРГАРМ(число1;[число2];…),
где число1 – обязательный аргумент. Первое число, ссылка на ячейку или 
диапазон, для которого требуется вычислить среднее значение;
число2… – необязательный аргумент. Дополнительные числа, ссылки 
на ячейки или диапазоны, для которых нужно вычесть среднее значение, 
не более 255.
П р и мер  1.1. Имеются данные выборки из базы данных деклараций 
на товары стоимости единицы товара группы 02 «Мясо и пищевые мясные 


субпродукты» Товарной номенклатуры внешнеэкономической деятельности Евразийского экономического союза (ТН ВЭД ЕАЭС).
Определим среднюю стоимость единицы товара (рис. 1.1, 1.2).
Решение
Рис. 1.1. Ввод функции для расчета среднего значения
Рис. 1.2. Результаты расчета среднего значения
Медиана – это значение элемента, приходящееся на середину совокупности, т.е. в наборе данных половина значений больше медианы, а половина – меньше. Для определения медианы данные располагают в порядке 
возрастания, а затем определяют среднее значение (рис. 1.3).



Рис. 1.3. Функция МЕДИАНА
Если множество содержит четное количество чисел, то функция 
МЕДИАНА вычисляет среднее для двух чисел, находящихся в середине множества.
В интервальном вариационном ряду для нахождения медианы применяется формула:
 
1
2
Me
Me
Me
f
S
Me
X
i
f
−
−
=
+
∑
, 
(1.5)
где Me – медиана;
хMе – нижняя граница медианного интервала;
SMе–1 – накопленная частота в интервале, предшествующем медианному;
fMe – частота в медианном интервале;
i – величина интервала.
В MS Excel для вычисления медианы используют следующую функцию:
МЕДИАНА(число1;число2;…),
где число1, число2,… – от 1 до 255 чисел, для которых определяется 
медиана.
Аналогично медиане вычисляются значения признака, делящие совокупность на четыре равные по числу единиц части. Эти величины называ
ются квартилями. Значения признака, делящие ряд на пять равных частей, 
называют квинтилями, на десять частей – децилями, на сто частей – перцентилями.
В MS Excel для их вычисления применяют следующие функции.
КВАРТИЛЬ(массив;часть),
где массив – массив или интервал ячеек с числовыми значениями, для 
которых определяются значения квартилей;
часть – параметр, принимающий целочисленные значения от 0 до 4, 
и в зависимости от этого параметра функция возвращает следующие значения: 0 – минимальное значение ряда; 1 – первую квартиль (25-ю персентиль); 2 – значение медианы (50-ю персентиль); 3 – третью квартиль 
(75-ю персентиль); 4 – максимальное значение ряда.
ПЕРСЕНТИЛЬ(массив;k),
где k – значение в интервале от 0 до 1 включительно (или от 0 до 100%).
П р и м е р 1.2. По данным примера 1.1 вычислим все квартили и персентили.
Решение
Ранжируем исходные данные (располагаем в порядке возрастания). 
В ячейку Q3 введем формулу =КВАРТИЛЬ(О$3:О$23;Q3), а затем протянем 
маркером заполнения ячейку R3 до R7. Аналогично рассчитаем персентили, используя соответствующую функцию (рис. 1.4).
Для вычисления медианы в ячейку R18 введем формулу:
=МЕДИАНА(О3:О23).
Особое значение при исследовании совокупности имеет такая величина 
признака, которая встречается чаще всего. Такую величину принято называть модой. В дискретном ряду мода определяется без вычисления как значение признака с наибольшей частотой:
МОДА(число1;число2;…),
где число1, число2,… – от 1 до 255 чисел, для которых вычисляется мода.
В интервальном ряду распределения для расчета моды применяют формулу:
 
1
1
1
(
)
(
)
Mo
Mo
Mo
Mo
Mo
Mo
Mo
f
f
Mo
X
i f
f
f
f
−
−
+
−
=
+
−
+
−
. 
(1.6)


Рис. 1.4. Результаты расчета квартилей, персентилей и медианы
Функции для вычисления разброса значений 
относительно среднего
Статистические функции, включенные в данную группу, вычисляют 
ту или иную меру разброса значений выборочной совокупности относительно среднего значения.
Функции ДИСП и ДИСПА вычисляют выборочную дисперсию, и в этих 
функциях предполагается, что аргументы являются только выборкой из генеральной совокупности. Если данные представляют всю генеральную совокупность, то для вычисления дисперсии следует использовать функцию ДИСПР.
На практике при решении конкретной аналитической задачи чаще всего 
имеют дело не со всем массивом данных, а лишь с его частью, т.е. с выборочной совокупностью.


Генеральной совокупностью называется вся подлежащая изучению 
совокупность объектов (наблюдений), например: все партии товаров, пересекающие границу, совокупность участников внешнеэкономической деятельности (ВЭД) региона и т.п.
Та часть единиц совокупности, которая отобрана для изучения из генеральной совокупности, называется выборочной совокупностью, или выборкой.
Представление о статистических данных как о выборочных может относиться не только собственно к выборке, но и к данным сплошного наблюдения, которые иногда рассматриваются как выборка из всех возможных 
реализаций изучаемого процесса. Это имеет смысл в случае малого числа 
единиц совокупности. Кроме того, трактовка данных как выборочных 
используется применительно к результатам эксперимента, которые рассматриваются как некая выборка из потенциально бесконечного числа повторений экспериментальных наблюдений.
Число единиц n, образующих выборку, называют объемом выборочной 
совокупности (выборки), а число единиц, входящих в генеральную совокупность N, – объемом генеральной совокупности.
Выборочная совокупность должна наиболее полно и адекватно отображать свойства генеральной совокупности, чтобы было возможно получить 
достоверные выводы о свойствах последней. Репрезентативность выборки 
обеспечивается только при объективности отбора данных. 
Отбором называется процесс формирования выборочной совокупности 
из элементов генеральной. Кратко рассмотрим основные способы отбора.
Простой случайный отбор – способ извлечения n элементов из конечной генеральной совокупности объемом N, при котором каждая из возможных выборок имеет равную вероятность быть отобранной.
Серийный отбор предполагает случайный отбор из генеральной совокупности не отдельных единиц, а их равновеликих групп (гнезд, серий) 
с тем, чтобы в таких группах подвергать наблюдению все без исключения 
единицы совокупности; его применяют, когда исследуемый признак незначительно колеблется внутри серий.
Расслоенный отбор используется для отбора единиц из неоднородной 
совокупности. Генеральную совокупность разбивают на несколько качественно однородных групп, затем из каждой группы собственно случайным 
или механическим способом производится индивидуальный отбор единиц 
в выборочную совокупность. Если пропорции между группами в выборке 
совпадают с пропорциями между группами в генеральной совокупности, 
то имеет место типический отбор.


Похожие

Ошибка получения данных