English for statistics, machine learning and mathematical modeling / Английский язык для статистики, машинного обучения и математического моделирования
Покупка
Новинка
Тематика:
Английский язык
Издательство:
МИСИ-Московский государственный строительный университет
Автор:
Сак Александр Николаевич
Год издания: 2023
Кол-во страниц: 48
Дополнительно
Вид издания:
Учебно-методическая литература
Уровень образования:
ВО - Бакалавриат
ISBN: 978-5-7264-3323-3
Артикул: 855557.01.99
Учебно-методическое пособие содержит тексты и упражнения по лексике и грамматике для основных разделов математической статистики и машинного обучения, таких как теория вероятности, распределения, оценки, гипотезы, линейная регрессия и др. Работа с аутентичными текстами, а также выполнение упражнений позволят обучающимся познакомиться не только с английской терминологией и грамматическими конструкциями, использующимися для выражения математических методов, но и глубже узнать сами математические понятия данной области. Упражнения способствуют как запоминанию грамматических конструкций, так и владению терминологией соответствующих математических областей.
Для обучающихся бакалавриата по всем техническим/математическим УГСН, реализуемым НИУ МГСУ.
Тематика:
ББК:
УДК:
ОКСО:
- ВО - Бакалавриат
- 07.03.01: Архитектура
- 07.03.04: Градостроительство
- 08.03.01: Строительство
- 09.03.01: Информатика и вычислительная техника
- 20.03.01: Техносферная безопасность
ГРНТИ:
Скопировать запись
Фрагмент текстового слоя документа размещен для индексирующих роботов
УДК 811.111:51 ББК 81.432.1:22.1 С15 Рецензенты: кандидат филологических наук И.П. Павлючко, доцент кафедры гуманитарных дисциплин и иностранных языков Российского университета кооперации; кандидат филологических наук В.В. Волохова, доцент кафедры иностранных языков и профессиональной коммуникации НИУ МГСУ Сак, Александр Николаевич. С15 English for statistics, machine learning and mathematical modeling / Английский язык для статистики, машинного обучения и математического моделирования [Электронный ресурс] : учебно-методическое пособие / А.Н. Сак ; Министерство науки и высшего образования Российской Федерации, Национальный исследовательский Московский государственный строительный университет, кафедра иностранных языков и профессиональной коммуникации. — Электрон. дан. и прогр. (2 Мб). — Москва : Издательство МИСИ – МГСУ, 2023. — URL: http://lib.mgsu.ru. — Загл. с титул. экрана. ISBN 978-5-7264-3323-3 (сетевое) ISBN 978-5-7264-3324-0 (локальное) Учебно-методическое пособие содержит тексты и упражнения по лексике и грамматике для основных разделов математической статистики и машинного обучения, таких как теория вероятности, распределения, оценки, гипотезы, линейная регрессия и др. Работа с аутентичными текстами, а также выполнение упражнений позволят обучающимся познакомиться не только с английской терминологией и грамматическими конструкциями, использующимися для выражения математических методов, но и глубже узнать сами математические понятия данной области. Упражнения способствуют как запоминанию грамматических конструкций, так и владению терминологией соответствующих математических областей. Для обучающихся бакалавриата по всем техническим/математическим УГСН, реализуемым НИУ МГСУ. Учебное электронное издание © ФГБОУ ВО «НИУ МГСУ», 2023
Учебное электронное издание Сак Александр Николаевич ENGLISH FOR STATISTICS, MACHINE LEARNING AND MATHEMATICAL MODELING / АНГЛИЙСКИЙ ЯЗЫК ДЛЯ СТАТИСТИКИ, МАШИННОГО ОБУЧЕНИЯ И МАТЕМАТИЧЕСКОГО МОДЕЛИРОВАНИЯ Учебно-методическое пособие Редактор А.С. Орлова Корректор Я.А. Травкина Компьютерная правка и верстка О.В. Суховой Дизайн первого титульного экрана Д.Л. Разумного Для создания электронного издания использовано: Microsoft Word 2010, ПО Adobe Acrobat Подписано к использованию 24.10.2023. Объем данных 2 Мб. Федеральное государственное бюджетное образовательное учреждение высшего образования «Национальный исследовательский Московский государственный строительный университет». 129337, Москва, Ярославское ш., 26. Издательство МИСИ – МГСУ. Тел.: (495) 287-49-14, вн. 14-23, (499) 183-91-90, (499) 183-97-95. E-mail: ric@mgsu.ru, rio@mgsu.ru
Contents Unit 1. BASICS OF PROBABILITIES .......................................................................................................... 5 Exercises for Unit 1 ....................................................................................................................................... 22 Unit 2. STATISTICAL INFERENCE ........................................................................................................... 24 Exercises for Unit 2 ....................................................................................................................................... 30 Unit 3. CLUSTERING TASKS .................................................................................................................... 32 Exercises for Unit 3 ....................................................................................................................................... 47 References ..................................................................................................................................................... 48
Unit 1. BASICS OF PROBABILITIES Probability is a mathematical language for quantifying uncertainty. Probability theory can be applied to a variety of problems, from coin tossing to analyzing computer algorithms. The starting point is the definition of the space of elementary events, as well as the set of elementary outcomes — the set of possible results, which obtaining leads to the occurrence of event A. The space of elementary events Ω is a set of possible outcomes of the experiment. The values of ω in Ω are called sample outcomes or realizations. Events ω are subsets of Ω. Example 1. Find the sample space for the sex of 3 children in a family, if we are interested in knowing specifically the sex of the 1st, 2nd and 3rd children (i.e. order matters). We are going to use a tree diagram (Fig. 1). A tree diagram is a schematic with branches emanating from a starting point showing all possible outcomes of a probability experiment. Fig. 1. The tree diagram containing all possible permutations A probability experiment is a chance process that leads to well-defined results, called outcomes. An outcome is the result of a single trial of a probability experiment. An event is some specified outcomes that may or may not occur when a probability experiment is performed (can have multiple outcomes — boy or girl). We can define possible events using a sample space. A sample space lists the set of all possible outcomes of a probability experiment. Probability is the chance of a particular event occurring and is the basis of inferential statistics. Example 2. If we toss a coin twice, we get the following outcomes ω = {HT, TT, HH, TH}. The event when we get the head on the first toss equals the fallowing set of events A = {TH, HH}. Let’s model this situation in Python (Fig. 2). Fig. 2. A coin toss modelling to calculate the number of the “Head” outcomes After carrying out 100 trials, we get 46 outcomes, in which, by tossing a coin twice, we get the Head on the first toss of two.
Example 3. Suppose we need to measure the temperature of some object. All event space equals Ω = R = (−∞; ∞). Let the event correspond to the temperature of the object greater than 10 degrees, but less or equal to 23. So A = (10, 23]. This shows that the event may have a non-discrete value. Example 4. Let E be the event in which the Head falls on the third toss of the coin. E = {(ω1, ω2, ω3, …), ω1 = T, ω2 = T, ω3 = H, ωi = {T, H}, for i > 3}. The complement of A is denoted as AC = {ω ∈ Ω, ω ∉ A}. It is clear that the complement Ω is equal to the {}-empty set. We also need the union of the events A ∪ B = {ω ∈ Ω, ω ∈ A or ω ∈ B or ω ∈ both sets}. The intersection of events A ∩ B = {ω ∈ Ω; ω ∈ A and ω ∈ B}. The intersection of events can be denoted by A ∩ B or AB. If Ai ∩ Aj =∅ provided that i<>j, then these sets are called disjoint. For example, A1 = [1, 2), A2 = [2, 3), A3 = [3, 5)… A1 ∩ A2 ∩ A3 = ∅, which indicates non-overlapping events, because the intersection is equal to an empty set. The sequence of events (subsets) A1, A2, A3 is called monotonically increasing if A1 ⊂ A2 ⊂ A3 … (Fig. 3, a), which we can define as lim𝑛→∞𝐴𝑛= ∪∞ i = 1 Ai and monotonically decreasing, if A1 ⊃ A2 ⊃ A3 … (Fig. 3, b), for limn→∞𝐴𝑛= ∩∞ i = 1 Ai. Fig. 3. a — A1 ⊂ A2 ⊂ A3 — (monotonically increasing sets); b — A1 ⊃ A2 ⊃ A3 (monotonically decreasing sets) Each event A can be assigned some real number P(A). For example, how many times a certain number occurs in the sample (Fig. 4). Fig. 4. Dice rolling modelling in Python