Изучение искусственного интеллекта на основе принципа интенсификации обучения
Покупка
Новинка
Основная коллекция
Тематика:
Прикладные информационные технологии
Издательство:
Инфра-Инженерия
Год издания: 2024
Кол-во страниц: 172
Дополнительно
Вид издания:
Монография
Уровень образования:
Профессиональное образование
ISBN: 978-5-9729-1594-1
Артикул: 840256.02.99
Показан процесс изучения основ машинного и глубокого обучения в теоретической и прикладной плоскости подготовки. Рассмотрены профильные направления искусственного интеллекта и критерии их значимости. Приведен анализ и аудит содержания подходящих существующих готовых рабочих программ. Для специалистов в области искусственного интеллекта. Может быть полезно студентам, обучающимся по направлению подготовки «Искусственный интеллект».
Тематика:
ББК:
УДК:
ОКСО:
- ВО - Бакалавриат
- 02.03.02: Фундаментальная информатика и информационные технологии
- ВО - Магистратура
- 02.04.02: Фундаментальная информатика и информационные технологии
ГРНТИ:
Скопировать запись
Фрагмент текстового слоя документа размещен для индексирующих роботов
ǶǧǶȢȒȕȉǷǩdzȇȐșȇȑǧǩǫȦȊȏȒȌȉȇ ǯǮǺǾǬǴǯǬǯǸDZǺǸǸǹǩǬǴǴǵǪǵǯǴǹǬDzDzǬDZǹǧ ǴǧǵǸǴǵǩǬǶǷǯǴǽǯǶǧǯǴǹǬǴǸǯǻǯDZǧǽǯǯǵǨǺǾǬǴǯȆ dzȕȔȕȊȗȇțȏȦ dzȕȘȑȉȇǩȕȒȕȊȋȇ ªǯȔțȗȇǯȔȍȌȔȌȗȏȦ«
УДК 004.8 ББК 32.813 П94 Рецензенты: доктор технических наук, профессор, академик РЭА, ведущий научный сотрудник АО «НЦ ВостНИИ» Вадим Васильевич Иванов; доктор технических наук, профессор кафедры математики ФГБОУ ВО «Кузбасский государственный университет имени Т. Ф. Горбачева» Инна Алексеевна Ермакова; доктор технических наук, профессор, академик РЭА, ведущий научный сотрудник АО «НЦ ВостНИИ» Виктор Семенович Зыков Пылов, П. А. П94 Изучение искусственного интеллекта на основе принципа интенсификации обучения : монография / П. А. Пылов, Р. В. Майтак, А. В. Дягилева. - Москва ; Вологда : Инфра-Инженерия, 2024. - 172 с. : ил., табл. ISBN 978-5-9729-1594-1 Показан процесс изучения основ машинного и глубокого обучения в теоретической и прикладной плоскости подготовки. Рассмотрены профильные направления искусственного интеллекта и критерии их значимости. Приведен анализ и аудит содержания подходящих существующих готовых рабочих программ. Для специалистов в области искусственного интеллекта. Может быть полезно студентам, обучающимся по направлению подготовки «Искусственный интеллект». УДК 004.8 ББК 32.813 ISBN 978-5-9729-1594-1 Пылов П. А., Майтак Р. В., Дягилева А. В., 2024 Издательство «Инфра-Инженерия», 2024 Оформление. Издательство «Инфра-Инженерия», 2024
ОГЛАВЛЕНИЕ ВВЕДЕНИЕ .................................................................................................................. 5 РАЗДЕЛ 1. Профильные направления искусственного интеллекта и критерии их значимости. Анализ и аудит содержания подходящих существующих готовых рабочих программ ........................................................................................ 8 1.1. Состав профильных направлений и их значимость...................................... 8 1.2. Анализ подходящих существующих готовых рабочих программ для изучения прикладного искусственного интеллекта ..................................... 9 Предварительные итоги первого раздела ........................................................... 37 РАЗДЕЛ 2. Разработка интенсификационного учебного плана профильных направлений прикладного искусственного интеллекта ........................................ 38 2.1. Конфигурация учебного плана профильных дисциплин и порядка их следования ........................................................................................................ 38 2.2. Дисциплина «Интеллектуальный анализ исследовательской информации и первичная обработка информационных потоков» ................... 40 2.3. Дисциплина «Визуализация и интерпретируемость представления знаний» ......................................................................................... 46 2.4. Дисциплина «Математические основы алгоритмов машинного обучения»........................................................................................... 49 2.5. Дисциплина «Программная реализация моделей машинного обучения»........................................................................................... 53 2.6. Дисциплина «Искусственный интеллект» ................................................... 56 2.7. Дисциплина «Введение в нейронные сети» ................................................ 58 2.8. Дисциплина «Архитектуры моделей глубокого обучения» ...................... 60 2.9. Дисциплина «Базы данных и архитектурная организация хранилищ больших данных» ................................................................................ 62 2.10. Дисциплина «Методологии оптимизации скорости работы с большими данными» .......................................................................................... 64 2.11. Дисциплина «Область обработки естественного языка» ......................... 66 Предварительные итоги второго раздела ........................................................... 68 РАЗДЕЛ 3. Реализация базовой практической работы в интегрированной информационной среде ............................................................................................. 69 3.1. Интегрированная информационная система ............................................... 69 3.2. Реализация практической работы в интегрированной информационной среде ......................................................................................... 75 Предварительные итоги третьего раздела .......................................................... 84 ЗАКЛЮЧЕНИЕ ......................................................................................................... 86 3
БИБЛИОГРАФИЧЕСКИЙ СПИСОК ...................................................................... 88 ПРИЛОЖЕНИЕ А. Лекционный материал на примере темы «Метод опорных векторов» из курса дисциплины «Искусственный интеллект» .................................................................................... 94 ПРИЛОЖЕНИЕ Б. Презентационный материал на примере темы «Метод опорных векторов» из курса дисциплины «Искусственный интеллект» .................................................................................. 104 ПРИЛОЖЕНИЕ В. Лабораторная работа №8 «Метод опорных векторов» из курса лабораторных работ по дисциплине «Искусственный интеллект» .... 137 4
ВВЕДЕНИЕ Сохраняющаяся тенденция к повышенному росту объёма информации в современном мире, несомненно, будет только укрепляться. Этому способствует появление новых технологий, наиболее ярко представленных в области информационных технологий и искусственного интеллекта, в частности. Для получения соответствующих навыков, специалистам необходимо постоянно совершенствовать свои умения и знания, что, в первую очередь, начинается с образования. Высшее образование - это одна из ступеней, которая является завершающей в процессе подготовки специалистов некоторой области. Однако ограниченность учебного времени в высших учебных заведениях не позволяет обучить студентов всем аспектам направления. Возникающую проблему можно обойти, если воспользоваться приемом интенсификации обучения студентов высших учебных заведений. Под понятием интенсификации понимается передача студентам большего объёма обучающей информации при неизменной продолжительности обучения, не теряя при этом в качестве передаваемых знаний. Такая концепция имеет право и возможность на существование благодаря совершенствованию содержания учебного материала и модернизации методов обучения. Как правило, в методических пособиях, используемых для освоения той или иной дисциплины, изложено руководство к решению конкретной практической задачи в рамках предмета. С постоянным развитием информационных технологий такая тактика имеет существенный недостаток, который можно выразить в очень быстром «старении» методического пособия: через один-два календарных (учебных) года оно становится уже неактуальным для обучения студентов. Кроме этого, разработанные варианты заданий, а, соответственно, и решение для них, могут компрометироваться последующими группами, что автоматически обнуляет обучающий статус учебного пособия. Неприемлемость описанных выше критериев может быть решена путем модернизации основополагающих принципов построения учебного пособия. Для разрешения проблематики первого вышеописанного критерия предлагается осуществить тесную интеграцию электронных ресурсов сети Интернет (которые постоянно обновляются) с учебным пособием, что поможет сохранить актуальность разработанных материалов на долгий промежуток времени (ориентировочно на срок до 5 лет). Второй недостаток разрешим созданием уникальной базы вариантов, которые предлагаются для решения студентам в практических (лабораторных, само5
стоятельных) работах. База вариантов основана на самостоятельном выборе студентом набора данных из более, чем 10.000.000 наборов для решения той или иной работы - это, во-первых, позволяет заметно повысить собственную заинтересованность студента в выполнении работы, раскрывая весь его творческий потенциал как личности, а, во-вторых, становится максимально возможной индивидуализация обучения (каждый студент всегда будет решать свой собственный вариант). Обратим особое внимание на то, что возможно и повышение мобильности и доступности выполнения работ, благодаря чему исчезает зависимость от того, насколько производительный у студента персональный компьютер (поскольку обработка данных будет осуществляться на высокопроизводительных серверах обработки больших данных). Благодаря предлагаемому подходу, процесс обучения будет перенесен из плоскости обучения в прямом смысле этого слова на обучение в понимании способствования и подкрепления. Этот доказанный научный подход [1] позволяет развивать у студентов не только соответствующие прикладные навыки овладения технологией, но и, главным образом, сформируется уверенность в решении сложных задач, развивается мировоззрение и творческий потенциал. Эти важнейшие качества позволят будущему специалисту информационных технологий самостоятельно разрешать сложнейшие задачи отрасли computer science в любых предметных областях на основе быстрого адаптирования в рассматриваемой среде и поиску неочевидных, творческих решений [1]. Вышеизложенный материал определяет актуальность темы настоящей монографии, основанной на разработке учебно-методического комплекса по профильным дисциплинам для бакалавров по направлению подготовки «Искусственный интеллект». Целью данной монографии является повышение уровня качества подготовки специалистов в области искусственного интеллекта за счет разработки учебно-методического комплекса по профильным дисциплинам для бакалавров по направлению подготовки «Искусственный интеллект». Объектом исследования является процесс изучения студентами основ машинного и глубокого обучения в теоретической и прикладной плоскости подготовки. Предметом исследования является разработка контента учебно-методического комплекса дисциплин для совершенствования и интенсификации проведения занятий по профильным предметам бакалавров направления подготовки «Искусственный интеллект». В качестве задач исследования выделим как стандартные этапы разработки планов последовательности изучения моделей машинного и глубокого обучения в дисциплинах, так и рекомендационные указания к оформлению результатов 6
разработки этих моделей студентами и непосредственному представлению отчетов о выполнении работ преподавателю. В качестве задач по настройке прикладной программной среды выделяются задачи, связанные с программной реализацией кабинета преподавателя в информационной среде Amazon SageMaker, создания класса студентов и настройке прав доступа в системе для проверки работ и оценивания их результатов. Монография имеет организованную структуру, состоящую из введения, основной части, включающей в себя 3 раздела, заключения и библиографического списка используемой литературы, состоящего из 110 литературных источников. Монография иллюстрирована 3 таблицами, 56 рисунками. Имеет 3 приложения. 7
РАЗДЕЛ 1. Профильные направления искусственного интеллекта и критерии их значимости. Анализ и аудит содержания подходящих существующих готовых рабочих программ 1.1. Состав профильных направлений и их значимость Предполагается, что состав профильных дисциплин бакалавров направления подготовки «Искусственный интеллект» включает в себя 10 предметов: 1. Интеллектуальный анализ исследовательской информации и первичная обработка информационных потоков. 2. Математические основы алгоритмов машинного обучения. 3. Визуализация и интерпретируемость представления знаний. 4. Искусственный интеллект. 5. Программная реализация моделей машинного обучения. 6. Введение в нейронные сети. 7. Архитектуры моделей глубокого обучения. 8. Базы данных и архитектурная организация хранилищ больших данных. 9. Методологии оптимизации скорости работы с большими данными. 10. Область обработки естественного языка. У каждого предмета есть признак значимости, который определяет: - дисциплина носит вариативный характер (то есть у студентов существует возможность выбора одной дисциплины из двух предлагаемых); - дисциплина является утвержденной окончательно и не предполагает возможности выбора аналогичной; - дисциплина является факультативной, то есть дополнительной (необязательной), вводимой в учебный курс по выбору студентов. Удобно рассмотреть состав дисциплин направления подготовки с критериями их значимости в виде результирующей таблицы (таблица 1). Таблица 1. Состав дисциплин направления подготовки «Искусственный интеллект» с критериями их значимости № Название дисциплины Критерий значимости 1 Интеллектуальный анализ исследовательской информации и первичная обработка информационных потоков В1 2 Математические основы алгоритмов машинного обучения В2 3 Визуализация и интерпретируемость представления знаний В1 4 Искусственный интеллект У 5 Программная реализация моделей машинного обучения В2 6 Введение в нейронные сети У 7 Архитектуры моделей глубокого обучения У 8 Базы данных и архитектурная организация хранилищ больших данных В3 9 Методологии оптимизации скорости работы с большими данными В3 10 Область обработки естественного языка Ф 8
Тип значимости дисциплин в таблице обозначен соответствующими буквами - сокращениями: У - утверждённая дисциплина, не предполагающая возможности выбора другого предмета; В - вариативная дисциплина, предполагающая возможность выбора студентами другой дисциплины из двух предлагаемых на изучение. Символ « » после буквы «В» в сокращение заменяется числом у конкретных дисциплин, позволяя установить прямую взаимосвязь между двумя вариативными предметами; Ф - факультативная дисциплина. Из таблицы 1 следует: 1.Каждая пара вариативной дисциплины должна иметь взаимозаменяемый характер и, как следствие, одинаковый уровень сложности предмета; 2.Согласно принципу интенсификации обучения, сложность предметов должна постоянно возрастать [1], а материал дисциплин не должен повторяться (дублироваться) в отдельных предметах; 3.Разработанные факультативные дисциплины должны иметь характер «добавочных», но ни в коем случае не «основных». Иными словами, материал, который будет преподаваться студентам на факультативной дисциплине должен детальнее раскрывать основной материал, а не вводить абсолютно новые столпы знаний. 1.2. Анализ подходящих существующих готовых рабочих программ для изучения прикладного искусственного интеллекта Прежде, чем проводить поиск готовых рабочих программ, необходимо обозначить, что область машинного обучения, изучению которой посвящено направление «Искусственный интеллект», является очень обширной. Исходя из принципа интенсификации обучения, а также вышеупомянутой проблематики, возникает несколько критериев, накладывающих ограничение на выборку готового рабочего плана: 1. Материал не должен дублироваться в рамках всего учебного плана; 2. Отобранная программа должна быть последовательной, логичной и плавной (то есть без резких возрастаний / падений уровня сложности материала); 3. Содержание всего учебного плана должно быть четко конкретизировано на всем его протяжении - с каждой лекцией и лабораторной работой студент должен либо получать новый навык, либо закреплять уже полученный. Более того - этот параметр может измерен качественно (то есть оценка полученных знаний может быть подтверждена контрольной / промежуточной аттестацией); 9
4. Отсутствие характеристики «факультативности» у лабораторных работ. Если материал не несет в себе полезной нагрузки для совершенствования «жестких навыков» (hard skills) студентов, то он не должен присутствовать в содержание учебного плана. В качестве рассматриваемых готовых программ были выбраны следующие курсы: 1.Готовая программа «Курс по машинному обучению и нейросетям: Machine Learning и Deep Learning» от компании SkillFactory [14]. 2.Программа «Факультет Python-разработки» от компании GeekBrains [15]. 3.«Машинное обучение» от компании Нетология [16]. 4.«Machine Learning Engineer» от компании SkillBox [17]. 5.«Data Science Machine Learning» от компании SkillBox [18]. 6.«Machine Learning и Deep Learning» от компании SkillFactory [19]. 7.«Machine Learning Инженер» от компании SkillFactory [20]. 8.«Курс по машинному обучению» от компании SkillFactory [21]. 9.«Machine Learning Professional» от компании OTUS [22]. 10.«Machine Learning. Advanced» от компании OTUS [23]. 11.«Специализация Machine Learning» от компании OTUS [24]. 12.«Введение в машинное обучение» от компании Udemy [25]. 13.«Машинное обучение для людей» от компании Udemy [26]. 14.«Машинное обучение: регрессия и предсказание данных на Python» от компании Udemy [27]. 15.«Искусственный интеллект и Машинное обучение Основы Python» от компании Udemy [28]. 16.«Искусственный интеллект на кончиках пальцев» от компании Udemy [29]. Отобранные программы являются проприетарными. Отсортируем программы по возрастанию стоимости, за которою её предлагает компания-владелец. Для удобства представления аналитических данных каждой программы удобно рассмотреть курсы в виде сводной результирующей таблицы (таблица 2). Теперь проанализируем по порядку содержание представленных в таблице 2 курсов. Начнём анализирование курсов по инкрементации их порядкового номера из таблицы 2. Первым курсом является наименее дорогая программа «Введение в машинное обучение» от компании Udemy [25]. Её состав представлен на рисунке 1. 10