Решение задач компьютерного зрения
Покупка
Основная коллекция
Тематика:
Прикладное программное обеспечение
Издательство:
Южный федеральный университет
Автор:
Селянкин Владимир Васильевич
Год издания: 2016
Кол-во страниц: 92
Дополнительно
Вид издания:
Учебное пособие
Уровень образования:
ВО - Магистратура
ISBN: 978-5-9275-2090-9
Артикул: 695815.01.99
В пособии рассматриваются вопросы решения наиболее популярных задач компьютерного зрения: методы распознавания образов, поиск изображений на основе содержания, обнаружение движения на изображениях, сопоставление изображений в двумерном пространстве, распознавание объектов на изображениях.
Для студентов магистерской подготовки по направлению 09.04.04 «Программная инженерия», аспирантов и специалистов, работающих в области использования компьютерной графики и компьютерного зрения.
Учебное пособие разработано в рамках выполнения базовой части государственного задания по теме "Информационно-алгоритмическое обеспечение систем цифрового управления, автономной высокоточной навигации и технического зрения для перспективных летательных аппаратов: разработка теоретических основ проектирования, алгоритмов, способов эффективной и надежной программной реализации, использование высокопроизводительной вычислительной инфраструктуры для экспериментального моделирования" № 3442.
Скопировать запись
Фрагмент текстового слоя документа размещен для индексирующих роботов
В.В. Селянкин Решение задач компьютерного зрения
МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ Федеральное государственное автономное образовательное учреждение высшего образования «ЮЖНЫЙ ФЕДЕРАЛЬНЫЙ УНИВЕРСИТЕТ» Инженерно-технологическая академия В.В. Селянкин Решение задач компьютерного зрения Учебное пособие Таганрог Издательство Южного федерального университета 2016
УДК 004.93 (075.8) ББК 32.973я73 С299 Печатается по решению редакционно-издательского совета Южного федерального университета Рецензенты: профессор кафедры информатики Таганрогского института им. А.П. Чехова (филиал РИНХ), доктор технических наук Витиска Н.И.; директор направления в ООО «ЭйТи Консалтинг» в г.Таганроге, кандидат технических наук Калачев Д.П. Селянкин, В.В. Решение задач компьютерного зрения : учебное пособие / Селянкин В.В. ; Южный федеральный университет. – Таганрог : Издательство Южного федерального университета, 2016. – 92 с. ISBN 978-5-9275-2090-9 В пособии рассматриваются вопросы решения наиболее популярных задач компьютерного зрения: методы распознавания образов, поиск изображений на основе содержания, обнаружение движения на изображениях, сопоставление изображений в двумерном пространстве, распознавание объектов на изображениях. Для студентов магистерской подготовки по направлению 09.04.04 «Программная инженерия», аспирантов и специалистов, работающих в области использования компьютерной графики и компьютерного зрения. Учебное пособие разработано в рамках выполнения базовой части государственного задания по теме "Информационно алгоритмическое обеспечение систем цифрового управления, автономной высокоточной навигации и технического зрения для перспективных летательных аппаратов: разработка теоретических основ проектирования, алгоритмов, способов эффективной и надежной программной реализации, использование высокопроизводительной вычислительной инфраструктуры для экспериментального моделирования" № 3442. ISBN 978-5-9275-2090-9 УДК 004.93 (075.8) ББК 32.973я73 © Южный федеральный университет, 2016 © Селянкин В.В., 2016 С299
Оглавление Введение......................................................................................................5 1. Методы распознавания образов ............................................................6 1.1. Основные задачи распознавания образов .................................6 1.2. Ошибки распознавания...............................................................8 1.3. Распознавание по набору измерений.......................................10 1.4. Распознавание по элементарным признакам ..........................10 1.4.1. Нахождение класса объекта по среднему значению .11 1.4.2. Нахождение класса по расстоянию до ближайших соседей...............................................................................................12 1.5. Структурные методы распознавания.......................................14 1.6. Матрица неточностей................................................................14 1.7. Дерево решений.........................................................................15 1.8. Автоматическое построение дерева решений ........................19 1.9. Байесовский метод принятия решений ...................................22 1.10. Понятие методов кластеризации............................................23 1.11. Искусственные нейронные сети.............................................24 2. Поиск изображений на основе содержания........................................26 2.1. Задача поиска изображений .....................................................26 2.2. Поиск с использованием ключевых слов ................................27 2.3. Поиск с использованием запросов по образцу .......................27 2.4. Меры расстояния между изображениями ...............................29 2.4.1. Характеристики цветового сходства.........................29 2.4.2. Характеристики текстурного сходства....................30 2.4.3. Характеристики сходства формы ..............................32 2.4.4. Характеристики сходства объектов и их расположения на изображении ......................................................37 2.5. Организация базы данных ........................................................42 2.5.1. Стандартные индексы .................................................42 2.5.2. Пространственная индексация....................................45
2.5.3. Индексация в системах поиска изображений на основе содержания.......................................................................................46 3. Обнаружение движения на изображениях .........................................48 3.1. Задача обнаружения движения ................................................48 3.2. Вычитание изображений ..........................................................49 3.3. Вычисление векторов перемещения........................................49 3.4. Вычисление траекторий движущихся точек...........................51 3.5. Виды изменений условий съемки............................................54 3.6. Сегментация видеопоследовательностей...................................55 4. Сопоставление изображений в двумерном пространстве.................56 4.1. Основные понятия.....................................................................56 4.2. Распознавание двумерных объектов с помощью аффинных преобразований ....................................................................................58 4.3. Распознавание двумерных объектов с использованием реляционных моделей..........................................................................62 5. Распознавание объектов на изображениях.........................................68 5.1. Определение соответствия точек двумерного изображения и точек трехмерной сцены......................................................................68 5.2. Распознавание объектов на основе моделей...........................69 5.3. Существующие разновидности трехмерных моделей ....................70 5.4. Классы видимости трехмерных объектов...............................75 5.5. Физические и деформационные модели .................................76 5.6. Методы распознавания трехмерных объектов .......................78 5.6.1. Классификация задач распознавания...........................78 5.6.2. Распознавание с использованием процедуры совмещения .......................................................................................80 5.6.3. Распознавание на основе реляционных моделей..........84 Заключение................................................................................................90 Библиографический список .....................................................................91
Введение Понятие компьютерного зрения изначально подразумевало восстановление трехмерных изображений по двумерным изображениям. В настоящее время это понятие трактуется шире, как принятие решений о физических объектах на основе их изображений. Близкое по смыслу понятие машинного зрения обычно используется как решение промышленных, производственных задач в робототехнике, конвейерном производстве и аналогичных производственных процессах. В данном пособии рассматриваются вопросы распознавания образов, поиска изображений на основе содержания, построения трехмерных сцен по двумерным изображениям, построения виртуальной и дополненной реальности. Первый раздел, посвященный распознаванию образов, содержит краткий обзор методов распознавания объектов по исходным изображениям или предварительно обработанным, а также по кадрам видеопотока. При этом распознаваемый образ представляется некоторым вектором характеристических параметров. Рассматриваются и методы распознавания с обучением. Второй раздел описывает задачу поиска изображений на основе содержания и методы её решения с использованием ключевых слов, запросов по образцу и расчетом меры расстояния между изображениями. Даны принципы организации базы данных. Третий раздел посвящён обнаружению движения на изображениях. Приведены алгоритмы обнаружения движения путем вычитания изображений, вычислением векторов перемещения, а также расчетом траекторий движущихся точек. В четвертом разделе рассматриваются вопросы сопоставления изображений в двумерном пространстве с помощью аффинных преобразований и с использованием реляционных моделей. Пятый раздел посвящён распознаванию объектов на изображениях. Рассматриваются различные алгоритмы
распознавания объектов на основе двумерных и трехмерных моделей, а также методы распознавания трехмерных объектов. Учебное пособие разработано в рамках выполнения базовой части государственного задания по теме "Информационно-алгоритмическое обеспечение систем цифрового управления, автономной высокоточной навигации и технического зрения для перспективных летательных аппаратов: разработка теоретических основ проектирования, алгоритмов, способов эффективной и надежной программной реализации, использование высокопроизводительной вычислительной инфраструктуры для экспериментального моделирования" № 3442. 1. Методы распознавания образов 1.1. Основные задачи распознавания образов Под образом обычно понимается группа объектов, объединенных по некоторому набору признаков, обладающих характерными свойствами, позволяющими выявлять его представителей. Способ отнесения распознаваемого элемента к какому-либо образу называется решающим правилом. При этом основную роль отнесения элемента к тому или иному образу играет так называемая метрика. Под метрикой понимается расстояние между элементами универсального множества, определяемое по заданному способу. Чем меньше это расстояние, тем более похожими считаются распознаваемые объекты и их образы. В связи с этим эффективность решения задачи распознавания образов в сильной степени зависит от выбора признаков образа и способа определения метрики [1]. При распознавании образов нередко применяются методы обучения, позволяющие повысить эффективность решения задачи распознавания. Обычно методами обучения называют процесс выработки реакции на группы внешних идентичных сигналов путем многократного воздействия на систему внешней корректировки. Такую внешнюю корректировку в обучении
принято называть "поощрениями" и "наказаниями". Механизм генерации этой корректировки практически полностью определяет алгоритм обучения. Самообучение отличается от обучения отсутствием дополнительной информации системы о верности реакции. В качестве наиболее известных примеров задач распознавания образов можно указать: - распознавание объектов; - распознавание текста; - распознавание штрих-кодов; - распознавание автомобильных номеров; - идентификация лиц и других биометрических данных; - распознавание речи. Можно выделить три основных метода распознавания образов: методы перебора, методы с использованием характеристик образов и методы с использованием искусственных нейронных сетей. В случае перебора выполняется простое сравнение объекта с базой данных, содержащей всевозможные модификации отображения. При этом база данных может формироваться из различных видов объекта. Например, могут использоваться изображения объекта, выполненные под различными углами, масштабами, смещениями, деформациями и так далее. Для распознавания текста используются наборы гарнитур шрифтов с различными их начертаниями (полужирный, подчеркнутый, курсив) и т. д. В случае распознавания звуковых образов происходит сравнение с некоторыми известными шаблонами (например, слово, произнесенное одним или несколькими людьми) ограниченного списка слов. Метод, использующий наборы характеристик распознаваемого объекта, позволяет выполнять более глубокий анализ образа. В случае визуального распознавания это может быть определение различных геометрических размеров и частотных характеристик. Звуковой вариант распознавания в этом случае подвергается частотному, амплитудному анализу и т. д.
Использование искусственных нейронных сетей требует либо большого количества примеров задачи распознавания при обучении, либо специальной структуры нейронной сети, учитывающей специфику данной задачи. Тем не менее, его отличает более высокая эффективность и производительность. Процесс решения задачи распознавания можно описать общей моделью классификации. Предполагается наличие множества из m известных классов, представленных набором примеров (эталонных образцов) объекта или в форме его описания. Кроме того, обычно предусматривается и особый класс объектов, состоящий из объектов, которые в процессе распознавания не были отнесены к какому-либо известному классу. Это класс носит название класс выбросов. В процессе классификации объектов для каждого распознаваемого объекта выполняется назначение метки класса, которая определяет его принадлежность к конкретному классу. В качестве такого классификатора может выступать некоторое устройство или алгоритм. Классификатор на входе имеет d-мерный вектор признаков объекта, который обрабатывается блоками, хранящими сведения о каждом из m классов объекта. Результаты обработки вектора признаков служат основанием для назначения соответствующих меток класса, включая и класс выбросов. 1.2. Ошибки распознавания Качество работы классификатора можно охарактеризовать коэффициентом ошибок. Ошибкой считается отнесение входного объекта класса Ci к классу Cj, причем i≠j и Cj не является классом выбросов. Коэффициент ошибок определяется отношением числа ошибок в серии испытаний к общему числу испытаний. Эти коэффициенты могут различаться в каждой серии испытаний и для достаточного множества таких испытаний можно рассчитать математическое ожидание коэффициента ошибок данного классификатора.