Методы распознавания сложных систем. Байесовская процедура - оптимальная процедура распознавания
Покупка
Основная коллекция
Издательство:
Автор:
Гупал Виталий Михайлович
Год издания: 2005
Кол-во страниц: 78
Дополнительно
В книге рассмотрены методы распознавания сложных систем. Раскрыта сущность индуктивного подхода как метода изучения объектов в естественных науках. На примере диагностики технических систем показаны преимущества байесовской процедуры распознавания как основы индуктивного подхода. Отражены актуальные вопросы решения сложных комбинаторных задач и Марковская процедура распознавания,исследования генома.
Тематика:
ББК:
УДК:
ОКСО:
- ВО - Магистратура
- 01.04.01: Математика
- 01.04.02: Прикладная математика и информатика
- 02.04.01: Математика и компьютерные науки
ГРНТИ:
Скопировать запись
Фрагмент текстового слоя документа размещен для индексирующих роботов
В.М. Гупал Методы распознавания сложных систем. Байесовская процедура оптимальная процедура распознавания 1* Москва 2005
Ч н ^ Москва 2005
ББК 32.817 Г 94 Гупал В.М. Г 94 Методы распознавания сложных систем. Байесовская процедура оптимальная процедура распознавания. - М.: Компания Спутник+, 2005. - 78 с. В книге рассмотрены методы распознавания сложных систем. Раскрыта сущность индуктивного подхода как метода изучения объектов в естественных науках. На примере диагностики технических систем показаны преимущества байесовской процедуры распознавания как основы индуктивного подхода. Отражены актуальные вопросы решения сложных комбинаторных задач и Марковская процедура распознавания,исследования генома. ББК 32.817 Отпечатано с готового оригинал-макета автора. Гупал В.М., 2005
ВВЕДЕНИЕ Минувший ХХ-й век, как период в истории человечества, на основе достижения им определенного уровня развития называют поразному: веком электричества, атомной энергии, кибернетики, генетики и др. Однако, наиболее правильным было бы назвать его термином «информационный век». В самом деле, по темпам развития основных потоков информации: интернет, мобильные и интеллектуальные системы, электронные вычислительные машины, системы управления оставили позади остальные характеристики минувшего века. Информационный век необычайно разнообразен. Его широкие возможности формируют научный, экономический и культурный потенциалы любого государства, расширяют связь с внешним миром, меняют образ жизни людей. Запуски спутников связи в 60-е годы прошлого столетия открыли эру глобальных коммуникаций. По сравнению с первым поколением ЭВМ сегодняшние компьютеры работают в несколько десятков раз быстрее, обладают более емкой памятью, в тысячи раз более надежны и стоят в тысячи раз дешевле. Область их применения охватывает практически все виды деятельности, связанные с информацией: проведение различного рода исследований, статистический анализ, составление отчетов, учебный процесс, всякого рода проектирование и дизайн - от газетных полос до зданий, управление станками и т.д. Компьютерные системы действуют в области здравоохранения, помогая диагностировать и лечить заболевания, обеспечивая врачам незамедлительный доступ к обширным источникам медицинской информации. Информация как воздух необходима тем, кто ведет научные исследования, внедряет и оценивает новые достижения, кто занят их промышленной и коммерческой реализацией. Обогнав США по производству стали, цемента, электроэнергии, добыче нефти и т.д., мы существенно отстаем в сфере информационных технологий и информации. Однако, наш собственный исторический опыт показывает, что при наличии продуманной государственной политики, при использовании резервов мы сможем превратиться в передовую информационную державу. Гонка за новой технологией убыстряет темп, время от научного открытия до его практического внедрения сокращается. Телефон ждал своего массового потребителя 56 лет /1820-1876 гг./, радио 35 лет /1867-1902 гг./, телевидение 14 лет/1922-1936 гг./, транзистор 5 лет/1956-1961 гг./. з t
В нынешней гонке средств информации участвуют правительства и крупнейшие монополии. Огромные достижения последних десятилетий наложили свой отпечаток на новейшую историю и в большей мере формируют сейчас будущее обществ и определяют человеческое существование. Идет ли речь о производственной технике (станки с числовым программным управлением, роботы, автоматизированное проектирование и централизованное управление производством от ЭВМ, искусственный интеллект и т.д.), о биологической инженерии и биотехнологиях, о новых материалах (лазеры, оптические волокна, обработка изображения...), о космосе (спутники, дистанционное обнаружение....), о новых медицинских инструментах (томограф, ядерный магнитный резонанс....) - ни один вид человеческой деятельности не оказывается вне влияния науки или техники. Уже появились специальные программы, называемые экспертсистемами, которые дублируют работу людей. Некоторые экспертсистемы даже превосходят химиков в интерпретации показаний приборов, распознающих неизвестные химические вещества. Другие системы способны указать расположение подземных залежей минералов, дать инструкции о ремонте механического оборудования, поставить медицинские диагнозы. Заводские роботы могут визуально распознавать детали, сваленные в ящики или движущиеся на конвейере, отбирать их, устанавливать в машины или собирать из них готовые изделия. Новые технологии используются банками для сбора, накопления, хранения, обработки, анализа, передачи на расстояние и представления клиентам разнообразной информации о кредитных сделках, денежных платежах и расчетах и т.д., а также всевозможных сведениях о конъюнктуре рынков, состояния экономики и многих других. Слияние интересов банков и информационной индустрии выдвигает на повестку дня проблему влияния финансовых институтов на международный поток информации. Ныне в области информационной технологии наметилась специализация по регионам: Япония лидирует в производстве массовой продукции, Западная Европа - в производстве и внедрении различных видов телекоммуникаций. По данным экспертов, отставание России оценивается примерно в 10 лет. Контроль США над компьютерным рынком практически обеспечен в ближайшем будущем. Современная информационная технология все чаще обращается к биологическим системам, ища в них резервы для построения более совершенных компьютерных устройств. 4 *
В настоящее время исследования в области искусственного интеллекта преследуют две основные цели: одну, чисто научную, добиться лучшего понимания процессов человеческого мышления путем их имитации, другую цель, инженерную, расширить сферу применения компьютеров, по возможности сделав их умными помощниками человека. Тот, кто будет контролировать революцию в области информации, фактически обретет и далеко идущий геополитический контроль в той или иной форме над миром. Несомненно, при этом необходимо сконцентрировать усилия на относительно немногих, но наиболее важных направлениях, чтобы с меньшими затратами получить ощутимые для экономики и для населения результаты в кратчайшие сроки. В последние годы стали широко применяться модели распознавания с использованием систем искусственного интеллекта, экспертных систем и модели, основанные на использовании алгебры логики. Каждая разновидность систем распознавания имеет свои особенности, что делает её наиболее пригодной для решения одного класса задач и менее пригодной для решения другого. Модели распознавания используют математический и логический аппарат. Математика на протяжении многих столетий использовала метод дедуктивных выводов из небольшого числа принципов, называемых аксиомами. Однако работа в процессе дедуктивного вывода ведется только на одном классе истинных утверждений, ложные утверждения не используются. Нельзя сказать, что аксиоматически-дедуктивный метод был единственным подходом в изучении явлений и процессов реального мира. Альтернативой ему, как это давно было известно математикам и философам, является индуктивный подход, как способ рассуждений от частного к общему. Кроме того, известно, что индуктивный подход основа изучения объектов в естественных науках. Однако, в математике он широко не использовался, поскольку до последнего времени не имел убедительного обоснования. Аксиоматический метод в математике впервые был использован Евклидом в Ш веке до н.э. в его книге «Начала» при изложении основ элементарной геометрии, теории чисел, алгебры и других разделов античной математики. «Начала» Евклида составлены по определенной схеме: сначала приводятся определения и постулаты, а затем формулировки теорем и их доказательства. 5 *
Существует множество альтернативных обоснований индуктивного подхода. «Матерь заблуждений и бедствий всех наук, - писал Ф. Бэкон, есть тот способ открытия и проверки, когда сначала строятся самые общие основания, а потом к ним приспосабливаются и посредством их проверяются аксиомы». Гениальные открытия Гёделя положили начало строгим исследованиям возможностей формализованно-дедуктивного метода познания. Эти открытия были почти полной неожиданностью для науки «догеделевского» периода. Его знаменитая теорема о неполноте, опубликованная в 1931 году, нанесла удар по аксиоматическому подходу. Неудивительно, что она вызвала множество разных толкований. Открытия Гёделя лишая аксиоматически-дедуктивный метод статуса чего-то абсолютного, снимают его гипнотическое воздействие на логиков и математиков, побуждая их не отождествлять более этот метод с дедуктивным методом вообще, искать новые способы умозаключений, ведущие к познанию истины. В этом антидогматическом потенциале заключено философское значение теоремы о неполноте. В истории известно немало случаев, когда идеи ученых возрождаются в более поздние периоды и определяют тенденцию развития различных отраслей знаний.. Аналогичное происходит и с работами Т. Байеса по теории вероятностей. Результаты его исследований были опубликованы 240 лет назад, но настоящий расцвет байесовских методов начался лишь в 1990-е годы и совпал с компьютерной революцией. Формула Байеса лежит в основе индуктивного подхода к распознаванию. Следует отметить, что если в обучающей выборке отсутствует один из классов объектов, то любая процедура распознавания работает плохо. Ключевым моментом обоснования процедур распознавания индуктивного вывода является наличие всех классов в выборке и усреднение погрешности по множеству обучающих выборок. Поэтому попытки оценить процедуры индуктивного вывода без учета таких вопросов не приводили к положительным результатам. Главная цель книги - познакомить читателя с современным состоянием моделей и способов распознавания и показать преимущества Байесовской процедуры распознавания как индуктивного подхода в математике. Приводится пример байесовской процедуры распознавания. 6
Глава 1. МЕТОДЫ РАСПОЗНАВАНИЯ СЛОЖНЫХ СИСТЕМ I. ОСНОВЫ ТЕОРИИ СЛОЖНЫХ СИСТЕМ Управление производством и отраслями народного хозяйства в настоящее время осуществляется при помощи автоматизированных систем управления, обеспеченных современными вычислительными машинами. Производственные объединения, тем более отрасли народного хозяйства, управляемые автоматизированными системами управления, являются типичными представителями сложных систем. Чтобы управлять сложной системой, необходимо составить прогноз поведения управляемого объекта, рассмотреть множество вариантов управляющих воздействий и выбрать из них наиболее эффективные. Изучение прогнозов и процессов управления может быть проведено при помощи современных математических моделей на ЭВМ. С усложнением объектов управления и автоматизированных систем управления появляется необходимость более глубокого анализа их свойств. В результате возрастает объем информации, получаемой с ЭВМ при моделировании. И информация при этом оказывается столь обширной, что затрудняет, а в некоторых случаях искажает практическое осмысление ее человеком. Поэтому используются специальные методы обработки результатов моделирования, которые позволяют представить информацию в удобном и доступном для человека виде. Одно из первых определений сложной системы было дано в 1973 г. Н.П. Бусленко в [1] .Он писал, что систему надо считать сложной, если она состоит из большого числа взаимосвязанных и взаимодействующих между собой элементов, и что сложная система способна выполнять сложную функцию. Против такого достаточно общего определения трудно возразить. Позднее в работе [2] им было дано определение, характеризующее некоторые основные свойства подобных систем: «Сложная система является многоуровневой конструкцией из взаимодействующих элементов, объединяемых в подсистемы различных уровней» [2], а математическая модель сложной системы «состоит из математических моделей элементов и математической модели взаимодействия между элементами» [2] В качестве примеров сложных систем можно привести такие [1]: энергетические комплексы, телефонные сети крупных городов, информационные системы, производственные процессы крупных предприятий, отраслевые автоматизированные системы управления и др. 7