Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета, 2005, №11
Покупка
Основная коллекция
Издательство:
Кубанский государственный аграрный университет
Наименование: Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета
Год издания: 2005
Кол-во страниц: 198
Дополнительно
Вид издания:
Журнал
Артикул: 640544.0001.99
ББК:
УДК:
ГРНТИ:
Скопировать запись
Фрагмент текстового слоя документа размещен для индексирующих роботов.
Для полноценной работы с документом, пожалуйста, перейдите в
ридер.
УДК 303.732.4 АСК-АНАЛИЗ КАК МЕТОД ВЫЯВЛЕНИЯ КОГНИТИВНЫХ ФУНКЦИОНАЛЬНЫХ ЗАВИСИМОСТЕЙ В МНОГОМЕРНЫХ ЗАШУМЛЕННЫХ ФРАГМЕНТИРОВАННЫХ ДАННЫХ Луценко Е.В. – д. э. н., к. т. н., профессор Кубанский государственный аграрный университет В статье предлагается программная идея системного обобщения понятий математики, в частности теории информации, основанных на теории множеств, путем замены понятия множества на более содержательное понятие системы. Частично эта идея была реализована автором при разработке автоматизированного системно-когнитивного анализа (АСК-анализа), математическая модель которого основана на системном обобщении формул для количества информации Хартли и Харкевича. В данной статье реализуется следующий шаг: предлагается системное обобщение понятия функциональной зависимости, и вводятся термины "когнитивные функции" и "когнитивные числа". На численных примерах показано, что АСК-анализ обеспечивает выявление когнитивных функциональных зависимостей в многомерных зашумленных фрагментированных данных. Определим понятие "система" классическим способом, т.е. путем его подведения под более общее понятие "множество" и выделение специфических признаков. Система представляет собой множество элементов, объединенных в целое за счет взаимодействия элементов друг с другом, т.е. за счет отношений между ними, и обеспечивает преимущества в достижении целей. Преимущества в достижении целей обеспечиваются за счет системного эффекта. Системный эффект состоит в том, что свойства системы не сводятся к сумме свойств ее элементов, т.е. система как целое обладает рядом новых, т.е. эмерджентных свойств, которых не было у ее элементов. Уровень
системности тем выше, чем выше интенсивность взаимодействия элементов системы друг с другом, чем сильнее отличаются свойства системы от свойств входящих в нее элементов, т.е. чем выше системный эффект, чем значительнее отличается система от множества. Элементы взаимодействуют (вступают в отношения) друг с другом с помощью имеющихся у них общих свойств, а также свойств, которые коррелируют между собой. Таким образом, система обеспечивает тем большие преимущества в достижении целей, чем выше ее уровень системности. В частности, система с нулевым уровнем системности вообще ничем не отличается от множества образующих ее элементов, т.е. тождественна этому множеству и никаких преимуществ в достижении целей не обеспечивает. Этим самым достигается выполнение принципа соответствия между понятиями системы и множества. Из соблюдения этого принципа для понятий множества и системы следует и его соблюдение для понятий, основанных на теории множеств и их системных обобщений. На этой основе можно ввести и новое научное понятие: понятие "антисистемы", применение которого оправдано в случаях, когда централизация (монополизация, интеграция) не только не дает положительного эффекта, но даже сказывается отрицательно. Антисистемой называется система с отрицательным уровнем системности, т.е. это такое объедение некоторого множества элементов за счет их взаимодействия в целое, которое препятствует достижению целей. Фундаментом современной математики является теория множеств. Эта теория лежит и в основе самого глубокого на сегодняшний день обоснования таких базовых математических понятий, как "число" и "функция". Определенный период этот фундамент казался незыблемым. Однако вскоре работы целой плеяды выдающихся ученых XX века, прежде всего Давида Гильберта, Бертрана Рассела и Курта Гёделя, со всей очевидностью обнажили фундаментальные логические и лингвистические проблемы, в частности проявляющиеся в форме парадоксов теории множеств, что, в свою очередь,
привело к появлению ряда развернутых предложений по пересмотру самых глубоких оснований математики [20]. В задачи данной статьи не входит рассмотрение этой интереснейшей проблематики, а также истории возникновения и развития понятий числа и функции. Отметим лишь, что кроме рассмотренных в литературе вариантов существует возможность обобщения всех понятий математики, базирующихся на теории множеств, в частности теории информации, путем тотальной замены понятия множества на понятие системы и тщательного отслеживания всех последствий этой замены. Это утверждение будем называть "программной идеей системного обобщения понятий математики". Строго говоря, реализация данной программной идеи потребует прежде всего системного обобщения самой теории множеств и преобразования ее в математическую теорию систем, которая будет плавно переходить в современную теорию множеств при уровне системности, стремящемся к нулю. При этом необходимо заметить, что существующая в настоящее время наука под названием "Теория систем" ни в коей мере не является обобщением математической теории множеств, и ее не следует путать с математической теорией систем. Вместе с тем, на наш взгляд, существуют некоторые возможности обобщения ряда понятий математики и без разработки математической теории систем. К таким понятиям относятся прежде всего понятия "информация" и "функция". Системному обобщению понятия информации посвящены работы автора [5], [6], [9], [10], [11] и др., поэтому в данной статье на этом вопросе мы останавливаться не будем. Отметим лишь, что на основе предложенной системной теории информации (СТИ) были разработаны математическая модель и методика численных расчетов (структуры данных и алгоритмы), а также специальный программный инструментарий (система "Эйдос") автоматизированного системно-когнитивного анализа (АСК-анализ), который представляет собой системный анализ, автоматизированный путем его
рассмотрения как метода познания и структурирования по базовым когнитивным операциям. В АСК-анализе теоретически обоснована и реализована на практике в форме конкретной информационной технологии процедура установления новой универсальной, сопоставимой в пространстве и времени, ранее не используемой количественной, т.е. выражаемой числами, меры соответствия между событиями или явлениями любого рода, получившей название "системная мера целесообразности информации", которая по существу является количественной мерой знаний [10]. Это является достаточным основанием для того, чтобы назвать эти числа "когнитивными" от английского слова "cognition" – "познание". В настоящее время функция понимается как соответствие нескольких множеств чисел друг другу. Поэтому виды функций можно классифицировать по крайней мере в зависимости от: - природы этих чисел (натуральные, целые, дробные, действительные, комплексные и т.п.); - количества и вида множеств чисел, связанных друг с другом в функции (функции одного, нескольких, многих, счетного или континуального количества аргументов, однозначные и многозначные функции, дискретные или континуальные функции) [10]; - степени жесткости и меры силы связи между множествами чисел (детерминистские функции, функции, в которых в качестве меры связи используется вероятность, корреляция и другие меры); - степени расплывчатости чисел в множествах и самой формы функции (четкие и нечеткие функции, использование различных видов шкал, в частности интервальных оценок). Так как функции, выявляемые в модели предметной области методом АСК-анализа, связывают друг с другом множества когнитивных чисел, то предлагается называть их "когнитивными функциями". Учитывая перечисленные возможности классификации, когнитивные функции можно
считать недетерминистскими многозначными функциями многих аргументов, в которых в качестве меры силы связи между множествами используется количественная мера знаний, т.е. системная мера целесообразности информации, основанная на интервальных оценках, номинальных и порядковых шкалах и шкалах отношений. Отметим, что детерминистские однозначные функции нескольких аргументов могут рассматриваться как частный случай когнитивных функций, к которому они сводятся при анализе жестко детерминированной предметной области, скажем, явлений, описываемых классической физикой. Рассмотрим пример выявления и определения вида когнитивной функции на данных, моделирующих результаты физического эксперимента Галилея с бросанием бильярдных шаров с разных этажей Пизанской башни (табл. 1). Таблица 1 – РЕЗУЛЬТАТЫ "ЭМПИРИЧЕСКИХ" ИСПЫТАНИЙ ПРИ ОТСУТСТВИИ ШУМА И ФРАГМЕНТАЦИИ Амплитуда сигнала = 1,00. Амплитуда шума аргумента = 0,00. Амплитуда шума функции = 0,00 № Группа Время Высота № Группа Время Высота № Группа Время Высота 1 0 0,00 0,00 18 3 17,00 289,00 35 12 34,00 1156,00 2 0 1,00 1,00 19 3 18,00 324,00 36 12 35,00 1225,00 3 0 2,00 4,00 20 4 19,00 361,00 37 13 36,00 1296,00 4 0 3,00 9,00 21 4 20,00 400,00 38 14 37,00 1369,00 5 0 4,00 16,00 22 4 21,00 441,00 39 14 38,00 1444,00 6 0 5,00 25,00 23 5 22,00 484,00 40 15 39,00 1521,00 7 0 6,00 36,00 24 5 23,00 529,00 41 16 40,00 1600,00 8 0 7,00 49,00 25 6 24,00 576,00 42 17 41,00 1681,00 9 1 8,00 64,00 26 6 25,00 625,00 43 18 42,00 1764,00 10 1 9,00 81,00 27 7 26,00 676,00 44 18 43,00 1849,00 11 1 10,00 100,00 28 7 27,00 729,00 45 19 44,00 1936,00 12 1 11,00 121,00 29 8 28,00 784,00 46 20 45,00 2025,00 13 1 12,00 144,00 30 8 29,00 841,00 47 21 46,00 2116,00 14 2 13,00 169,00 31 9 30,00 900,00 48 22 47,00 2209,00 15 2 14,00 196,00 32 10 31,00 961,00 49 23 48,00 2304,00 16 2 15,00 225,00 33 10 32,00 1024,00 50 24 49,00 2401,00 17 3 16,00 256,00 34 11 33,00 1089,00 51 25 50,00 2500,00
Таблица 1 рассчитана и представлена в графическом виде на рисунке 1 с помощью Excel. Рисунок 1. Модельная зависимость высоты от времени при бросании шаров Затем также средствами Excel первые три столбца данной таблицы записаны в стандарте DBF 4 (dBASE IV) (*.dbf) для передачи в систему "Эйдос", которая работает с этим стандартом баз данных. Затем с использованием стандартного программного интерфейса импорта данных из файлов стандарта, впервые предложенного автору профессором А.Н. Лебедевым при проведении одной из совместных работ (рис. 2), осуществляется автоматизированное формирование классификационных и описательных шкал и градаций и обучающей выборки, т.е. формализация предметной области.
Рисунок 2 – Экранная форма системы "Эйдос", позволяющая запустить программный интерфейс импорта данных из нужного стандарта внешнего файла После синтеза семантической информационной модели (СИМ) (уже содержащей все когнитивные функции) в 3-м режиме 2-й подсистемы системы "Эйдос" осуществляется переход в режим, обеспечивающий графическое отображение когнитивных функций (рис. 3).
Рисунок 3 – Экранные формы выхода на режимы синтеза семантической информационной модели и генерации когнитивных функций После формирования задания на графическое отображение когнитивных функций и его запуска на исполнение получаем результат, представленный на рисунке 4. Рисунок 4 – Пример когнитивной функции, построенной на основе
смоделированных данных в технологии АСК-анализа Сравнение функций на рисунках 1 и 4 показывает их высокую идентичность, что позволяет сделать вывод о том, что технология АСК-анализа обеспечивает выявление закономерностей в эмпирических данных и их отображение в графической форме. Однако остается вопрос о степени адекватности данной технологии при решении подобных задач на многомерных зашумленных фрагментированных данных большой размерности, т.е. на данных, которые чаще всего и встречаются на практике. Под фрагментированными мы понимаем данные с неполными повторностями. Стандартные статистические методы, такие, например, как индексный метод, не позволяют обрабатывать подобные данные, поэтому приходится либо заполнять отсутствующие повторности каким-либо способом, не всегда обоснованным и корректным, либо вообще отказаться от обработки полного массива данных, выбрав из него очень небольшие "корректные" с этой точки зрения фрагменты. Модельные данные представлены в таблице 2. Таблица 2 – РЕЗУЛЬТАТЫ "ЭМПИРИЧЕСКИХ" ИСПЫТАНИЙ ПРИ НАЛИЧИИ ШУМА ПО АРГУМЕНТУ И РЕЗУЛЬТАТУ, НО ПРИ ОТСУТСТВИИ ФРАГМЕНТАЦИИ Амплитуда сигнала = 1. Амплитуда шума аргумента = 10. Амплитуда шума функции = 5000 № Группа Время Высота № Группа Время Высота № Группа Время Высота 1 48 5,78 4792,21 18 35 18,80 3492,74 35 54 38,05 5367,44 2 2 8,39 180,70 19 38 24,20 3783,32 36 22 37,28 2180,54 3 19 3,98 1930,22 20 29 22,32 2885,84 37 26 42,92 2562,97 4 8 10,18 752,70 21 16 21,14 1648,32 38 29 42,19 2858,40 5 13 6,78 1259,30 22 9 23,79 854,88 39 32 45,97 3168,07 6 40 7,36 3965,76 23 26 24,86 2631,81 40 37 47,24 3662,87 7 6 12,27 602,80 24 27 23,18 2694,71 41 34 43,66 3410,73 8 27 12,70 2707,32 25 12 24,36 1218,05 42 47 42,63 4690,27 9 20 15,42 1971,45 26 26 30,46 2625,14 43 38 50,28 3836,79 10 40 11,60 3981,49 27 50 32,42 5015,21 44 55 43,69 5452,67 11 13 17,38 1266,58 28 39 35,72 3945,50 45 22 44,22 2236,85 12 45 14,01 4523,64 29 38 33,50 3836,35 46 70 49,53 6983,14 13 2 13,97 219,87 30 52 35,68 5204,54 47 38 47,35 3821,59
19 22,26 1870,29 31 34 31,44 3418,48 48 64 49,37 6428,55 15 4 15,62 401,40 32 54 36,30 5435,37 49 59 48,91 5901,79 16 35 19,94 3527,71 33 30 32,72 2994,49 50 51 49,34 5058,41 17 15 21,39 1495,18 34 19 42,35 1935,42 51 29 52,58 2916,84 Графическое отображение таблицы 2 и результат восстановления когнитивной функции путем повторения уже перечисленных выше шагов представлены на рисунках 5 и 6. Рисунок 5 – Графическое отображение зашумленных исходных данных Рисунок 6 – Когнитивная функция, выявленная в зашумленных данных Сравнение рисунков 5 и 6 показывает возможность использования АСК анализа для выделения сигнала из шума даже при небольшом объеме обучающей выборки (всего 51 пример) и довольно жестких условиях: - амплитуда шума результата была взята в 5000 раз выше минимального ненулевого значения амплитуды полезного сигнала и в 2 раза выше его максимального значения; - шум аргумента составлял около 20 % от значения аргумента, т.е. был способен смещать данные до 10 позиций между группами всего при 51 позиции. Сравнение рисунков 4, 5 и 6 показывает, что даже в этих условиях, при которых вид полезного сигнала на фоне шума уже практически не