Книжная полка Сохранить
Размер шрифта:
А
А
А
|  Шрифт:
Arial
Times
|  Интервал:
Стандартный
Средний
Большой
|  Цвет сайта:
Ц
Ц
Ц
Ц
Ц

Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета, 2005, №11

Покупка
Основная коллекция
Артикул: 640544.0001.99
Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета, 2005, вып. №11 - Краснод.:КубГАУ, 2005. - 198 с.:. - Текст : электронный. - URL: https://znanium.com/catalog/product/615085 (дата обращения: 29.04.2024). – Режим доступа: по подписке.
Фрагмент текстового слоя документа размещен для индексирующих роботов. Для полноценной работы с документом, пожалуйста, перейдите в ридер.
УДК 303.732.4 

 

АСК-АНАЛИЗ КАК МЕТОД ВЫЯВЛЕНИЯ КОГНИТИВНЫХ 

ФУНКЦИОНАЛЬНЫХ ЗАВИСИМОСТЕЙ В МНОГОМЕРНЫХ 

ЗАШУМЛЕННЫХ ФРАГМЕНТИРОВАННЫХ ДАННЫХ 

 

Луценко Е.В. – д. э. н., к. т. н., профессор 

Кубанский государственный аграрный университет 

 

В статье предлагается программная идея системного обобщения понятий 

математики, в частности теории информации, основанных на теории множеств, 

путем замены понятия множества на более содержательное понятие системы. 

Частично 
эта 
идея 
была 
реализована 
автором 
при 
разработке 

автоматизированного 
системно-когнитивного 
анализа 
(АСК-анализа), 

математическая модель которого основана на системном обобщении формул 

для количества информации Хартли и Харкевича. В данной статье реализуется 

следующий шаг: предлагается системное обобщение понятия функциональной 

зависимости, и вводятся термины "когнитивные функции" и "когнитивные 

числа". На численных примерах показано, что АСК-анализ обеспечивает 

выявление когнитивных функциональных зависимостей в многомерных 

зашумленных фрагментированных данных. 

 

 

Определим понятие "система" классическим способом, т.е. путем его 

подведения под более общее понятие "множество" и выделение специфических 

признаков. Система представляет собой множество элементов, объединенных 

в целое за счет взаимодействия элементов друг с другом, т.е. за счет 

отношений между ними, и обеспечивает преимущества в достижении целей. 

Преимущества в достижении целей обеспечиваются за счет системного 

эффекта. Системный эффект состоит в том, что свойства системы не сводятся 

к сумме свойств ее элементов, т.е. система как целое обладает рядом новых, 

т.е. эмерджентных свойств, которых не было у ее элементов. Уровень 

системности тем выше, чем выше интенсивность взаимодействия элементов 

системы друг с другом, чем сильнее отличаются свойства системы от свойств 

входящих в нее элементов, т.е. чем выше системный эффект, чем значительнее 

отличается система от множества. Элементы взаимодействуют (вступают в 

отношения) друг с другом с помощью имеющихся у них общих свойств, а также 

свойств, которые коррелируют между собой.  

Таким образом, система обеспечивает тем большие преимущества в 

достижении целей, чем выше ее уровень системности. В частности, система с 

нулевым уровнем системности вообще ничем не отличается от множества 

образующих ее элементов, т.е. тождественна этому множеству и никаких 

преимуществ в достижении целей не обеспечивает. Этим самым достигается 

выполнение принципа соответствия между понятиями системы и множества. 

Из соблюдения этого принципа для понятий множества и системы следует и его 

соблюдение для понятий, основанных на теории множеств и их системных 

обобщений. 

На этой основе можно ввести и новое научное понятие: понятие 

"антисистемы", 
применение 
которого 
оправдано 
в 
случаях, 
когда 

централизация (монополизация, интеграция) не только не дает положительного 

эффекта, но даже сказывается отрицательно. Антисистемой называется 

система с отрицательным уровнем системности, т.е. это такое объедение 

некоторого множества элементов за счет их взаимодействия в целое, которое 

препятствует достижению целей. 

Фундаментом современной математики является теория множеств. Эта 

теория лежит и в основе самого глубокого на сегодняшний день обоснования 

таких 
базовых 
математических 
понятий, 
как 
"число" 
и 
"функция". 

Определенный период этот фундамент казался незыблемым. Однако вскоре 

работы целой плеяды выдающихся ученых XX века, прежде всего Давида 

Гильберта, Бертрана Рассела и Курта Гёделя, со всей очевидностью обнажили 

фундаментальные логические и лингвистические проблемы, в частности 

проявляющиеся в форме парадоксов теории множеств, что, в свою очередь, 

привело к появлению ряда развернутых предложений по пересмотру самых 

глубоких оснований математики [20].  

В задачи данной статьи не входит рассмотрение этой интереснейшей 

проблематики, а также истории возникновения и развития понятий числа и 

функции. Отметим лишь, что кроме рассмотренных в литературе вариантов 

существует 
возможность 
обобщения 
всех 
понятий 
математики, 

базирующихся на теории множеств, в частности теории информации, 

путем тотальной замены понятия множества на понятие системы и 

тщательного 
отслеживания 
всех 
последствий 
этой 
замены. 
Это 

утверждение будем называть "программной идеей системного обобщения 

понятий математики".  

Строго говоря, реализация данной программной идеи потребует прежде 

всего системного обобщения самой теории множеств и преобразования ее в 

математическую теорию систем, которая будет плавно переходить в 

современную теорию множеств при уровне системности, стремящемся к 

нулю. При этом необходимо заметить, что существующая в настоящее время 

наука под названием "Теория систем" ни в коей мере не является обобщением 

математической теории множеств, и ее не следует путать с математической 

теорией систем. Вместе с тем, на наш взгляд, существуют некоторые 

возможности обобщения ряда понятий математики и без разработки 

математической теории систем. К таким понятиям относятся прежде всего 

понятия "информация" и "функция". 

Системному обобщению понятия информации посвящены работы автора 

[5], [6], [9], [10], [11] и др., поэтому в данной статье на этом вопросе мы 

останавливаться не будем. Отметим лишь, что на основе предложенной 

системной теории информации (СТИ) были разработаны математическая 

модель и методика численных расчетов (структуры данных и алгоритмы), а 

также 
специальный 
программный 
инструментарий 
(система 
"Эйдос") 

автоматизированного системно-когнитивного анализа (АСК-анализ), который 

представляет собой системный анализ, автоматизированный путем его 

рассмотрения как метода 
познания и структурирования 
по базовым 

когнитивным операциям.  

В АСК-анализе теоретически обоснована и реализована на практике в 

форме конкретной информационной технологии процедура установления новой 

универсальной, 
сопоставимой 
в 
пространстве 
и 
времени, 
ранее 
не 

используемой количественной, т.е. выражаемой числами, меры соответствия 

между событиями или явлениями любого рода, получившей название 

"системная мера целесообразности информации", которая по существу является 

количественной мерой знаний [10]. Это является достаточным основанием для 

того, чтобы назвать эти числа "когнитивными" от английского слова "cognition" 

– "познание".  

В настоящее время функция понимается как соответствие нескольких 

множеств чисел друг другу. Поэтому виды функций можно классифицировать 

по крайней мере в зависимости от: 

- природы этих чисел (натуральные, целые, дробные, действительные, 

комплексные и т.п.); 

- количества и вида множеств чисел, связанных друг с другом в функции 

(функции 
одного, 
нескольких, 
многих, 
счетного 
или 
континуального 

количества аргументов, однозначные и многозначные функции, дискретные 

или континуальные функции) [10]; 

- степени жесткости и меры силы связи между множествами чисел 

(детерминистские функции, функции, в которых в качестве меры связи 

используется вероятность, корреляция и другие меры); 

- степени расплывчатости чисел в множествах и самой формы функции 

(четкие и нечеткие функции, использование различных видов шкал, в частности 

интервальных оценок). 

Так как функции, выявляемые в модели предметной области методом 

АСК-анализа, связывают друг с другом множества когнитивных чисел, то 

предлагается 
называть 
их 
"когнитивными 
функциями". 
Учитывая 

перечисленные возможности классификации, когнитивные функции можно 

считать недетерминистскими многозначными функциями многих аргументов, в 

которых в качестве меры силы связи между множествами используется 

количественная 
мера 
знаний, 
т.е. 
системная 
мера 
целесообразности 

информации, 
основанная 
на 
интервальных 
оценках, 
номинальных 
и 

порядковых шкалах и шкалах отношений. Отметим, что детерминистские 

однозначные функции нескольких аргументов могут рассматриваться как 

частный случай когнитивных функций, к которому они сводятся при анализе 

жестко 
детерминированной 
предметной 
области, 
скажем, 
явлений, 

описываемых классической физикой. 

Рассмотрим пример выявления и определения вида когнитивной функции 

на данных, моделирующих результаты физического эксперимента Галилея с 

бросанием бильярдных шаров с разных этажей Пизанской башни (табл. 1). 

 

Таблица 1 – РЕЗУЛЬТАТЫ "ЭМПИРИЧЕСКИХ" ИСПЫТАНИЙ 
ПРИ ОТСУТСТВИИ ШУМА И ФРАГМЕНТАЦИИ 
Амплитуда сигнала = 1,00. Амплитуда шума аргумента = 0,00. Амплитуда шума 
функции = 0,00 
№ Группа Время Высота № Группа Время Высота № Группа Время Высота
1 
0  
0,00  
0,00  
18
3  
17,00 
289,00 
35
12  
34,00 
1156,00 

2 
0  
1,00  
1,00  
19
3  
18,00 
324,00 
36
12  
35,00 
1225,00 

3 
0  
2,00  
4,00  
20
4  
19,00 
361,00 
37
13  
36,00 
1296,00 

4 
0  
3,00  
9,00  
21
4  
20,00 
400,00 
38
14  
37,00 
1369,00 

5 
0  
4,00  
16,00  
22
4  
21,00 
441,00 
39
14  
38,00 
1444,00 

6 
0  
5,00  
25,00  
23
5  
22,00 
484,00 
40
15  
39,00 
1521,00 

7 
0  
6,00  
36,00  
24
5  
23,00 
529,00 
41
16  
40,00 
1600,00 

8 
0  
7,00  
49,00  
25
6  
24,00 
576,00 
42
17  
41,00 
1681,00 

9 
1  
8,00  
64,00  
26
6  
25,00 
625,00 
43
18  
42,00 
1764,00 

10
1  
9,00  
81,00  
27
7  
26,00 
676,00 
44
18  
43,00 
1849,00 

11
1  
10,00 
100,00 
28
7  
27,00 
729,00 
45
19  
44,00 
1936,00 

12
1  
11,00 
121,00 
29
8  
28,00 
784,00 
46
20  
45,00 
2025,00 

13
1  
12,00 
144,00 
30
8  
29,00 
841,00 
47
21  
46,00 
2116,00 

14
2  
13,00 
169,00 
31
9  
30,00 
900,00 
48
22  
47,00 
2209,00 

15
2  
14,00 
196,00 
32
10  
31,00 
961,00 
49
23  
48,00 
2304,00 

16
2  
15,00 
225,00 
33
10  
32,00 
1024,00 50
24  
49,00 
2401,00 

17
3  
16,00 
256,00 
34
11  
33,00 
1089,00 51
25  
50,00 
2500,00 

Таблица 1 рассчитана и представлена в графическом виде на рисунке 1 с 

помощью Excel. 

 

Рисунок 1. Модельная зависимость высоты от времени при 

бросании шаров 

 

Затем также средствами Excel первые три столбца данной таблицы 

записаны в стандарте DBF 4 (dBASE IV) (*.dbf) для передачи в систему 

"Эйдос", которая работает с этим стандартом баз данных. Затем с 

использованием стандартного программного интерфейса импорта данных из 

файлов 
стандарта, 
впервые 
предложенного 
автору 
профессором 
А.Н. 

Лебедевым 
при 
проведении 
одной 
из 
совместных 
работ 
(рис. 
2), 

осуществляется автоматизированное формирование классификационных и 

описательных шкал и градаций и обучающей выборки, т.е. формализация 

предметной области. 

Рисунок 2 – Экранная форма системы "Эйдос", позволяющая 

запустить программный интерфейс импорта данных из нужного 

стандарта внешнего файла 

 

После синтеза семантической информационной модели (СИМ) (уже 

содержащей все когнитивные функции) в 3-м режиме 2-й подсистемы системы 

"Эйдос" осуществляется переход в режим, обеспечивающий графическое 

отображение когнитивных функций (рис. 3). 

 

Рисунок 3 – Экранные формы выхода на режимы синтеза 

семантической информационной модели и генерации  

когнитивных функций 

 

После формирования задания на графическое отображение когнитивных 

функций и его запуска на исполнение получаем результат, представленный на 

рисунке 4. 

 

Рисунок 4 – Пример когнитивной функции, построенной на основе 

смоделированных данных в технологии АСК-анализа 

Сравнение функций на рисунках 1 и 4 показывает их высокую 

идентичность, что позволяет сделать вывод о том, что технология АСК-анализа 

обеспечивает выявление закономерностей в эмпирических данных и их 

отображение в графической форме. Однако остается вопрос о степени 

адекватности данной технологии при решении подобных задач на многомерных 

зашумленных фрагментированных данных большой размерности, т.е. на 

данных, 
которые 
чаще 
всего 
и 
встречаются 
на 
практике. 
Под 

фрагментированными мы понимаем данные с неполными повторностями. 

Стандартные статистические методы, такие, например, как индексный метод, 

не позволяют обрабатывать подобные данные, поэтому приходится либо 

заполнять отсутствующие повторности каким-либо способом, не всегда 

обоснованным и корректным, либо вообще отказаться от обработки полного 

массива данных, выбрав из него очень небольшие "корректные" с этой точки 

зрения фрагменты. 

Модельные данные представлены в таблице 2. 

 

Таблица 2 – РЕЗУЛЬТАТЫ "ЭМПИРИЧЕСКИХ" ИСПЫТАНИЙ ПРИ 
НАЛИЧИИ ШУМА ПО АРГУМЕНТУ И РЕЗУЛЬТАТУ, 
НО ПРИ ОТСУТСТВИИ ФРАГМЕНТАЦИИ 
Амплитуда сигнала = 1. Амплитуда шума аргумента = 10. Амплитуда шума 
функции = 5000 
№ Группа Время Высота № Группа Время Высота № Группа Время Высота
1 
48  
5,78  
4792,21 18
35  
18,80 
3492,74 35
54  
38,05 
5367,44 

2 
2  
8,39  
180,70 
19
38  
24,20 
3783,32 36
22  
37,28 
2180,54 

3 
19  
3,98  
1930,22 20
29  
22,32 
2885,84 37
26  
42,92 
2562,97 

4 
8  
10,18 
752,70 
21
16  
21,14 
1648,32 38
29  
42,19 
2858,40 

5 
13  
6,78  
1259,30 22
9  
23,79 
854,88 
39
32  
45,97 
3168,07 

6 
40  
7,36  
3965,76 23
26  
24,86 
2631,81 40
37  
47,24 
3662,87 

7 
6  
12,27 
602,80 
24
27  
23,18 
2694,71 41
34  
43,66 
3410,73 

8 
27  
12,70 
2707,32 25
12  
24,36 
1218,05 42
47  
42,63 
4690,27 

9 
20  
15,42 
1971,45 26
26  
30,46 
2625,14 43
38  
50,28 
3836,79 

10
40  
11,60 
3981,49 27
50  
32,42 
5015,21 44
55  
43,69 
5452,67 

11
13  
17,38 
1266,58 28
39  
35,72 
3945,50 45
22  
44,22 
2236,85 

12
45  
14,01 
4523,64 29
38  
33,50 
3836,35 46
70  
49,53 
6983,14 

13
2  
13,97 
219,87 
30
52  
35,68 
5204,54 47
38  
47,35 
3821,59 

19  
22,26 
1870,29 31
34  
31,44 
3418,48 48
64  
49,37 
6428,55 

15
4  
15,62 
401,40 
32
54  
36,30 
5435,37 49
59  
48,91 
5901,79 

16
35  
19,94 
3527,71 33
30  
32,72 
2994,49 50
51  
49,34 
5058,41 

17
15  
21,39 
1495,18 34
19  
42,35 
1935,42 51
29  
52,58 
2916,84 

 

Графическое отображение таблицы 2 и результат восстановления 

когнитивной функции путем повторения уже перечисленных выше шагов 

представлены на рисунках 5 и 6. 

 

Рисунок 5 – Графическое 

отображение зашумленных 

исходных данных 

Рисунок 6 – Когнитивная 

функция, выявленная в 

зашумленных данных 

 

Сравнение рисунков 5 и 6 показывает возможность использования АСК
анализа для выделения сигнала из шума даже при небольшом объеме 

обучающей выборки (всего 51 пример) и довольно жестких условиях: 

- амплитуда шума результата была взята в 5000 раз выше минимального 

ненулевого значения амплитуды полезного сигнала и в 2 раза выше его 

максимального значения; 

- шум аргумента составлял около 20 % от значения аргумента, т.е. был 

способен смещать данные до 10 позиций между группами всего при 51 

позиции. 

Сравнение рисунков 4, 5 и 6 показывает, что даже в этих условиях, при 

которых вид полезного сигнала на фоне шума уже практически не