Книжная полка Сохранить
Размер шрифта:
А
А
А
|  Шрифт:
Arial
Times
|  Интервал:
Стандартный
Средний
Большой
|  Цвет сайта:
Ц
Ц
Ц
Ц
Ц

Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета, 2008, №36

Покупка
Основная коллекция
Артикул: 640649.0001.99
Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета, 2008, вып. №36 - Краснод.:КубГАУ, 2008. - 278 с.:. - Текст : электронный. - URL: https://znanium.com/catalog/product/615329 (дата обращения: 07.05.2024). – Режим доступа: по подписке.
Фрагмент текстового слоя документа размещен для индексирующих роботов. Для полноценной работы с документом, пожалуйста, перейдите в ридер.
Научный журнал КубГАУ, №36(2), 2008 года 
 
 

http://ej.kubagro.ru/2008/02/pdf/12.pdf
 
 

1

1

УДК 303.732.4 
 
UDC 303.732.4 

СЕМАНТИЧЕСКАЯ ИНФОРМАЦИОННАЯ 
МОДЕЛЬ СК-АНАЛИЗА 
 

SEMANTIC INFORMATION MODEL 
 OF SC-ANALYSIS 

Луценко Евгений Вениаминович  
 д. э. н., к. т. н., профессор 
 

Lutsenko Evgeny Veniaminovich 
Dr. Sci. Econ., Cand. Tech. Sci., professor 

Кубанский государственный аграрный 
университет, Краснодар, Россия 
 

Kuban State Agrarian University, Krasnodar, Russia 

В статье кратко описывается семантическая информационная модель системно-когнитивного 
анализа (СК-анализ), вводится универсальная информационная мера силы и направления влияния 
значений факторов, независимая от их природы и 
единиц измерения на поведение объекта управления (основанная на лемме Неймана – Пирсона), а 
также неметрический интегральный критерий 
сходства между образами конкретных объектов и 
обобщенными образами классов, образами классов 
и образами значений факторов. Идентификация и 
прогнозирование рассматривается как разложение 
образа конкретного объекта в ряд по обобщенным 
образам классов (объектный анализ), что предлагается рассматривать как возможный вариант решения на практике 13-й проблемы Гильберта. 
 

Semantic informational model of systemic-cognitive 
analysis (SC-analysis)  is described in this article 
 in brief, universal information measure of force and 
 direction influence of factors values, independent 
from their nature and measurement units on  the action 
of an  object’s management ( based on the lemma 
Neiman-Pierson), and nonmetric integral criterion  
of similarity between images of concrete objects and 
generic mages of classes, images of classes and images 
of factors values are introduced as well. Identification 
and prognosis are considered as a decomposition 
of an image of a concrete object in a row by generic 
images classes (object analysis), it is offered   
to consider as a possible variant of decision   
of the thirteen problem of Gilbert in practice. 

Ключевые слова: СЕМАНТИЧЕСКАЯ 
ИНФОРМАЦИОННАЯ МОДЕЛЬ, СИСТЕМНОКОГНИТИВНЫЙ АНАЛИЗ (СК-АНАЛИЗ), 
ИНФОРМАЦИОННАЯ МЕРА СИЛЫ И 
НАПРАВЛЕНИЯ ВЛИЯНИЯ ЗНАЧЕНИЙ 
ФАКТОРОВ, ПОВЕДЕНИЕ ОБЪЕКТА 
УПРАВЛЕНИЯ, ЛЕММА НЕЙМАНА – 
ПИРСОНА, НЕМЕТРИЧЕСКИЙ 
ИНТЕГРАЛЬНЫЙ КРИТЕРИЙ СХОДСТВА. 
 
 

Key words: SEMANTIC INFORMATION MODEL, 
SYSTEMIC-COGNITIVE ANALYSIS  
(SC-ANALYSIS), INFORMATION  MEASURE  
OF FORCE AND DIRECTION INFLUENCE   
OF FACTORS VALUES, ACTION OF 
MANAGEMENT OBJECT, LEMMA OF NEIMAN 
AND PIERSON, NONMETRIC INTEGRAL 
CRITERION OF SIMILARITY. 

 
Количество информации в индивидуальных событиях и лемма 
Неймана – Пирсона 
В классическом анализе Шеннона идет речь лишь о передаче символов по одному информационному каналу от одного источника к одному 
приемнику. Его интересует, прежде всего, передача самого сообщения.  
В данном исследовании ставится другая задача: идентифицировать 

информационный источник по сообщению от него. Поэтому метод Шеннона был обобщен путем учета в математической модели возможности 
существования многих источников информации, о которых к приемнику 
по зашумленному каналу связи приходят не отдельные символы-признаки, 
а сообщения, состоящие из последовательностей символов (признаков) 
любой длины. 

Научный журнал КубГАУ, №36(2), 2008 года 
 
 

http://ej.kubagro.ru/2008/02/pdf/12.pdf
 
 

2

2

Следовательно, ставится задача идентификации информационного 
источника по сообщению от него, полученному приемником по зашумленному каналу. Метод, являющийся обобщением метода К. Шеннона, позволяет применить классическую теорию информации для построения моделей систем распознавания образов и принятия решений, ориентированных 
на применение для синтеза адаптивных АСУ сложными объектами. 
Для решения поставленной задачи необходимо вычислять не средние 
информационные характеристики, как в теории Шеннона, а количество 
информации, содержащееся в конкретном i–м признаке (символе) о том, 
что он пришел от данного j–го источника информации. Это позволит определить суммарное количество информации в сообщении о каждом информационном источнике, что дает интегральный критерий для идентификации или прогнозирования состояния АОУ. 
Логично предположить, что среднее количество информации, содержащейся в системе признаков о системе классов 

∑ ∑
=
=
=
W

j

M

i
j
i

ij
ij
p
p

p
Log
p
)
X
,
Y
(I
1
1
2
 
(1)

является усреднением (с учетом условной вероятности наблюдения) "индивидуальных количеств информации", которые содержатся в конкретных 
признаках о конкретных классах (источниках), т.е.: 

.
)
,
(
2
j
i

ij
i
j
p
p

p
Log
y
x
i
=
 
(2)

Выражение (2) определяет так называемую "плотность информации", 
т.е. количество информации, которое содержится в одном отдельно взятом 
факте наблюдения i-го символа (признака) на приемнике о том, что этот 
символ (признак) послан j-м источником. 
Если в сообщении содержится M символов, то суммарное количество 
информации о принадлежности данного сообщения j-у информационному 
источнику (классу) составляет: 

∑
=
=

M

i
j
i

ij
j
p
p

p
Log
x
i

1
2
.
)
(
 
(3)

Необходимо отметить, что применение сложения в выражении (3) 
является вполне корректным и оправданным, так как информация с самого 
начала вводилась как аддитивная величина, для которой операция сложения является корректной. 
Преобразуем выражение (3) к виду, более удобному для практического применения (численных расчетов). Для этого выразим вероятности 
встреч признаков через частоты их наблюдения: 

Научный журнал КубГАУ, №36(2), 2008 года 
 
 

http://ej.kubagro.ru/2008/02/pdf/12.pdf
 
 

3

3

.
1
;
1
;
1

j
j
i
i
ij
ij
N
P
N
P
N
P
=
=
=
 
(4)

Подставив (4) в (3), получим: 

.
)
(

1
2
∑
=
=

M

i
j
i

ij
j
N
N

N
Log
x
i
 
(5)

Если ранжировать классы в порядке убывания суммарного количества информации о принадлежности к ним, содержащейся в данном сообщении (т.е. описании объекта), и выбирать первый из них, т.е. тот, о котором 
в сообщении содержится наибольшее суммарное количество информации, 
то мы получим обоснованную статистическую процедуру, основанную на 
классической теории информации, оптимальность которой доказывается в 
фундаментальной лемме Неймана – Пирсона [1]. 
Таким образом, распознавание образов предполагает принятие решения о принадлежности объекта или его состояния к определенному классу. 
Если до распознавания существовала неопределенность в вопросе о том, к 
какому классу относятся распознаваемый объект или его состояние, то в 
результате распознавания эта неопределенность уменьшается, в том числе 
может быть равна нулю. Понятие "информация" может быть определено, 
как "количественная мера степени снятия неопределенности". Количество 
информации является мерой соответствия распознаваемого объекта (его 
состояния) обобщенному образу класса. 
Количество информации имеет ряд вполне определенных свойств. 
Эти свойства позволяют ввести понятие "количество информации в индивидуальных событиях", которое является весьма перспективным для применения в системах распознавания образов и поддержки принятия решений. 
 
Математическая модель метода распознавания образов и принятия решений, основанного на системной теории информации 
Решение задачи 1: "Синтез семантической информационной модели активного объекта управления" 
Исходные данные для выявления взаимосвязей между факторами и 
состояниями объекта управления предлагается представить в виде корреляционной матрицы – матрицы абсолютных частот (таблица 1). 
В этой матрице в качестве классов (столбцов) приняты будущие состояния объекта управления как целевые, так и нежелательные, а в качестве атрибутов (строк) – факторы, которые разделены на три основных группы, математически обрабатываемые единообразно: факторы, характеризующие текущие и прошлые состояния объекта управления; управляющие 
факторы системы управления; факторы, характеризующие прошлые, те
Научный журнал КубГАУ, №36(2), 2008 года 
 
 

http://ej.kubagro.ru/2008/02/pdf/12.pdf
 
 

4

4

кущие и прогнозируемые состояния окружающей среды. Отметим, что 
форма таблицы 1 является универсальной для представления и обобщения 
фактов – эмпирических данных в единстве их дискретного и интегрального представления (причины – следствия, факторы – результирующие состояния, признаки – обобщенные образы классов, образное – логическое и 
т.п.). 
Управляющие факторы объединяются в группы, внутри каждой из 
которых они альтернативны (несовместны), а между которыми − нет (совместны). В этом случае внутри каждой группы выбирают одно из доступных управляющих воздействий с максимальным влиянием.  Варианты содержательной информационной модели без учета прошлых состояний объекта управления и с их учетом аналогичны, соответственно, простым и составным цепям Маркова, автоматам без памяти и с памятью. 
 
Таблица 1 – МАТРИЦА АБСОЛЮТНЫХ ЧАСТОТ 

 
В качестве количественной меры влияния факторов, предложено использовать обобщенную формулу А. Харкевича (6), полученную на основе 
предложенной эмерджентной (системной) теории информации:  

ϕ

ϕ

W
Log
N
N
N
Log
I

N
Log
W
Log

j
i

ij
ij
2
2

2

2

+
=
 
(6) 

 
При этом по формуле (6) непосредственно из матрицы абсолютных 
частот (см. таблицу 1) рассчитывают матрицу информативностей (таблица 2), которая представляет собой основу содержательной информационной модели предметной области. 
 

Научный журнал КубГАУ, №36(2), 2008 года 
 
 

http://ej.kubagro.ru/2008/02/pdf/12.pdf
 
 

5

5

Весовые коэффициенты (6) таблицы 2 непосредственно определяют, какое количество информации Iij система управления получает 
о наступлении события: "активный объект управления перейдет в j-е 
состояние", из сообщения: "на активный объект управления действует i-й фактор".  
 
 
Таблица 2 – МАТРИЦА ИНФОРМАТИВНОСТЕЙ 

 
Принципиально важно, что эти весовые коэффициенты не определяются экспертами неформализуемым способом, а рассчитываются непосредственно на основе эмпирических данных и удовлетворяют всем ранее 
сформулированным требованиям, т.е. являются сопоставимыми, содержательно интерпретируемыми, отражают понятия "достижение цели управления" и "мощность множества будущих состояний объекта управления" и 
т.д.  
В работе [1] показано, что предложенная информационная мера 
обеспечивает сопоставимость индивидуальных количеств информации, 
содержащейся в факторах (независимо от их природы) о классах, а также 
сопоставимость интегральных критериев, рассчитанных для одного объекта и разных классов, для разных объектов и разных классов. 
Когда количество информации Iij>0 – i-й фактор способствует переходу объекта управления в j-е состояние, когда Iij<0 – препятствует этому 
переходу, когда же Iij=0 – никак не влияет на это. В векторе i-го фактора 
(строка матрицы информативностей) отображается, какое количество информации о переходе объекта управления в каждое из будущих состояний 
содержится в том факте, что данный фактор действует. В векторе j-го состояния класса (столбец матрицы информативностей) отображается, какое 

Научный журнал КубГАУ, №36(2), 2008 года 
 
 

http://ej.kubagro.ru/2008/02/pdf/12.pdf
 
 

6

6

количество информации о переходе объекта управления в соответствующее состояние содержится в каждом из факторов. 
Таким образом, матрица информативностей (см таблицу 2) является обобщенной таблицей решений, в которой входы (факторы) и выходы (будущие состояния АОУ) связаны друг с другом не с помощью классических (Аристотелевских) импликаций, принимающих только значения: 
"Истина" и "Ложь", а различными значениями истинности, выраженными в битах и принимающими значения от положительного теоретически-максимально-возможного ("Максимальная степень истинности"), 
до теоретически неограниченного отрицательного ("Степень ложности"). 
Фактически предложенная модель позволяет осуществить синтез 
обобщенных таблиц решений для различных предметных областей непосредственно на основе эмпирических исходных данных и продуцировать 
на их основе прямые и обратные правдоподобные (нечеткие) логические 
рассуждения по неклассическим схемам с различными расчетными значениями истинности, являющимися обобщением классических импликаций (таблица 3).  
 
Таблица 3 – ПРЯМЫЕ И ОБРАТНЫЕ ПРАВДОПОДОБНЫЕ 
ЛОГИЧЕСКИЕ ВЫСКАЗЫВАНИЯ С РАСЧЕТНОЙ 
(В СООТВЕТСТВИИ С СТИ) СТЕПЕНЬЮ ИСТИННОСТИ 
ИМПЛИКАЦИЙ 

 
 
Приведем пример более сложного высказывания, которое может 
быть рассчитано непосредственно на основе матрицы информативностей, 
которая, по сути, является обобщенной таблицей решений (см. таблицу 2). 
Если A со степенью истинности α(A,B) детерминирует B и если 
С со степенью истинности α(C,D) детерминирует D, и A совпадает по 
смыслу с C со степенью истинности α(A,C), то это вносит вклад в 
совпадение B с D, равный степени истинности α(B,D). 

Научный журнал КубГАУ, №36(2), 2008 года 
 
 

http://ej.kubagro.ru/2008/02/pdf/12.pdf
 
 

7

7

При этом в прямых рассуждениях как предпосылки рассматриваются 
факторы, а как заключение – будущие состояния АОУ, а в обратных – наоборот: как предпосылки – будущие состояния АОУ, а как заключение – 
факторы. Степень истинности i-й предпосылки – это просто количество 
информации Iij, содержащейся в ней о наступлении j-го будущего состояния АОУ. Если предпосылок несколько, то степень истинности наступления j-го состояния АОУ равна суммарному количеству информации, содержащемуся в них об этом. Количество информации в i-м факторе о наступлении j-го состояния АОУ рассчитывается в соответствии с выражением (6) СТИ.  
Прямые правдоподобные логические рассуждения позволяют прогнозировать степень достоверности наступления события по действующим факторам, а обратные – по заданному состоянию восстановить степень необходимости и степень нежелательности каждого фактора для наступления этого состояния, т.е. принимать решение по выбору управляющих воздействий на АОУ, оптимальных для перевода его в заданное целевое состояние.  
Необходимо отметить, что предложенная модель, основывающаяся 
на теории информации, обеспечивает автоматизированное формирования системы нечетких правил по содержимому входных данных, как и 
комбинация нечеткой логики Заде – Коско с нейронными сетями Кохонена. 
Принципиально важно, что качественное изменение модели путем добавления в нее новых классов не уменьшает достоверности распознавания уже 
сформированных классов. Кроме того, при сравнении распознаваемого 
объекта с каждым классом учитываются не только признаки, имеющиеся у 
объекта, но и отсутствующие у него, поэтому предложенной моделью правильно идентифицируются объекты, признаки которых образуют множества, одно из которых является подмножеством другого (как и в Неокогнитроне К. Фукушимы) [1]. 
Данная модель позволяет прогнозировать поведение АОУ при воздействии на него не только одного, но и целой системы факторов: 
).
( ij
j
I
f
I

r

=
 
(7)

В теории принятия решений скалярная функция Ij векторного аргумента называется интегральным критерием. Основная проблема состоит 
в выборе или нахождении такого аналитического вида функции интегрального критерия, который обеспечил бы эффективное решение сформулированной выше задачи АСУ. 
Учитывая, что частные критерии (6) имеют смысл количества информации, а информация, по определению, является аддитивной функцией, предлагается ввести интегральный критерий как аддитивную функцию 
от частных критериев в виде: 

Научный журнал КубГАУ, №36(2), 2008 года 
 
 

http://ej.kubagro.ru/2008/02/pdf/12.pdf
 
 

8

8

).
,
(
i
ij
j
L
I
I

r
r

=
 
(8)

В выражении (8) в круглых скобках обозначено скалярное произведение. В координатной форме это выражение имеет вид: 

,

1∑
=
=

A

i
i
ij
j
L
I
I
, 
(9)

где 
}
I{
I
ij
ij =
r

– вектор j-го состояния объекта управления;  

}
L
{
L
i
i =

r

 – вектор состояния предметной области, включающий все 
виды факторов, характеризующих объект управления, возможные управляющие воздействия и окружающую среду (массив – локатор), т.е. 

−
−
<
<

−

=
.
,0
;
,1
0
:
,

;
,1

действует
не
фактор
й
i
если
ю
истинность
с
действует
фактор
й
i
если
где

действует
фактор
й
i
если

L
i
i
i
i
α
α
α
r
 

В реализованной модели значения координат вектора состояния 
предметной области принимались равными либо 1 (фактор действует), либо 0 (фактор не действует). 
Таким образом, интегральный критерий представляет собой суммарное количество информации, содержащееся в системе факторов различной природы (т.е. факторах, характеризующих объект управления, 
управляющее воздействие и окружающую среду) о переходе активного 
объекта управления в будущее (в т.ч. целевое или нежелательное) состояние. 
В многокритериальной постановке задача идентификации, распозна
вания или прогнозирования состояния объекта управления, при оказании 
на него заданного многофакторного управляющего воздействия Ij, сводится к максимизации интегрального критерия: 

)),
,
((
max
arg
*
i
ij
J
j
L
I
j

r
r

∈
=
 
(10)

т.е. к выбору такого состояния объекта управления, для которого интегральный критерий максимален. 
Задача принятия решения о выборе наиболее эффективного управляющего воздействия является обратной задачей по отношению к задаче 
максимизации интегрального критерия (идентификации и прогнозирования), т.е. вместо того, чтобы по набору факторов прогнозировать будущее 
состояние активного объекта управления (АОУ), наоборот, по заданному 
(целевому) состоянию АОУ определяется такой набор факторов, который с 
наибольшей эффективностью перевел бы объект управления в это состояние.  

Научный журнал КубГАУ, №36(2), 2008 года 
 
 

http://ej.kubagro.ru/2008/02/pdf/12.pdf
 
 

9

9

Предлагается еще одно обобщение этой фундаментальной леммы, 
основанное на косвенном учете корреляций между информативностями в 
векторе состояний при использовании средних по векторам. Соответственно, вместо простой суммы количеств информации предлагается использовать корреляцию между векторами состояния и объекта управления, которая количественно измеряет степень сходства этих векторов: 

(
) (
),
1

1∑
=
−
−
=

M

i
i
j
ij
l
j
j
L
L
I
I
A
I
σ
σ
 
(11)

где 

jI  
– средняя информативность по вектору класса; 

L  
– среднее по вектору идентифицируемой ситуации (объекта); 

j
σ  
– среднеквадратичное отклонение информативностей вектора 
класса; 

lσ  – среднеквадратичное отклонение по вектору распознаваемого 
объекта. 
Выражение (11) получается непосредственно из (9) после замены координат перемножаемых векторов их стандартизированными значениями: 

.
,

l

i
i
j

j
ij
ij
L
L
L
I
I
I
σ
σ
−
→
−
→
 

Необходимо отметить, что выражение для интегрального критерия 
сходства (11) по своей математической форме является корреляцией двух 
векторов. Это означает, что если вектора являются суммой двух сигналов: 
полезного и белого шума, то при расчете интегрального критерия белый 
шум практически не будет играть никакой роли, т.е. его корреляция с самим собой равна нулю по определению. Это означает, что выбранный интегральный критерий сходства является высокоэффективным средством подавления белого шума и выделения полезной информации из 
шума, который неизбежно присутствует в эмпирических данных. 
Важно также отметить неметрическую природу интегрального критерия, благодаря чему является корректным его применение при неортонормированном семантическом информационном пространстве, т.е. в общем случае. 
Результат прогнозирования поведения объекта управления, описанного данной системой факторов, представляет собой список его возможных будущих состояний, в котором они расположены в порядке убывания 
суммарного количества информации о переходе объекта управления в каждое из них. 
Зависимость уровня системности модели от ее ортонормирован
Научный журнал КубГАУ, №36(2), 2008 года 
 
 

http://ej.kubagro.ru/2008/02/pdf/12.pdf
 
 

10

10

ности 
Рассмотрим выражение (12): 

W
Log

C
Log

2

M

1
m

m
W
2∑
=
=
ϕ
. 
(12)

При выполнении операции ортонормирования по классам из модели 
последовательно удаляют те из них, которые наиболее сильно корреляционно связаны друг с другом. В результате, в модели остаются классы, 
практически не коррелирующие, т.е. ортонормированные. Поэтому предположим, что в результате ортонормирования правила запрета на образование подсистем классов становятся более жесткими, и уровень системности модели уменьшается. 
Зависимость степени детерминированности модели от ее ортонормированности 
Рассмотрим выражение (13): 

N
Log
W
Log

2

2

ϕ

=
Ψ
. 
(13)

Так как каждый класс, как правило, описан более чем одним признаком, то при ортонормировании классов и удалении некоторых из них из 
модели суммарное количество признаков N будет уменьшаться быстрее, 
чем количество классов W, поэтому степень детерминированности будет 
возрастать. 
При ортонормировании атрибутов числитель выражения (13) не изменяется, а знаменатель уменьшается, поэтому и в этом случае степень 
детерминированности возрастает. 
Таким образом, ортонормирование модели приводит к увеличению 
степени ее детерминированности. По этой причине предлагается считать "детерминированностью" и "системностью" модели не их значения в 
текущем состоянии модели, а тот предел, к которому стремятся эти величины при корректном ортонормировании модели при достижении ею максимума адекватности. 
Взаимосвязь системной меры целесообразности информации со 
статистикой χ2 и новая мера уровня системности предметной области  
Статистика χ2 представляет собой сумму вероятностей совместного 
наблюдения признаков и объектов по всей корреляционной матрице или 
определенным ее подматрицам (т.е. сумму относительных отклонений частот совместного наблюдения признаков и объектов от среднего): 

∑∑
=
=

−
=

W

j

M

i

ij
t

t
N

1
1

2
2
)
(
χ
, 
(14)