Книжная полка Сохранить
Размер шрифта:
А
А
А
|  Шрифт:
Arial
Times
|  Интервал:
Стандартный
Средний
Большой
|  Цвет сайта:
Ц
Ц
Ц
Ц
Ц

Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета, 2012, №79

Покупка
Основная коллекция
Артикул: 641107.0001.99
Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета, 2012, вып. №79 - Краснод.:КубГАУ, 2012. - 839 с.:. - Текст : электронный. - URL: https://znanium.com/catalog/product/635234 (дата обращения: 05.05.2024). – Режим доступа: по подписке.
Фрагмент текстового слоя документа размещен для индексирующих роботов. Для полноценной работы с документом, пожалуйста, перейдите в ридер.
Научный журнал КубГАУ, №79(05), 2012 года 
 

http://ej.kubagro.ru/2012/05/pdf/18.pdf 

1

УДК 303.732.4 
UDC 303.732.4 

КОЛИЧЕСТВЕННАЯ ОЦЕНКА УРОВНЯ 
СИСТЕМНОСТИ НА ОСНОВЕ МЕРЫ 
ИНФОРМАЦИИ К.ШЕННОНА (конструирование коэффициента эмерджентности Шеннона) 

QUANTIFICATION OF LEVEL OF A SYSTEM, 
BASED ON INFORMATION MEASURES OF  
K.SHENNON (building rate of emergence of Shannon) 
 
 
Луценко Евгений Вениаминович 
д.э.н., к.т.н., профессор 
Lutsenko Evgeny Veniaminovich 
Dr.Sci.Econ., Cand.Tech.Sci., professor 
Кубанский государственный аграрный университет, Россия, 350044, Краснодар, Калинина, 13, 
prof.lutsenko@gmail.com 
 

Kuban State Agrarian University, Krasnodar, Russia 

В статье текст рассматривается как система, включающая вербальные и невербальные подсистемы 
различных уровней иерархии. Предложены системное обобщение классической меры Шеннона 
для количества информации в тексте и основанная 
на ней количественная мера уровня системности 
текста,  названная «коэффициент эмерджентности 
Шеннона». Показана математическая взаимосвязь 
между полученным в 2002 году коэффициентами 
эмерджентности Хартли и предложенным коэффициентом эмерджентности Шеннона. Показано, что 
каждому объекту познания можно поставить в соответствие некий текст, отражающий его состав и 
структуру. Процесс познания с этой точки зрения 
рассматривается как процесс построения текстовых моделей объектов познания и процесс исследования этих моделей. Даны определение процедур шифрования и дешифрования, а также количественные меры их эффективности, основанные на 
количественных мерах системности текстов. С 
этих же позиций раскрыта взаимосвязь шифрования и дешифрования с архивированием и разархивированием. Предложена компьютерная программа 
для численного измерения уровня системности 
конкретных текстов и моделируемых ими систем, 
приведен ряд численных примеров 

In the article, a text is considered as a system, which 
includes both verbal and nonverbal subsystems of different levels of hierarchy. System generalization of the 
classical Shannon measure of information in text and a 
quantitative measure of the level of systematic text, 
called the "coefficient of emergence of Shannon", 
which is based on it, is proposed. This article shows 
mathematical relationship between the obtained coefficients of emergence of Hartley in 2002 and Shannon's 
proposed rate of emergence. It is shown that every 
object of cognition can be associated with a text reflecting its composition and structure. The process of 
learning from this perspective is seen as a process of 
constructing a text object models of learning and research process of these models. The definition of procedures for encryption and decryption, as well as quantitative measures of their effectiveness based on quantitative measures systematic texts is given. From this 
standpoint, the relationship of encryption and decryption with zipping and unzipping is shown. We propose 
a computer program for the numerical measurement of 
systemic and specific texts of the simulated systems 
and present some numerical examples in this article 

 
 
Ключевые слова: АВТОМАТИЗИРОВАННЫЙ 
СИСТЕМНО-КОГНИТИВНЫЙ АНАЛИЗ, 
ИНТЕЛЛЕКТУАЛЬНАЯ СИСТЕМА «ЭЙДОС», 
БАЗА ЗНАНИЙ, СИСТЕМА, ДЕТЕРМИНАЦИЯ, 
ЭМЕРДЖЕНТНЫЕ МАКРОСВОЙСТВА, 
ПОДСИСТЕМА, СЛОЖНОСТЬ, УРОВЕНЬ 
ИЕРАРХИИ ЭШБИ 

Keywords: AUTOMATED SYSTEM-COGNITIVE 
ANALYSIS, INTELLIGENT SYSTEM "EIDOS", 
BASE OF KNOWLEDGE, SYSTEM, 
DETERMINATION, EMERGENT MACRO 
PROPERTIES, SUBSYSTEM, COMPLEXITY, 
LEVEL OF THE HIERARCHY OF  ASHBY 

 
Данная статья посвящена продолжению развития идей, разработке 
которых посвящены работы [6-23]. Естественный язык представляет собой 
мощную и гибкую систему моделирования реальности и является одним из 
начальных этапов объективации (опредмечивания) результатов мышления 
на слабо формализованном уровне [8]. Еще менее формализованным является только мышление без вербализации, известное как медитация (интуитивный уровень). Последовательное повышение степени формализации 
мышления приводит к его объективации в таких формах представления 

Научный журнал КубГАУ, №79(05), 2012 года 
 

http://ej.kubagro.ru/2012/05/pdf/18.pdf 

2

знаний как методики, алгоритмы и структуры данных, математические модели [15, 16].  
Свою функцию системы моделирования язык способен выполнять 
лишь благодаря тому, что его структура приспособлена для отражения 
структуры реальности, для ориентации в которой он используется, т.е. подобна ей [4, 16]. А структура реальности представляет собой иерархию 
взаимосвязанных систем [6, 10, 23] и эти системы существуют, изменяются 
и обладают признаками. Соответственно, для моделирования (отображения) этих свойств систем в языке имеются такие грамматические конструкции, как существительные, глаголы и прилагательные. Но главная особенность языка, как системы моделирования, которая для нас наиболее 
существенна в данной работе, это его иерархическая структура. Это значит, что различным элементам или подсистемам на различных уровнях иерархии систем мы можем поставить в соответствие определенные конструкции иерархической структуры языка, что исключительно удобно и 
наглядно. После этого мы можем исследовать иерархическую структуру 
системы, исследуя ее языковую или текстовую модель, и это исследование 
вполне корректно можно считать исследованием самой моделируемой системы, если эта модель адекватна. 
Традиционно это исследование языковых (лингвистических) моделей объектов и процессов реальности осуществляется на том же слабо 
формализованном уровне, который характерен для этих моделей. С одной 
стороны это придает этим моделям исключительную гибкость и универсальность, а с другой приводит к недостаточной сопоставимости или вообще к несопоставимости результатов исследований в пространстве и времени. Даже и при локальных исследованиях одни результаты сложно сравнивать с другими, т.к. они не выражены в количественной форме. Однако 
преодоление этих недостатков и ограничений традиционного подхода к 
исследованию уровня системности представляет собой определенную 
проблему, связанную с тем, что: 
– недостаточно разработан математический аппарат, позволяющий 
количественно сравнивать уровень системности объектов моделирования в 
различных предметных областях; 
– отсутствует универсальная методика разработки формальных моделей систем в различных предметных областях; 
– отсутствует программный инструментарий, имеющий программный интерфейс с входной формой моделей систем и реализующий математический аппарат исследования их уровня системности. 
Данная статья посвящена решению сформулированной проблемы 
путем постановки и решения соответствующих задач, являющихся этапами ее решения. 
Естественный язык существует в различных формах представления, 
в т.ч. звуковой и текстовой. Текст на естественном языке может быть запи
Научный журнал КубГАУ, №79(05), 2012 года 
 

http://ej.kubagro.ru/2012/05/pdf/18.pdf 

3

сан с помощью различных систем символов: петроглифов, иероглифов, а 
также с помощью фонетического алфавита и специальных знаков, как 
текст данной статьи (далее будем рассматривать этот вариант).  
Естественно, структура текста также отражает структуру естественного языка и реальности. Поэтому текст, как и реальность, представляет 
собой систему, включающую подсистемы различных уровней иерархии: 0м, 1-м, 2-м, 3-м,…, k-м. Рассмотрим, какие уровни иерархии присутствуют 
в тексте монографии, как многоуровневой системе (рисунок 1): 

 
 
Рисунок 1. Текст, как система с 7-ю уровнями иерархии 
 
На рисунке 1 показано 7 уровней иерархии текстовой системы1: 
– 0-й уровень иерархии системы – это сами базовые элементам, т.е. 
элементы исходного множества, на основе которого образуется система, 
т.е. в нашем случае – символы компьютерной таблицы символов; 
– 1-й уровень иерархии системы – это подсистемы, образованные непосредственно из базовых элементов (исключая пробел и знаки препинании), в различном количестве,  сочетаниях и порядке, т.е. это слова; 
– 2-й уровень иерархии системы включает подсистемы, образованные из подсистем предыдущего, 1-го уровня, как элементов, т.е. из слов: 
это предложения; 

                                           
1 Предыдущая попытка исследовать многоуровневые текстовые системы предпринята автором в 2008 
году в работе [17]. 

Научный журнал КубГАУ, №79(05), 2012 года 
 

http://ej.kubagro.ru/2012/05/pdf/18.pdf 

4

– 3-й уровень иерархии системы включает подсистемы, образованные из подсистем предыдущего, 2-го уровня, как элементов, т.е. из предложений: это абзацы; 
– 4-й уровень иерархии системы включает подсистемы, образованные из подсистем предыдущего, 3-го уровня, как элементов, т.е. из абзацев: это подразделы; 
--------------------------------------------------------------------------------------- 
– здесь могут быть подразделы различных уровней; 
--------------------------------------------------------------------------------------- 
– 5-й уровень иерархии системы включает подсистемы, образованные из подсистем предыдущего, 4-го уровня, как элементов, т.е. из подразделов: это разделы; 
– 6-й уровень иерархии системы включает подсистемы, образованные из подсистем предыдущего, 5-го уровня, как элементов, т.е. из разделов: это главы; 
– 7-й уровень иерархии системы представляет собой систему в це
лом; 
– последующие уровни иерархии текстовых систем: различные виды 
каталогов и классификаторов текстов: по жанру, времени написания, автору, тематике и тому подобное, и так далее. Классификаторы текстов по тематике – это УДК, ББК, Перечень специальностей научных работников, 
сайты и сообщества в Internet. 
Таким образом, будем считать, что: 
1. Система включает в свой состав не только базовые элементы, на 
которых она основана, но и различные подсистемы из тех же базовых элементов в различных сочетаниях и эти подсистемы образуют иерархическую структуру системы.  
2. Базовые элементы системы будем считать ее подсистемами нулевого уровня иерархии. 
3. Свойства системы в целом соответствуют ее подсистемам различных уровней иерархии, поэтому все уровни иерархии вполне обоснованно 
можно называть уровнями эмерджентности.  
 
Текст как система обладает определенными системными (эмерджентными или синергетическими) свойствами, которые отсутствуют у его 
элементов и подсистем различных уровней иерархии. Система есть множество взаимосвязанных элементов, что обеспечивает возникновение  новых, 
так называемых системных или эмерджентных свойств, которых не было у 
элементов системы до их объединения в систему, что обеспечивает системе преимущества в достижении целей. Таким образом, понятие системы 
основано на понятии множества, но выходит за его пределы, т.е. является 
его обобщением, т.к. включает также понятия взаимосвязей между элемен
Научный журнал КубГАУ, №79(05), 2012 года 
 

http://ej.kubagro.ru/2012/05/pdf/18.pdf 

5

тами, за счет которых образуются подсистемы различных уровней иерархии, образующие структуру системы [6-23].  
Основными системными свойствами текстов являются логический 
смысл, достоверность, эмоциональная и духовная нагрузка, а также юридическая сила. В текстах различных типов эти системные свойства могут 
быть выражены в различной степени и играют различную роль:  
– в научных текстах основным является смысл и достоверность; 
– в художественных – смысл и эмоциональная и духовная нагрузка 
(«заряд нетождественнсти»); 
– в юридических – смысл и юридическая сила (последняя возникает 
когда в документе представлены все обязательные атрибуты). 
 
В текстах, как системах, можно выделить вербальные (выраженные в 
словах) и невербальные подсистемы (рисунок 2): 
 

 
 
Рисунок 2.  Классификация подсистем в текстах, как системах 
 
1. Вербальные подсистемы это слова, предложения, абзацы, подразделы, разделы, главы (в т.ч. обязательные разделы документа, как системы). 

Научный журнал КубГАУ, №79(05), 2012 года 
 

http://ej.kubagro.ru/2012/05/pdf/18.pdf 

6

2. Невербальные подсистемы можно классифицировать на локальные 
и нелокальные.  
– локальные невербальные подсистемы – это различные изображения 
в тексте: сам стиль написания символов (размер и тип шрифта, его цвет, 
жирность, курсив, подчеркивание и другие свойства символов, определяющие их внешний вид), а также различные эмблемы, логотипы, бланки, 
гербы, печати, графики и диаграммы, фотографии.  
– нелокальные невербальные подсистемы текста связаны с его ритмической и мелодической фонетической структурой, в т.ч. с рифмой. 
Далее мы будем рассматривать лишь вербальные подсистемы текста. 
Основываясь на результатах работ [6-23] будем считать, что: 
1. Чем больше информации содержится в системе, тем более слож
ной она является. 
2. Чем в большей степени количество информации в системе с учетом ее иерархической структуры и подсистем превосходит количество 
информации в ее базовом уровне иерархии, как множестве, тем выше уровень системности (эмерджентность, синергия) данной системы. 

Ральф Хартли2 

В работах [6-23] предложены, обоснованы, 
развиты и исследованы абсолютные и относительные количественные меры уровня системности (эмерджентности) системы, в качестве 
которых автором в 2002 году предложены [6] 
системное обобщение выражения Ральфа Хартли3 для количества информации в системе (1), 
основанной на W базовых элементов и его отношение к классическому количеству информации по Р.Хартли (2) [1] в множестве тех же базовых элементов [1] (3): 
∑
=
=

M

m

m
W
sys
C
Log
I

1
2
                      (1)

W
Log
I klas
2
=
                                                (2) 
Так, например, если в мешке W одинаковых пронумерованных шаров, и мы вытаскиваем наугад, т.е. случайным образом, один из них, то когда узнаем, какой шар мы вытащили, получаем количество информации, 
выражаемой формулой (2). 
Если из того же мешка вытаскивать наугад не только по одному шару, но и по 2, 3, …, W, то когда узнаем, какие шары мы вытащили мы получаем количество информации, определяемое выражением (1). При этом 
сочетания шаров мы рассматривали как различные подсистемы, образо                                           
2 Источник: http://upload.wikimedia.org/wikipedia/commons/0/01/Hartley_ralph-vinton-lyon-001.jpg  
3 См.: http://ru.wikipedia.org/wiki/Хартли,%20Ральф

Научный журнал КубГАУ, №79(05), 2012 года 
 

http://ej.kubagro.ru/2012/05/pdf/18.pdf 

7

ванные на одном и том же базовом множестве элементов. В качестве уровня системности автором было предложено отношение количества информации в системе к количеству информации в ее базовом множестве (3). 

W
Log

C
Log

M

m

m
W

2

1
2∑
=
=
ϕ
                                          (3) 

где: 
W – количество элементов в базовом множестве системы, т.е. на 0-м 
уровне ее иерархии; 
M – максимальное количество базовых элементов в подсистеме 
(максимальный уровень сложности подсистем) M <=W. 
m – число базовых элементов в подсистеме (сложность подсистемы); 
Таким образом, коэффициент эмерджентности Хартли количественно отражает максимально возможную степень отличия системы от множества его базовых элементов. Дело в том, что  реальные системы включают 
не все в принципе возможные подсистемы, а лишь некоторые из них, т.к. 
действуют определенные правила запрета. Поэтому на одном и том же 
множестве базовых элементов могут основываться большое количество 
различных систем, одинаковых по составу (базовым элементам), но отличающихся своими структурами (подсистемами).  
Поскольку для измерения количества информации в системе и ее базовом уровне применялась мера Р.Хартли, то и предложенная автором в 
2002 году в работе [6] количественная мера уровня системности была названа в честь него «коэффициентом эмерджентности Хартли». Однако в 
работах ряда авторов эти и другие результаты преподносятся как собственные без ссылок на первоисточники4.  
Из вышеизложенного ясно, что уровень системности (эмерджентности) системы или ее сложность определяется не только числом базовых 
элементов в ней, но и взаимосвязями между ними, т.е. структурой системы, и при уменьшении интенсивности и количества этих взаимосвязей 
система дезинтегрируется, т.е. структура системы упрощается, пока 
полностью не исчезнет и система не превратится в простое множество собственных базовых элементов. Значит уровень системности или эмерд
                                           
4 Об этом см., например: Вяткин В.В. Групповой плагиат: от студента до министра. // Троицкий вариант. 
№ 91: 08.11.2011 – Электронный ресурс. – [Режим доступа]: http://trv-science.ru/2011/11/08/gruppovojjplagiat-ot-studenta-do-ministra/. Более того, похоже, плагиаторы даже не поняли, что результаты, которые они «приписали себе», принадлежат не Хартли и Харкевичу, а просто названы в их честь автором. 
Это подтверждает и материал: «Примерная программа профессионального модуля ПМ.01 Эксплуатация 
и модификация информационных систем», который легко найти в Internet, сделав запрос: «мера мажоритарности и эмерджентности (ПО ХАРТЛИ И\ИЛИ ХАРКЕВИЧУ) в проектах ИС». Похоже, они «судят 
по себе» и искренне полагают, что не воруют эти научные результаты, а просто «пересказывают классиков» и думают, что точно также как они поступили и те авторы, из работ которых они «взяли» тексты эти 
практически без изменений и без ссылок на источник. 

Научный журнал КубГАУ, №79(05), 2012 года 
 

http://ej.kubagro.ru/2012/05/pdf/18.pdf 

8

жентность системы тем выше, чем выше сила и сложность взаимосвязей между ее базовыми элементами. В работе [6] сформулирована и численно исследована гипотеза о законе возрастания эмерджентности (рисунок 2): 

ЗАКОН ВОЗРАСТАНИЯ ЭМЕРДЖЕНТНОСТИ:

ЧЕМ БОЛЬШЕ ЭЛЕМЕНТОВ В СИСТЕМЕ,
ТЕМ БОЛЬШУЮ ДОЛЮ ОТ ВСЕЙ СОДЕРЖАЩЕЙСЯ
В НЕЙ ИНФОРМАЦИИ СОСТАВЛЯЕТ
СИСТЕМНАЯ ИНФОРМАЦИЯ

Гипотеза 1: "О природе сложности системы":

сложность системы определяется
количеством содержащейся в ней информации

Гипотеза 2: "О видах системной информации":

системная информация включает 2 составляющие
- зависящую от количества элементов системы;
- зависящее также от характера взаимосвязей
   между элементами

Лемма-1:

при увеличении количества элементов в системе доля системной информации в ней возрастает с ускорением, которое постепенно уменьшается.

Лемма-3:

чем меньше элементов
в системе, тем быстрее
возрастает доля информации, содержащейся во взаимосвязях
элементов при возрастании  уровня системности.

Лемма-2:

чем выше уровень системности, тем большая
доля информации системы содержится во
взаимосвязях ее элементов.

Следствие:

увеличение уровня системности влияет на объект
 аналогично повышению
уровня детерминированности: понижение уровня
системности, также как и
степени детерминированности системы приводит
к ослаблению влияния
факторов на поведение
системы, т.е. к понижению
управляемости системы за
счет своего рода
"инфляции факторов"

 
Рисунок 3. Гипотеза о законе возрастания эмерджентности согласно [6] 
 
Основная идея данной статьи – это обобщение приведенных выше 
математических выражений для уровня системности, путем применения 
для измерения количества информации в базовом множестве элементов и 
в системе с учетом ее подсистем не меры Хартли, а более общей меры 
К.Шеннона.  

 
Клод Шеннон в годы открытий5 

Классическая формула, предложенная в 1948 
году Клодом Шенноном6 для измерения суммарного количества информации, содержащегося в последовательности из W символов, каждый из которых встречается в последовательности Ni раз, имеет вид (4) [2, 3]: 

( )
∑
=
−
=

W

i
i
i
p
Log
p
I

1
                   (4)

где: 

i
i
N
p
1
=
                               (5)

 
5 Источник: http://internetua.com/upload/tinymce/images/AleX101/shannon.mouse_in_maze.jpg.jpg 
6 См.: http://ru.wikipedia.org/wiki/Шэннон,%20Клод

Научный журнал КубГАУ, №79(05), 2012 года 
 

http://ej.kubagro.ru/2012/05/pdf/18.pdf 

9

Между выражениями Хартли и Шеннона для количества информации существует простая взаимосвязь. Если в некотором сообщении i-й 
символ встречается Ni раз, то по Р.Хартли (1928) при выборке конкретного 
i-го символа мы получаем: 

i
LogN
I =
                                                   (6) 

информации. В среднем же на один символ при выборке i-го символа мы 
получаем:  

i

i
N
LogN
I =
                                                  (7) 

информации. 
При выборке i-го символа, используя в выражении (7) формулу для 
вероятности выборки какого-либо конкретного i-го символа из их общего 
количества Ni (5) получим: 

( )
i
i
p
Log
p
I
−
=
                                                  (8) 

В выражении (8) для среднего количества информации в i-м символе  
учтено, что: 

(
)
i
i
p
Log
LogN
−
=
, 

т.к. 

i
i
i
LogN
LogN
Log
N
Log
−
=
−
=
1
1
. 

Всего же в сообщении из W символов суммарно в среднем будет содержаться: 

 
( )
∑
=
−
=

W

i
i
i
p
Log
p
I

1
                                            (9) 

информации. Выражение (9) и представляет собой знаменитую формулу 
К.Шеннона для среднего количества информации в сообщении из W символов.  
Формула К.Шеннона считается обобщением формулы Р.Хартли для 
не равновероятных событий. Действительно, если все символы равновероятны, то Ni=1/W и выражение (9) принимает вид (10), т.е. выражение Шеннона преобразуется в выражение Хартли: 

∑
=
=
−
=

W

i
LogW
W
Log
W
I

1

1
1
                                        (10) 

Научный журнал КубГАУ, №79(05), 2012 года 
 

http://ej.kubagro.ru/2012/05/pdf/18.pdf 

10

Если продолжить пример с шарами, которые мы наугад вытаскиваем 
из мешка, то классический подход К.Шеннона предполагает, что шары 
цветные, причем шары каждого цвета пронумерованы отдельно друг от 
друга и в мешке Ni шаров i-го цвета, а всего W шаров. 
Концепция реализации основной идеи состоит в следующем:  
1. Применим меру К.Шеннона для измерения количества информации не только в базовом множестве элементов, но и в системе с учетом ее 
подсистем.  
2. Для этого подсистемы различных уровней иерархии будем считать 
элементами, из которых образуются эти уровни. 
3. Поэтому будем считать, что подсистемы различных уровней иерархии содержат информацию этих уровней точно так же, как базовые 
элементы содержат информацию базового уровня. 
4. Количество информации в системе будем считать суммой количества информации во всех ее уровнях иерархии, включая базовый уровень. 
5. Получим системное обобщение классической формулы Шеннона, 
отражающее количество информации в системе с учетом ее подсистем, а 
не только в ее базовом множестве. 
6. Получим количественную меру уровня системности на основе меры количества информации Шеннона, равную отношению количества информации в системе (измеряемому системным обобщением классической 
формулы Шеннона), к количеству информации  в ее базовом множестве 
(измеряемому классической формулой Шеннона). 
Если продолжить пример с шарами, то обобщать классическую меру 
Шеннона для количества информации, как в случае с выражением Хартли, 
предлагается, разрешив вытаскивать из мешка наугад не по одному шару, а 
по нескольку сразу. Причем, как мы помним, шары цветные и шары каждого цвета пронумерованы отдельно друг от друга, причем в мешке всего 
W шаров: по Ni шаров i-го цвета. 
Реализуем данную концепцию и получим аналитическое выражение 
для количественной меры уровня системности на основе формулы количества информации Шеннона. Затем приведем конкретные численные примеры применения этой меры для оценки уровней системности различных 
текстов и моделируемых ими систем. 
Обратимся к таблице 1, которая представляет собой результат выполнения первых пяти пунктов сформулированной концепции: