Интеллектуальное моделирование сегментации торговых центров на основе самоорганизующихся карт Кохонена

Читать статью

Интеллектуальное моделирование сегментации торговых центров на основе самоорганизующихся карт Кохонена

Бесплатно

Основная коллекция

Тематика: Торговля. Коммерция

Издательство: Науковедение

Авторы: Полупанов Д. В., Хайруллина Н. А.

Год издания: 2014

Кол-во страниц: 16

Дополнительно

Вид издания: Статья

Уровень образования: Аспирантура

Артикул: 472931.0001.99.0019

Аннотация
Коллекции
Классификаторы
Бибзапись
Фрагменты

Исследуется проблема структуризации рынка торговых центров. В отличие от традиционных экспертных и опросных методов предложены методики сегментации торговых центров на основе количественных характеристик. Определены характеристики торговых центров, оказывающие наибольшее влияние на их популярность и посещаемость. С точки зрения моделирования необходимо решить задачу кластеризации, перспективным инструментом решения которой является нейросетевой алгоритм обучения «без учителя» - самоорганизующиеся карты Кохонена (Self Organizing Maps). С целью получения устойчивости оценок применен байесовский подход к регуляризации нейросетей. В результате моделирования на данных по торговым центрам г. Уфы получены устойчивые оценки, которые позволили сделать выводы и практические рекомендации для принятия решений о дальнейшем развитии данного сектора и повышения прозрачности рынка. Визуальный анализ расположения торговых центров на карте с сегментацией по кластерам позволяет сделать вывод о степени насыщения торговыми центрами районов и микрорайонов города, что, в свою очередь, позволяет контролировать количество строящихся торговых центров в городе, а также принимать обоснованные решения о размещении планируемых торговых центров.

Тематика:

0208: Торговля. Коммерция

ББК:

65: Экономика. Экономические науки

УДК:

338: Эк. положение. Эк. политика. Управление и планирование в эк-е. Производство. Услуги. Цены

ГРНТИ:

06.52: Экономическое развитие и рост. Прогнозир-ние и планирование экономики. Экономич. циклы и кризисы

Полупанов, Д. В. Интеллектуальное моделирование сегментации торговых центров на основе самоорганизующихся карт Кохонена / Д. В. Полупанов, Н. А. Хайруллина. - Текст : электронный // Интернет-журнал "Науковедение". - 2014. - №1. - URL: https://znanium.com/catalog/product/475032 (дата обращения: 03.07.2025)

Скопировать запись

Экспорт списка

Excel

RUSMARC .iso

win-1251

UTF-8

RUSMARC .txt

win-1251

UTF-8

IRBIS .txt

win-1251

UTF-8

Фрагмент текстового слоя документа размещен для индексирующих роботов

Интернет-журнал «НАУКОВЕДЕНИЕ»
Выпуск 1, январь – февраль 2014
Опубликовать статью в журнале - http://publ.naukovedenie.ru

Институт Государственного управления, 

права и инновационных технологий (ИГУПИТ)
Связаться с редакцией: publishing@naukovedenie.ru

1

http://naukovedenie.ru 47EVN114

УДК    330.42+332.76

Полупанов Дмитрий Васильевич

ФГБОУ ВПО «Башкирский государственный университет»

Россия, Уфа1

Доцент кафедры «Информационные технологии»

Факультета «Математики и информационных технологий»

Кандидат технических наук
E-Mail: demetrious@mail.ru

Хайруллина Наркас Асхатовна

ФГБОУ ВПО «Башкирский государственный университет»

Россия, Уфа

Аспирант кафедры «Математические методы в экономике»

E-Mail: Kh.Narkas@gmail.com

Интеллектуальное моделирование сегментации торговых 

центров на основе самоорганизующихся карт Кохонена

Аннотация: Исследуется проблема структуризации рынка торговых центров. В 

отличие от традиционных экспертных и опросных методов предложены методики 
сегментации торговых центров на основе количественных характеристик. Определены 
характеристики торговых центров, оказывающие наибольшее влияние на их популярность и 
посещаемость. С точки зрения моделирования необходимо решить задачу кластеризации, 
перспективным инструментом решения которой является нейросетевой алгоритм обучения 
«без учителя» – самоорганизующиеся карты Кохонена (Self Organizing Maps). С целью 
получения устойчивости оценок применен байесовский подход к регуляризации нейросетей. 
В результате моделирования на данных по торговым центрам г. Уфы получены устойчивые 
оценки, которые позволили сделать выводы и практические рекомендации для принятия 
решений о дальнейшем развитии данного сектора и повышения прозрачности рынка. 
Визуальный анализ расположения торговых центров на карте с сегментацией по кластерам 
позволяет сделать вывод о степени насыщения торговыми центрами районов и микрорайонов 
города, что, в свою очередь, позволяет контролировать количество строящихся торговых 
центров в городе, а также принимать обоснованные решения о размещении планируемых 
торговых центров.

Ключевые
слова: Торговый центр; городское планирование; кластеризация; 

структуризация; нейросетевое моделирование; самоорганизующиеся карты Кохонена; 
байесовская регуляризация; интеллектуальное моделирование.

Идентификационный номер статьи в журнале 47EVN114

1 450076, Российская Федерация, Республика Башкортостан, г. Уфа, ул. Заки Валиди, 32

стр. 1

Интернет-журнал «НАУКОВЕДЕНИЕ»
Выпуск 1, январь – февраль 2014
Опубликовать статью в журнале - http://publ.naukovedenie.ru

Институт Государственного управления, 

права и инновационных технологий (ИГУПИТ)
Связаться с редакцией: publishing@naukovedenie.ru

2

http://naukovedenie.ru 47EVN114

Dmitrii Polupanov

Bashkir State University

Russia, Ufa

E-Mail: demetrious@mail.ru

Narkas Khayrullina
Bashkir State University

Russia, Ufa

E-Mail: Kh.Narkas@gmail.com

Intelligent simulation of shopping malls segmentation on the 

basis of Self Organizing Maps technique

Abstract: The article is devoted to the study of shopping malls (SMs) structuring problem. 

The authors suggest using neural network techniques for SMs segmentation based on quantitative 
characteristics – in contrast to traditional expert and polling methods. The authors singled out two 
major characteristic groups of SMs as key structuring factors, that affect their popularity and 
attendance levels the most. The main tool in tackling the clustering problem was presented by a selfteaching neural network algorithm of inverse distribution – Self Organizing Maps. For assessment 
stability the authors resorted to Bayesian approach of neural networks regularization. Stable 
assessment results have been revealed with the help of intelligent simulation of Ufa-city SMs data. 
This assessment information allowed authors to make certain conclusions and practical advice for the 
future development of this market sector and an increase of market transparency. Visual analysis of 
SMs’ location on the city map and their clustering division enables to conclude about SMs 
concentration in different city districts and neighborhoods. Therefore one can control the number of 
shopping malls being built in the city center as well as take a good decision in new shopping malls’ 
location. 

Keywords: shopping center; city planning; clusterization; structurization; neuronetwork 

modeling; Self-organizing map; Bayesian regularization; intellectual modeling.

Identification number of article 47EVN114

стр. 2

Интернет-журнал «НАУКОВЕДЕНИЕ»
Выпуск 1, январь – февраль 2014
Опубликовать статью в журнале - http://publ.naukovedenie.ru

Институт Государственного управления, 

права и инновационных технологий (ИГУПИТ)
Связаться с редакцией: publishing@naukovedenie.ru

3

http://naukovedenie.ru 47EVN114

Введение

Активное строительство торговых центров2 (ТЦ) в России наблюдается с начала 

настоящего века. Новый виток развития экономики государства, доступность информации об 
уровне жизни в более развитых странах, вовлечение в потребительское общество наших 
сограждан явились основными факторами высокого интереса девелоперов3 к строительству 
торговых центров во всех городах России. Если в западных странах на развитие рынка 
современных торговых центров ушло более восьмидесяти лет, то в России данные 
трансформации произошли за пятнадцать. Короткий срок экономических трансформаций, 
неразвитость рыночных и нормативно-правовых отношений привели к множеству ошибок, 
проблем и сложностей в градостроительстве. Ярким примером является Москва, в котором 
ошибки в планировании города, концентрация современных торговых центров в Южном 
округе, создающие дополнительный автомобильный поток, привели к ухудшению дорожной 
ситуации и росту пробок [1]. Проблемы присутствуют и в других городах, но пока в 
относительно меньшей степени.

Большое социальное значение торговых центров для городского населения и 

способность формировать высокую доходность финансовых вложений девелоперов и 
инвесторов являются показателями дальнейшего роста количества торговых центров в 
городах. По данным информационно-консалтингового агентства «ИНФОЛайн» по итогам 
2013 г. объем ввода торговых центров в России составит 3,1 млн. кв. м., что выше 
аналогичного показателя прошлого года почти вдвое [2]. На 2014 год ожидается ввод еще 4 
млн. кв. м торговых площадей в торговых центрах. Более того, как отмечается многими 
международными консалтинговыми компаниями, перспективы строительства торговых 
центров сохраняется вплоть до 2016 года [3]. Данные тенденции повышают важность 
структуризации данных и повышения прозрачности рынка.

Если существующие стандарты позволяют выделить объекты торговых центров, то 

остается нерешенной проблема их сегментации и структуризации по привлекательности для 
потребителей. Структуризация позволит повысить прозрачность рынка для всех игроков и 
идентифицировать вектор дальнейшего развития, проектировать новые объекты с грамотно 
проработанной концепцией, отвечающим потребностям населения. Важность данных проблем 
остро ставятся всеми экспертами рынка недвижимости: аналитиками, консультантами, 
девелоперами. Особо важны данные вопросы для муниципальных органов власти, 
ответственных за утверждение и разрешения строительства новых торговых объектов в 
городе. 

Единой классификации торговых центров в России в настоящее время не существует. 

Есть система, предложенная американским институтом Urban Land Institute (ULI), 
европейские стандарты International Council of Shopping Centres (ICSC, Международного 
совета торговых центров), а также с 2010 г. Национальная система классификации торговых 
центров, разработанная Российским советом торговых центров [4], [5], [6]. Каждая из 
указанных систем классификации имеет существенные недостатки и сложности адаптации к 
отдельным городам: во-первых, ввиду несоотносимых уровней социально-экономического 

2 Торговый центр по Госстандартам России (ГОСТ Р 51303-99, пункт 33) представляет из себя 

«совокупность торговых предприятий и/или предприятий по оказанию услуг, реализующих универсальный 
ассортимент товаров и услуг, расположенных на определенной территории, спланированных, построенных и 
управляемых как единое целое и предоставляющих в границах своей территории стоянку для автомашин».

3 Девелопер – предприниматель, инициирующий и организующий наилучший из возможных вариантов 

развития объектов недвижимости, включая финансирование проекта и реализацию созданного объекта.

стр. 3

Интернет-журнал «НАУКОВЕДЕНИЕ»
Выпуск 1, январь – февраль 2014
Опубликовать статью в журнале - http://publ.naukovedenie.ru

Институт Государственного управления, 

права и инновационных технологий (ИГУПИТ)
Связаться с редакцией: publishing@naukovedenie.ru

4

http://naukovedenie.ru 47EVN114

развития городов; во-вторых, ввиду высокой погрешности при исследовании экспертными и 
опросными методами.

В целом категория коммерческой недвижимости пока слабо исследована в 

отечественной науке. В основном российскими учеными рассматриваются общие вопросы 
экономики недвижимости, оценки недвижимости, а также особенности рынка недвижимости. 
Исследованию и моделированию рынка коммерческой недвижимости как одному из важных 
инвестиционно привлекательных отраслей экономики посвящено мало работ. Более того, 
среди научных трудов российских авторов отсутствуют работы применения методов 
математического моделирования для структуризации и кластеризации рынка торговых 
центров. Все вышесказанное обосновывает актуальность проблемы теоретического и 
методологического исследования тенденций развития рынка торговых центров, аспектов 
построения эффективной системы координации и разработки математических методов 
структуризации и сегментации торговых центров.

1.
Постановка задачи

Повышение структуризации рынка ТЦ сводится к задаче их сегментации, другими 

словами, к задаче кластеризации. Поскольку, количество групп, на которые разбивается 
множество ТЦ изначально, не известно, а определяется по ее результатам. В целом задача 
кластеризации заключается в выделении однородных групп объектов, имеющих схожие 
характеристики. Этот вид анализа позволяет повысить понимание данных путем выделения 
кластерной структуры, а также обнаружить нетипичные объекты, которые невозможно 
присоединить ни к одному из кластеров.

При анализе привлекательности ТЦ г. Уфа нами выделено несколько ключевых 

факторов, которые отражают популярность объекта, уровень посещаемости, качество 
предоставляемых услуг [7].

Одним из главных факторов, который оказывает влияние на посещаемость ТЦ г. Уфа,

является месторасположение объекта. В данном критерии рассматриваются: престижность 
района расположения объекта, транспортная доступность, уровень пешеходного и 
автомобильного трафика.

Исторически сложилась градация в престижности районов города. На это оказывает 

влияние концентрация достопримечательных мест, музеев, памятников, уровень развития
инфраструктуры, деловой активности, плотность населения, концентрация административных 
органов, учебных заведений, центральных офисов банков и других компаний.

Транспортная доступность является одним из неформализованных критериев, но 

оказывающим весомый вклад в формирование потребительских предпочтений. В рамках 
данного фактора рассматриваются такие показатели, как удобство транспортных развязок, 
возможности беспрепятственного доступа из любого района города, а также уровень доступа 
на общественном транспорте.

Высокие показатели пешеходного и автомобильного трафиков создают более высокие 

показатели посещаемости торгового центра. Так как, основная часть населения, стремясь 
экономить время, посещает торговые центры, которые находятся в местах их постоянного 
пребывания, или которые находятся «по пути».

Следующим критерием, оказывающим влияние на привлекательность ТЦ, является 

площадь объекта. Чем больше площадь объекта, тем больший товарный ассортимент в нем 
представлен и выше возможность для размещения зоны отдыха и развлечений. Важно 
выделить связь между общей (GBA) и торговой площадью объекта (GLA), который можно

стр. 4

Интернет-журнал «НАУКОВЕДЕНИЕ»
Выпуск 1, январь – февраль 2014
Опубликовать статью в журнале - http://publ.naukovedenie.ru

Институт Государственного управления, 

права и инновационных технологий (ИГУПИТ)
Связаться с редакцией: publishing@naukovedenie.ru

5

http://naukovedenie.ru 47EVN114

охарактеризовать коэффициентом, показывающим долю торговой площади в общей. Значение 
коэффициента близкое к единице указывает на малый размер свободного пространства: 
меньше мест отводится на коридоры, атриумы, зоны отдыха, что, безусловно, является 
отрицательным фактором для уюта торгового центра.

Важным условием доходности и привлекательности торгового центра является 

правильно сформированный пул арендаторов. Якорные арендаторы выполняют функцию 
формирования потока посетителей. Очень важна сила бренда: его уровень узнаваемости и 
лояльности. Набор остальных арендаторов подытоживает концепцию торгового центра. 
Однако процесс создания набора арендаторов для уфимских ТЦ сопряжен с рядом 
особенностей, основная из которых – однообразие пула арендаторов. Это объясняется 
схожестью целевых аудиторий существующих ТЦ и недостаточным количеством торговых 
операторов, присутствующих на рынке. Создание эксклюзивных пулов в уфимских торговых 
центрах процесс довольно сложный, который связан с рядом причин, таких как: неготовность 
федеральных и международных ритейлеров выходить на рынок, ввиду недостатка 
качественных торговых центров и административных барьеров.

Для уровня посещаемости не менее важным является наличие удобного и вместимого 

паркинга, что обеспечивает удобство подъезда на автомобиле. Соответственно ее отсутствие 
или непродуманная организация заметно снижают уровень посещаемости объекта.

Дополняющим фактором для привлекательности ТЦ является наличие общественного 

питания. Фуд-корт с качественными и оригинальными концепциями –
это серьезное 

конкурентное преимущество, возможность выделиться и привлечь дополнительных 
посетителей.

Развлекательная зона способствует формированию «лояльности к месту», постепенно 

превращая ТРЦ в место отдыха. На сегодняшний день кинотеатры, игровые автоматы, 
видеоигры остаются самым массовым видом развлечений, и с их открытием посещаемость 
комплекса значительно возрастает.

В качестве результирующего фактора, который отражает высокий уровень спроса, как 

со стороны потребителей, так и со стороны ритейлеров, а значит и высокий уровень 
привлекательности выступает величина арендных ставок в торговых центрах, которые 
установлены на конкурентном рынке.

Таким образом, вышеперечисленные факторы можно соотнести к двум группам: 

описывающим 
месторасположение 
объекта 
и 
идентифицирующим 
внутренние 

характеристики. Формализуем вышеперечисленные факторы, соотнеся по группам.

Первая группа – критерии идентифицирующие месторасположение объекта: 

– престижность района расположения объекта, определяется экспертно; 

и 
–
уровни пешеходного и автомобильного трафика соответственно, 

определяются на основе подсчета потоков населения и автомобилей в час; 

– транспортная доступность, определяется экспертно. 

Вторая группа – внутренние характеристики ТЦ: 

– общая площадь объекта (GBA), м2;

– торговая площадь объекта (GLA), м2;

– количество машиномест на паркинге ТЦ;

1
x

2
x
3
x

4
x

5
x

6
x

7
x

стр. 5

Интернет-журнал «НАУКОВЕДЕНИЕ»
Выпуск 1, январь – февраль 2014
Опубликовать статью в журнале - http://publ.naukovedenie.ru

Институт Государственного управления, 

права и инновационных технологий (ИГУПИТ)
Связаться с редакцией: publishing@naukovedenie.ru

6

http://naukovedenie.ru 47EVN114

и 
– уровни «якорных» и сопутствующих арендаторов – критерии, оцениваемые 

на основе экспертных оценок;

и 
– наличие общественного питания и развлекательная составляющая 

(измеряются на основе экспертных оценок).

– величина средней арендной ставки по торговому центру. 

2.
Самоорганизующиеся карты Кохонена как основной инструментарий 
моделирования

В настоящее время существует несколько подходов к решению задачи кластерного 

анализа, которые основаны на различных представлениях о природе задач. Среди наиболее 
часто используемых выделяются вероятностный, иерархический, логический, теоретикографовый подходы, а также подходы на основе систем искусственного интеллекта и др. 

Выбор методики кластеризации – вопрос не простой. Исходя из структуры имеющихся 

данных, а также ввиду неудовлетворительных вычислительных экспериментов проведенных 
по ряду подходов, было принято остановить внимание на подходах, основывающихся на 
системах 
искусственного 
интеллекта, 
в 
частности 
нейросетевых. 
Достоинствами 

моделирования на основе нейронных сетей являются хорошая интерпретируемость, 
возможность обрабатывать разнотипные переменные, выделять наиболее важные факторы. 
Самоорганизующиеся карты Кохонена (Self Organizing Maps – SOM) – это одна из 
разновидностей нейросетевых алгоритмов, выполняющих задачу кластеризации. Отличием 
данной нейросетевой парадигмы является то, что при обучении используется метод обучения 
«без учителя», то есть результат обучения зависит только от структуры входных 
данных. Поэтому кластерный анализ на базе SOM в отличие от большинства математикостатистических методов практически не накладывает никаких ограничений на вид 
рассматриваемых объектов, и позволяет рассматривать множество исходных данных 
практически произвольной природы.

Изложим основные положения применяемого алгоритма [8]. SOM предъявляется для 

обучения выборка данных, состоящих из совокупности n-мерных векторов 
. Число 

кластеров и «зашитые» в данных экономические закономерности неизвестны. После обучения 
сеть должна разбить данные на непересекающиеся классы (кластеры) и отобразить элементы 
кластеров на двух– или трехмерную решетку (топографическую карту) так, чтобы близким 
точкам в данных соответствовали близкие нейроны решетки [9]. 

Алгоритм формирования SOM начинается с инициализации синаптических весов сети 

{wk},
– им присваиваются малые значения, сформированные генератором случайных 

чисел. При таком формировании весов карта признаков {Yk} изначально не имеет какого–либо 
порядка признаков: их распределение по выходным нейронам случайно [8], [10].

Вектор синаптических весов каждого k-го нейрона должен иметь ту же размерность n, что 

и размерность входных векторов
:

где l – общее количество нейронов в решетке сети.

Для того чтобы подобрать наилучший вектор весов 
, соответствующий в k-ом нейроне 

входному вектору 
, нужно сравнить скалярное произведение 
для всех конкурирующих 

8
x
9
x

10
x
11
x

12
x

 

N
i

i
i





1



n
k
,1


n
R






1,
2,.....,
,
1,2,... ,

n

T

K
K
K
K
w
w
w
w
k
l



w









 T

K
w

стр. 6

Интернет-журнал «НАУКОВЕДЕНИЕ»
Выпуск 1, январь – февраль 2014
Опубликовать статью в журнале - http://publ.naukovedenie.ru

Институт Государственного управления, 

права и инновационных технологий (ИГУПИТ)
Связаться с редакцией: publishing@naukovedenie.ru

7

http://naukovedenie.ru 47EVN114

нейронов 
и выбрать наибольшее значение. Таким образом, выбирая нейрон-победитель с 

наибольшим скалярным произведением 
, мы в итоге определяем местоположение в 

выходном слое, которое должно стать центром топологической окрестности возбужденного 
нейрона.

Нейрон-победитель находится в центре топологической окрестности сотрудничающих 

(кооперирующихся) с ним нейронов. Для описания ширины этой окрестности лучше всего 
подходит функция Гаусса (рис. 1):

,             
(1)

где 
– топологическая окрестность с центром в победившем нейроне 
; 

q – номер другого нейрона в этой зоне, находящегося на латеральном расстоянии

от нейрона–победителя по эвклидовой мере;

– параметр распределения, т.е. эффективная ширина колоколообразной кривой (1) 

(рис. 1).

Рис. 1. Гауссова функция окрестности

За счет постепенного уменьшения ширины 
функции топологической окрестности 

функции 
достигается уменьшение размера топологической окрестности и 
. 

Одним из вариантов зависимости 
от дискретного времени (или шага итерации) t является 

экспоненциальное убывание:

(2)

где 
– начальное значение величины 
в алгоритме SOM; 

– некоторая временная константа.

Для самоорганизации сети вектор синаптических весов 
нейрона k должен изменяться 

в соответствии с входным вектором 
, т.е. подстраиваться к нему. Одним из значимых 

параметров для реализации вышеуказанного является скорость изменения весов при обучении, 
характеризуемой параметром 
, экспоненциально изменяющийся в зависимости от номера 

повторного прогона обучающей выборки (фактически от времени t): 

l
k
,1








 T

K
w


















2

2

,
2

,
exp
*


q
k

q
k

d
h

q
kh
,
*
 


*
k

q
k
d
,






)
(
,
,
q
k
q
k
d
h


q
kh
,




 
...,
,2
,1,0
,
exp

1

0











t
t
t




0



1


k
w




)
(t


стр. 7

Интернет-журнал «НАУКОВЕДЕНИЕ»
Выпуск 1, январь – февраль 2014
Опубликовать статью в журнале - http://publ.naukovedenie.ru

Институт Государственного управления, 

права и инновационных технологий (ИГУПИТ)
Связаться с редакцией: publishing@naukovedenie.ru

8

http://naukovedenie.ru 47EVN114

,                                             (3)

где 
– еще одна константа алгоритма SOM. 

3.
Байесовский подход к регуляризации нейросетевых моделей кластеризации

Причиной неудовлетворительного качества кластеризации с помощью нейросетевых 

инструментариев может явиться сильная зависимость результатов кластеризации от 
параметров настройки SOM [11].

Вопросам регуляризации экономико-математических моделей уделяется достаточное 

внимание, поскольку это улучшает их адекватность и повышает качество получаемых 
решений. В частности, применительно к использованию нейронных сетей, данный вопрос 
проработан С.А. Шумским, для случаев, когда выполняются условия соответствия исходных 
данных гауссовым смесям распределения плотности вероятности кластеризируемых объектов 
[12].

Однако имеются классы прикладных задач, в которых не выполняется требование 

возможности представления данных в виде смеси гаусовских распределений в силу сильного 
искажения исходных данных и их малого объема [13]. В этой связи актуальным является 
вопрос теоретического обоснования регуляризации нейросетевых кластеризаторов при 
невыполнении указанных требований.

В работах С.А. Горбаткова, Д.В. Полупанова и др. исследуются методы 

предрегуляризации и регуляризации нейросетевых моделей на основе байесовского подхода в 
условиях искажения информационного пространства признаков. Применительно к SOM
особая идея заключается в следующем. Введем критерий качества кластеризации:

,                                                       (4)

где 
и Q – соответственно номер гипотезы-нейросети в байесовском ансамбле и 

их обще количество; 
– число элементов, попавших в m-ый кластер; 
– центр m-го 

кластера в n-мерном евклидовом пространстве признаков; 
– евклидово расстояние 

от исследуемого объекта 
до центра своего m-го кластера; 
– расстояние между l
ым и m-ым кластерами; М – количество кластеров.

Главные идеи байесовского подхода [12], применительно к кластеризации следующие:

•
Выбор ансамбля априорных гипотез-нейросетей 
, где W – множество 

параметров модели (синаптических весов), осуществляется из фиксированного 
класса (семейства) H мета–гипотез (SOM).

•
Апостериорная фильтрация обученных гипотез-нейросетей осуществляется по 
критерию, оценивающему качество кластеризации (4) как по плотности 
группировки объектов вокруг центров кластеров (числитель отношения (4)), так 
и по удалению кластеров друг от друга (знаменатель в (4).

 
,...
2,1,0
)
exp(

2

0






t
t
t

2






 











M

i

M

i
l

цm
цl

M

m

N

i

цm
im

q

d

d

m

1
1

2

1
1

2

,

,

x
x

x
x

Q
q
,1


m
N
цm
x



цm
im
d
x
x ,

im
x


цm
цl
d
x
x ,





W
hq
,x

стр. 8

Интернет-журнал «НАУКОВЕДЕНИЕ»
Выпуск 1, январь – февраль 2014
Опубликовать статью в журнале - http://publ.naukovedenie.ru

Институт Государственного управления, 

права и инновационных технологий (ИГУПИТ)
Связаться с редакцией: publishing@naukovedenie.ru

9

http://naukovedenie.ru 47EVN114

•
После фильтрации гипотез-нейросетей осуществляется усреднение критерия 
качества разбиения векторов x на кластеры по (4) на отфильтрованном ансамбле 
гипотез-нейросетей.

В предлагаемом методе байесовской регуляризации нейронной сети формула Байеса 

непосредственно не используется для апостериорной оценки вероятности 
, где 

– апостиорная вероятность выбранных гипотез-нейросетей; 
– множество априорно 

выбранных гипотез-нейросетей в ансамбле; H – мета-гипотеза 
; D – множество 

данных, поскольку для оценки указанной вероятности через функцию правдоподобия 
требуется априорное знание аналитической формы закона распределения кластеризуемых 
векторов x, например, в виде гауссовой смеси. Такого знания у нас нет. Поэтому 
апостериорные вероятности 
, несущие информацию о качестве разбиения данных

D на кластеры, в предлагаемом методе, оцениваются косвенно путем фильтрации гипотез –
нейросетей 
по критерию (4).

Фильтрация гипотез-нейросетей для случая с большим разбросом качества разбиения 

осуществляется следующим образом. Организуется итерационный процесс пошагового 
отбора (удаления из ансамбля) гипотез-нейросетей 
с низким качеством кластеризации (4), 

т.е. большим значением 
:

,
(5)

где 
номер гипотезы–нейросети, успешно прошедшей процедуру фильтрации; 
–

желаемое значение качества фильтрации, определяемое в предварительных вычислительных 
экспериментах; 
– совокупность вектор-строк данных.

После 
фильтрации 
(5) 
уточненные 
значения 
центров 
кластеров 
и 

соответствующего им критерия качества разбиения (H) по (2.3.3) находятся как усредненные 
на отфильтрованном байесовском ансамбле величины: 

; 
.
(6)

В случае, если SOM в байесовском ансамбле имеют большой разброс по критерию 

качества кластеризации (4), требуется осуществить процедуру регуляризации. Одним из 
подходов может служить селекция признаков [14]. Имеются различные способы её 
осуществления. Например, скалярная селекции признаков, сущность которой состоит в 
оценке дискриминантной способности каждого отдельного признака 
путем проверки 

соответствующих статистических гипотез о законах распределения плотности вероятности 
анализируемого признака в разных кластерах [11]. 

4.
Количественные оценки

Для построения модели были использованы данные по 67 торговым центрам г. Уфы. 

Кластеризация была проведена при помощи академической версии программного пакета 
Deductor Studio Lite 5.1.

Фрагмент исходных данных представлен в таблице 1.





H
D
h
P
q
|
|
)
(
P

 
qh

 


H
hq 





H
D
h
P
q
|
|

 
qh

 
qh





H
D
W
x
hq
q
|
|
,


Q
q
q
q
,1
;
:
0







q
0


 

N
j

N
i
ijx
D

,1

,1








цm
x







Q

Q

q

q
цm

цm

*

* 1

,
x

x
 

 






Q

H

H

Q

q

q

*

*

*

1
*

jx

стр. 9

Интернет-журнал «НАУКОВЕДЕНИЕ»
Выпуск 1, январь – февраль 2014
Опубликовать статью в журнале - http://publ.naukovedenie.ru

Институт Государственного управления, 

права и инновационных технологий (ИГУПИТ)
Связаться с редакцией: publishing@naukovedenie.ru

10

http://naukovedenie.ru 47EVN114

Таблица 1

Исходные параметры

№
Торговые 

центры

1
Водолей
6
5000
8640
8
6000
3000
30
3
4
0
0
1000

2
Галерея 

АРТ
9
9000
5040
9
31000
20000
290
3
10
5
1
2500

3
Галле
8
7500
5000
9
8192
5312
50
3
5
0
0
1200

4
Звездный
6
6120
6840
7
13343
10000
1283
3
6
0
0
1250

5
Иремель
7
9750
7700
9
60000
24000
1200
7
7
5
1
1725

6
Июнь
8
7800
9500
10
42000
25500
425
9
10
5
0
2750

7
Мир
8
13000
17000
10
50300
25000
350
8
10
5
1
2700

…
…
…
…
…
…
…
…
…
…
…
…
…
…

Источник: составлено авторами

Был 
сформирован 
байесовский 
ансамбль 
априорных 
гипотез-нейросетей 

, q=1,2,..25 по всем по всем признакам. В данных гипотезах-нейросетях 

варьировались два параметра SOM  𝜏1, формирующего ширину функции окрестности в
итерационном процессе обучения и 𝜏2, формирующего скорость обучения, которая должна 
уменьшаться в итерационном процессе модификации синаптических весов.

В различных сочетаниях параметров 𝜏1 и 𝜏2 было образовано в байесовском ансамбле 

= 25 SOM. Далее были рассчитаны критерии качества кластеризации.

Предварительные вычислительные эксперименты по выбору параметров адаптивного 

процесса SOM проводились по алгоритму начальной ширины функции топологической 
окрестности, начальной скорости обучения, числа эпох (итераций) процесса модификации 
весов. Были выбраны следующие параметры, которые затем фиксировались во всех 25 SOM:

𝑇=500, 𝜂0=0,3, 𝐺0=4

В результате кластеризации данные разбивались на 3 кластера. В таблице ниже 

приведены значения параметров обучения и критерия качества кластеризации.

Таблица 2

Значения параметров обучения и критерия кластеризации

Параметр 

𝝉𝟏

Радиус 

обучения. 

Конец

Параметр 

𝝉𝟐

Скорость 
обучения. 

Конец

Критерий 
качества

140
0,112463
125
0,005495
0,000035769

140
0,112463
250
0,040601
0,000056517

140
0,112463
375
0,079079
0,000056246

140
0,112463
500
0,110364
0,000057769

140
0,112463
625
0,134799
0,000056401

280
0,610709
125
0,005495
0,000048888

280
0,610709
250
0,040601
0,000051646

280
0,610709
375
0,079079
0,000052944

280
0,610709
500
0,110364
0,000054573

280
0,610709
625
0,134799
0,000055130

420
1,216311
125
0,005495
0,000040576

1
x
2x
3x
4x
5x
6x
7x
8x
9x
10
x
11
x
12
x

}
H
|)
W
,x
(
h
{
q



стр. 10