Книжная полка Сохранить
Размер шрифта:
А
А
А
|  Шрифт:
Arial
Times
|  Интервал:
Стандартный
Средний
Большой
|  Цвет сайта:
Ц
Ц
Ц
Ц
Ц

Нейронные сети в прикладной экономике

Покупка
Артикул: 799656.01.99
Доступ онлайн
300 ₽
В корзину
В учебном пособии показаны методы настройки нейронных сетей и распознавания образов для решения задач прикладной экономики, в том числе персептрон Розенблатта, сеть Хемминга, методы линейного программирования. Рассмотрены также методы коллективных решений. Приводятся примеры задач и упражнения. Для магистрантов, изучающих дисциплину «Нейронные сети в прикладной экономике».
Трофимова, Е. А. Нейронные сети в прикладной экономике : учебное пособие / Е. А. Трофимова, В. Д. Мазуров, Д. В. Гилев ; под общ. ред. Е. А . Т рофимовой ; М-во образования и науки Рос. Федерации, Урал. федер. ун-т. - Екатеринбург : Изд-во Уральского ун-та, 2017. - 96 с. - ISBN 978-5-7996-2018-9. - Текст : электронный. - URL: https://znanium.com/catalog/product/1945222 (дата обращения: 27.07.2024). – Режим доступа: по подписке.
Фрагмент текстового слоя документа размещен для индексирующих роботов. Для полноценной работы с документом, пожалуйста, перейдите в ридер.
Министерство образования и науки российской Федерации 

уральский Федеральный университет  
иМени первого президента россии б. н. ельцина

е. а. трофимова 
вл. д. Мазуров 
д. в. гилёв

нейронные сети 
в прикладной эконоМике

рекомендовано методическим советом урФу 
в качестве учебного пособия для студентов, обучающихся 
по программе магистратуры по направлению подготовки  
38.04.01 «экономика»

екатеринбург 
издательство уральского университета 
2017

ббк у.в631я73-1
 
т 761

р е ц е н з е н т ы:
М. Ю. Хачай, доктор физико-математических наук,
заведующий отделом математического программирования
(институт математики и механики им. н. н. красовского уро ран);

а. М. асадов, доктор юридических наук,
ректор уральского института экономики, управления и права

п о д  о б щ е й  р е д а к ц и е й
е. а. трофимовой

Трофимова, Е. А.
т 761  
нейронные сети в прикладной экономике : [учеб. пособие] / 
е. а. трофимова, вл. д. Мазуров, д. в. гилёв ; [под общ. ред. 
е. а. трофимовой] ; М-во образования и науки рос. Федерации, 
урал. федер. ун-т. — екатеринбург : изд-во урал. ун-та, 2017. — 96 с. 

ISBN 978-5-7996-2018-9

в учебном пособии показаны методы настройки нейронных сетей и распознавания образов для решения задач прикладной экономики, 
в том числе персептрон розенблатта, сеть Хемминга, методы линейного 
программирования. рассмотрены также методы коллективных решений. 
приводятся примеры задач и упражнения.
для магистрантов, изучающих дисциплину «нейронные сети в прикладной экономике».

ббк у.в631я73-1

© уральский федеральный университет, 2017
ISBN 978-5-7996-2018-9

ОглАвлЕниЕ

ПрЕдислОвиЕ ........................................................................................................5

1. ОснОвныЕ зАдАчи рАсПОзнАвАния ОбрАзОв .................................7
1.1. примеры задач распознавания образов ..........................................................7
1.2. некоторые сведения из высшей математики ...............................................10
1.3. интеллектуальный анализ данных ...............................................................20

2. МАТЕМАТичЕскиЕ МЕТОды рАсПОзнАвАния ОбрАзОв ............22
2.1. общие представления о задаче распознавания образов .............................22
2.2. три типа основных задач распознавания образов .......................................24
2.2.1. задачи обучения распознаванию образов ..........................................24
2.2.2. задача минимизации описания ...........................................................25
2.2.3. задача таксономии или самообучения (кластер-анализ) ..................27
2.3. Модель дискриминантного анализа ..............................................................27
2.3.1. двухклассовый случай ........................................................................27
2.3.2. Модель дискриминантного анализа для k классов ...........................30
2.4. Методы дискриминантного анализа .............................................................33
2.4.1. Метод коррекции ..................................................................................33
2.4.2. линейное программирование .............................................................36
2.4.3. Метод свертки ......................................................................................37
2.4.4. Метод комитетов в дискриминантном анализе .................................40
2.4.5. Методы построения комитетов систем неравенств ..........................42
2.5. Модель таксономии ........................................................................................44
2.5.1. Метод выделения максимальных совместных подсистем ...............45
2.5.2. Метод cфер............................................................................................46

3. МОдЕли искуссТвЕнных нЕйрОнных сЕТЕй ............................47
3.1. биологическая модель нейрона .....................................................................47
3.2. Модель кибернетического нейрона ...............................................................48
3.3. классификация нейронных сетей и их свойства .........................................53
3.4. основная задача нейронных сетей ................................................................55
3.5. постановка задачи обучения нейронных сетей ...........................................57
3.6. построение нейронной сети ..........................................................................58

4. МОдЕли искуссТвЕнных нЕйрОнных сЕТЕй ............................59
4.1. персептрон розенблатта ................................................................................59
4.2. сеть Хопфилда ................................................................................................60
4.3. сеть Хемминга ................................................................................................63
4.4. сеть кохонена .................................................................................................64
4.5. нейронная сеть с генетическим алгоритмом обучения ..............................66

5. дОПОлниТЕльныЕ глАвы нЕйрОнных сЕТЕй .............................69
5.1. исторические сведения из области распознавания образов  
и нейронных сетей .........................................................................................69
5.2. распознавание в экономике ...........................................................................76
5.3. Метод ближайших соседей и комитетные конструкции .............................86

зАдАчи для сАМОсТОяТЕльнОгО рЕшЕния ......................................91

сПисОк рЕкОМЕндуЕМОй лиТЕрАТуры ...............................................94

ПрЕдислОвиЕ

предпосылкой написания данного пособия явилась необходимость проведения экономических расчетов с максимально 
возможной точностью, которые основывались бы на уже имеющемся опыте. например, традиционные методы прогнозирования 
спроса на некоторую продукцию в настоящее время уже не считаются хорошими с точки зрения точности. более того, прогресс не 
стоит на месте, появляются новые задачи, которые также требуют 
и точности, и быстроты, и простоты их решения. к таким задачам 
можно отнести скоринг-анализ — попытку банка дать прогноз 
платежеспособности клиента и дальнейшего решения о выдаче 
ему займа. нередко встречается и задача контроля над инвестициями, которая выливается в задачу прогнозирования банкротства 
предприятий и т. д.
и подобных задач много. они встречаются в экономике, технике, производстве, медицине, биологии, геологии, военном деле 
и во многих других областях и послужили в какой-то степени развитию эвМ, затем персональных компьютеров и многих различных компьютерных программ, которые помогают человеку решать 
описанные выше задачи, в том числе и по прогнозированию. все 
это вылилось в целое направление, которое назвали машинным 
обучением, или искусственным интеллектом.
если ранее только писатели-фантасты могли нас познакомить 
с тем, как некий робот полностью обслуживает человека, то сейчас 
это можно наблюдать повсеместно. однако обслуживать, настраивать, создавать и направлять этих роботов (которые по сути своей 
есть компьютерная программа) должен человек.
безусловно, машинное обучение — огромный пласт, который является фактически мультидисциплинарным. он объединяет математиков, которые подготавливают так называемую теоретическую основу программы; программистов, создающих ее 

«внутренность», и, безусловно, всех тех, ради кого программа 
и создается: физиков, экономистов, финансистов, медиков и других специалистов, которые уже пользуются ею и, в свою очередь, 
предъявляют к ней свои требования, а также в какой-то степени ее 
дополняют.
стоит заметить, что без понимания основных ключевых понятий очень сложно решить какую-то практическую задачу даже при 
помощи программы. ведь программа сама, без помощи человека, 
не сформулирует цель исследования, не сможет собрать соответствующие данные, корректно их обработать. именно поэтому стоит 
заниматься изучением машинного обучения и экономистам, которые постоянно сталкиваются с задачами, которые нужно решать 
при помощи тех или иных программ.
главным образом в машинном обучении для экономистов 
можно выделить две основные части — эконометрику и нейронные сети. Что касается первой, то существует немало монографий 
и учебных пособий, в которых подробнейшим образом описаны 
теоретические аспекты и приведено немало практических задач. 
а вот по нейронным сетям тоже достаточно различных пособий, 
однако нет такого, которое бы объединяло нейронные сети с позиции задачи обучения, раскрывая ее суть, показывая, что нейронные сети в целом решают задачу распознавания образов.
в данном пособии выбран подход, который ориентирован 
именно на экономистов. показано, что многие задачи прогнозирования в экономике сводятся к математическим моделям, которые, в свою очередь, уже на языке математики можно привести 
к задачам распознавания образов (задачам обучения), а последние 
уже решаются при помощи нейронных сетей. именно поэтому 
в пособии четко прослеживается цепочка: экономическая предпосылка ⇒ математическая постановка ⇒ компьютерный алгоритм. для ее реализации сначала дается общая постановка машинного обучения, характеристика распознавания образов, затем 
приводятся некоторые необходимые математические сведения, 
а после — уже конкретные методы распознавания образов и способы их решения, т. е. разновидности нейронных сетей.

1. ОснОвныЕ зАдАчи  
рАсПОзнАвАния ОбрАзОв

1.1. Примеры задач распознавания образов

в информационную эпоху человек просто не справляется 
с тем огромным потоком информации, который ему поступает — 
дома, на работе, на улице. Человеческий мозг не справляется 
с информационными перегрузками, ведь ему постоянно приходится решать массу задач в режиме одновременности восприятия и мышления. к мозгу подходит некий импульс, который он 
правильно идентифицирует и позволяет человеку принять то или 
иное решение. например, стоя у светофора на перекрестке, мы 
распознаем цвет, как только загорается зеленый — следует действие: мы переходим дорогу. и подобных задач, в которых приходится как раз что-то распознавать или идентифицировать, немало.
примеры задач распознавания:
 • скоринг-анализ (задача классификации платежеспособности заемщика для последующего решения о выдаче займа);
 • задача распознавания штрих-кода (данная задача уже повсеместно используется);
 • распознавание автомобильных номеров;
 • распознавание лиц;
 • распознавание сетчатки глаза;
 • распознавание участков земной коры для нахождения 
полезных ископаемых с некоторой вероятностью;
 • распознавание изображений;
 • классификация документов и т. д.
задачи распознавания относятся к задачам теории распознавания образов, которые сами по себе междисциплинарные.
приведем нестрогое определение распознавания образов: распознавание образов — это отнесение исходных данных к определенному классу с помощью выделения существенных признаков, 

характеризующих эти данные из общей массы несущественных 
данных. из такой формулировки становится понятно, что у нас 
имеются некоторые данные. как они заданы? откуда мы их взяли? 
достоверны ли они? на эти вопросы мы ответим чуть позже, сейчас же будем считать, что данные у нас приведены в некотором 
понятном для нас виде.
эти данные относятся к каким-то исследуемым нами объектам и характеризуют их. то есть получается, что мы имеем произвольное множество объектов. у каждого множества и у каждого объекта есть своя информация — свои характеристики. нам 
также известна информация о классах (образах), которые, в свою 
очередь, являются подмножествами множества объектов. необходимо провести классификацию, т. е. указать, к какому классу принадлежит тот или ной объект.
возможны различные случаи разделения объектов на классы. 
например, объекты можно разделить линией (прямой), которую 
легко описать математически.
на рис. 1 приведен случай, когда имеются два класса объектов 
и они легко разбиваются прямой, что, однако, не всегда возможно, 
иногда, чтобы разделить объекты, необходимо использовать нелинейные кривые, как это показано на рис. 2.

 

 

 
 

 

 
Объекты первого класса
Объекты второго класса

рис. 1

рис. 2

более строгая математическая формулировка будет приведена 
позже. сейчас же стоит обсудить те вопросы, которые у нас возникали по ходу формулирования неформального определения задачи 
распознавания образов, а также некоторые проблемы проведения 
классификации:
 • разнообразный большой объем данных;
 • противоречивость данных;
 • неформальность (плохая формализуемость) данных.
довольно часто информация, предоставляемая нам об объектах, достаточно лаконичная и неполная. Многие фирмы скрывают 
свою отчетность от посторонних глаз, а значит, владея неполной 
информацией, мы не сможем точно классифицировать их на платежеспособных и на неплатежеспособных.
в некоторых случаях данные просто противоречат друг другу, 
зависят друг от друга. в экономических задачах нередко встречается ситуация, когда данные трудно выразить в количественном 
отношении. и тут встает вопрос о том, в какой форме вообще 
должны быть данные. в распознавании образов от неформальной постановки задачи, как правило текстовой, обычно переходят к математической модели. а раз так, то все данные должны 
каким-то образом выражаться количественно. понятно, что если 
это клиент банка, то мы можем количественно выразить его возраст, стаж, размер заработной платы и т. п. некоторые качественные характеристики, такие как уровень образования, также можно 
попытаться выразить количественно, при помощи дамми-переменных (т. е., например, 0 — среднее образование, 1 — среднее 

специальное, 2 — высшее). однако как выразить амбиции, талант? 
это уже нерешаемый на данный момент вопрос, из-за которого 
в некоторых случаях теряется точность прогнозирования.
однако, если считать, что мы все-таки собрали хорошие 
данные, составили по ним математическую модель, то нужно 
непосредственно эту модель с использованием математического 
инструментария решить. в связи с чем встает еще одна проблема: 
человек не может интерпретировать такой большой объем информации, и ему на помощь приходит компьютерная программа. если 
говорить конкретнее, то для решения задач распознавания образов 
используют такой аппарат, как нейронные сети, которому и посвящено данное пособие.
перед тем как перейти к изучению непосредственно нейронных сетей, нам необходимо, во-первых, разобраться с тем, как 
добывать правильные данные; во-вторых, как их грамотно интерпретировать математическим языком, а для этого вспомнить некоторые элементы теории множеств и линейной алгебры; в-третьих, 
иметь четкое представление о задаче распознавания образов, т. е. 
уметь ставить ее математическую модель, чтобы ясно понимать, 
какая конкретно помощь нейронных сетей нам нужна, а уже затем 
можно переходить непосредственно к знакомству с нейронными 
сетями, их архитектурой, возможностями и недостатками.
некоторые свойства нейронных сетей:
«+»: нейронная сеть обучаема: чем больше ей дается информации, тем лучше нейронная сеть выдаст результат;
«+»: высокая степень параллельности;
«−»: зашумленность (искажение).

1.2. некоторые сведения  
из высшей математики

рассмотрим векторы 
 где 
 — компоненты вектора α, т. е. вектор α — это множество компонент; 

 — множество векторов.

Определение. Линейное векторное пространство V — это 
множество векторов, на котором определены операции умножения 
на скаляр («· α») и сложение векторов («+»), где данные операции 
имеют следующие свойства:

1) 
 и выполнено  
  (свойство 
коммутативности);

2) 
  
  
 (свойство дистрибутивности скаляра относительно суммы векторов);

3) 
  
  
 (свойство дистрибутивности вектора относительно суммы скаляров);

4) 
  
  
  
 
и  
 (свойство ассоциативности);

5) 
 
 
, 
 
и 
 

6) 
  
 (существование нулевого элемента), где 0 = (0, 0, …, 0) — нулевой вектор;

7) 
  

пример векторного пространства:

(
)
1
2
, 
 
,
,
,
,
n
n
x = ξ ξ
ξ
…

  где  
iξ ∈ ,

при условии, что на нем определены покомпонентная сумма 
и умножение на число.

Определение. < x, y > — скалярное произведение:

1
 
,
,

n

i
i

i
x y

=
=
<
>
ξ ζ
∑
 где  
; 

п р и м е р. пусть дано 
(
)
(
)

3,
1, 2, 5 ,
3, 4,
1 .
x
y
=
=
−


< x, y > = 1 · 3 + 2 · 4 + 5 · (−1) = 3 + 8 − 5 = 6.

свойства скалярного произведения

1)
 ,   
, 
  
, 
;
x y V
x y
y x
∀
∈
<
> = <
>

 ,     
,
,
;
2)
  
x y V
x y
x y
∀
∈ ∀α∈
< α
> = α <
>


 , ,   
  , 
,
3)
,
;
x y z V
x
y z
x z
y z
∀
∈
<
+
> = <
> + <
>

 т. е. 

нулевому вектору.

Определение. если < x, y > = 0, то 
 т. е. вектор х ортогонален вектору y.
Замечание. нулевой вектор ортогонален сам себе и всем другим векторам.
d (x, y) — расстояние между двумя векторами (метрика).

свойства расстояния

( ,
1)
) 0, 
d x y ≥
  причем  ( , )
0
;
d x y
x
y
=
⇔
=

(
)
,
2)
( , );
d x y
d y x
=

(
)
(
)
,
,
( ,
3)
)
d x z
d x y
d y z
≤
+
 (аксиома треугольника или неравенство треугольника).

Определение. Евклидово расстояние:

(
)
(
) (
)
(
)

2
1
1
2
2
1
,
(
) .

n

n
n
i
i
i
d x y

=
=
ξ − ς
+ ξ − ς
+…+ ξ − ς
=
ξ − ς
∑

(
)
:
,
.
d x y = ξ − ς


x  — норма (длина) вектора х.

Определение. Пространство, на котором определена норма, 
называется нормированным.

Доступ онлайн
300 ₽
В корзину