Основы теории сложности
Покупка
Основная коллекция
Тематика:
Общенаучное знание и теории
Издательство:
НИЦ ИНФРА-М
Автор:
Цветков Виктор Яковлевич
Год издания: 2024
Кол-во страниц: 145
Дополнительно
Вид издания:
Монография
Уровень образования:
Дополнительное профессиональное образование
ISBN: 978-5-16-019346-5
ISBN-онлайн: 978-5-16-112015-6
DOI:
10.12737/2110856
Артикул: 813938.01.01
Монография раскрывает содержание сложности. Описаны методы оценки сложности. Дана систематика видов сложности. Подробно раскрыто содержание когнитивной сложности. Описана эмерджентность как характеристика сложности.
Предназначена для специалистов в области информатики, искусственного интеллекта и философии информации.
Тематика:
ББК:
УДК:
ОКСО:
- ВО - Бакалавриат
- 02.03.02: Фундаментальная информатика и информационные технологии
- ВО - Магистратура
- 01.04.02: Прикладная математика и информатика
ГРНТИ:
Скопировать запись
Фрагмент текстового слоя документа размещен для индексирующих роботов
Москва ИНФРА-М 2024 ОСНОВЫ ТЕОРИИ СЛОЖНОСТИ В.Я. ЦВЕТКОВ МОНОГРАФИЯ
УДК 007(075.4) ББК 13 Ц27 Цветков В.Я. Ц27 Основы теории сложности : монография / В.Я. Цветков. — Москва : ИНФРА-М, 2024. — 145 с. — (Научная мысль). — DOI 10.12737/2110856. ISBN 978-5-16-019346-5 (print) ISBN 978-5-16-112015-6 (online) Монография раскрывает содержание сложности. Описаны методы оценки сложности. Дана систематика видов сложности. Подробно раскрыто содержание когнитивной сложности. Описана эмерджентность как характеристика сложности. Предназначена для специалистов в области информатики, искусственного интеллекта и философии информации. УДК 007(075.4) ББК 13 Р е ц е н з е н т: В.В. Ознамец, доктор технических наук, доцент, заведующий кафедрой геодезии Московского государственного университета геодезии и картографии ISBN 978-5-16-019346-5 (print) ISBN 978-5-16-112015-6 (online) © Цветков В.Я., 2024
Введение Сложность является одной из актуальных тем исследований в области естественных и социальных наук [1]. Теория сложности может быть рассмотрена как междисциплинарная наука. В области управленческих и естественных исследований значение теории сложности возросло за последние три десятилетия. В течение длительного времени сложным системам и системному анализу уделялось значительное внимание в ряде дисциплин, и из этого возникла междисциплинарная наука о сложности. Сложность часто связывают со сложными системами. Окружающий мир можно рассматривать как сложную систему или систему систем. Такое рассмотрение задает системность окружающего мира и системность процессов. Системность окружающего мира задает системность свойств и связей объектов. В большинстве работ по теории сложных систем и во многих словарях используется тривиальное, но не полное определения сложной системы типа «система есть множество элементов и связей». Такое определение применимо как к сложным, так и к простым системам. Сложность остается за рамками этого определения. Однако одной из мотиваций к написанию данной монографии явилось то, что в многочисленных работах по теории сложных систем акцентируют внимание на сложных системах и на системах, но мало уделяют внимание проблеме сложности как феномену. Например, корпус текста как сложная система может быть поделен на символы, слова и предложения и фразы. Все эти объекты являются информационными единицами, полученными из корпуса текста по разным критериям. Структурное деление текста дает структурные информационные единицы — символы. Но символы не имеют семантики. Смы
В.Я. Цветков словое деление текста дает семантические информационные единицы — слова. Слово более сложный объект, чем символ. Но обособленные слова имеют лемматизированное значение, которое исключает отношение, метафоры, гиперболы, модальность, двусмысленность. Включение отношений между словами обогащает смысл и задает семантические информационные единицы предложения, которое обладает предикативностью. Предложение более сложный объект, чем слово. Еще более сложной информационной единицей является фраза. Фраза по отношению к предложению включает контекст. Фраза более сложный объект, чем предложение. Этот пример показывает, что выбор критерия делимости объекта или системы качественно изменяет содержание элемента системы и задает разные уровни сложности. В теории сложных систем не рассматривают когнитивные факторы, которые во многих случаях влияют на оценку сложности. Шахматная позиция для любителя шахматной игры может показаться сложной. Для гроссмейстера она является простой. Это говорит о том, что уровень интеллекта субъекта также влияет на оценку сложности. Сложности оценивается не только по изучению сложных систем, но по изучению независимых феноменов сложности в разных научных направлениях от медицины и информатики до вычислительной сложности и нейронных сетей. Теория сложности исследует набор концепций, которые применимы к целому ряду эмпирических явлений. Общим для концепций сложности является то, что большое количество частей взаимодействуют друг с другом и увеличивают или уменьшают сложность. Сложность может служить причиной трудности или невозможности исследования. Сложность может служить причиной разработки новых методов решения новых задач. Большие данные можно рассматривать как пример сложности. Необходимо применять понятие «оценка сложности». Во многих случаях такая оценка получается на ос
Основы теории сложности нове сравнения и сравнительного анализа. Теория сложности далека от завершения. Выделяют разные направления в этой области. Теория математической сложности утверждает, что сложность системы заключается в трудности, возникающей при описании характеристик системы. Это направление дескриптивной сложности. Синергетическая сложность связана с теорией хаоса [2, 3] и теорией катастроф, в которых утверждается, что взаимодействие двух или трех ключевых переменных может создавать в значительной степени стабильные системы, склонные к внезапным разрывам. Синергетическая сложность часто связана с нелинейными отношениями между постоянно меняющимися сущностями. Это раздел синергетики. Исследования синергетической сложности утверждают, что системы имеют эмерджентные или синергетические характеристики, которые нельзя понять без ссылки на отношения между подкомпонентами. Системная сложность [4] исследует, как отдельные элементы и части систем работают вместе для обеспечения живучести и функционирования систем со сложным поведением. Системная сложность связана с теорией систем. Теория систем изучает статические объекты, связанные линейными отношениями, определяемыми потоками и запасами (например, энергии, информации). Большинство сложных систем имеют фиксированные связи. Системная сложность включает исследование слабосвязанных систем, включая мультиагентные системы. Этот перечень видов сложности обзорный и не полный. В него необходимо добавить сложность моделирования, сложность управления, когнитивную сложность, вычислительную сложность, алгоритмическую сложность, биологическую сложность, экологическую сложность. Типы сложности связаны с математически неразрешимыми аспектами описания и управления. Они используют вычислительные методы нелинейной математики и методы моделирования.
В.Я. Цветков Несмотря на достаточно широкий перенос идей из области живых систем в технические области, модели живых систем не описаны четко и определенно и фактически существует сложность в описании живых систем и биологического разнообразия. Поэтому в теории сложных систем остается значительное количество нерешенных проблем, которые ожидают дальнейшего исследования.
Глава 1. СЛОЖНОСТЬ И «БОЛЬШИЕ ДАННЫЕ» Сложность можно рассматривать как характеристику ситуации. «Большие данные» можно рассматривать как пример сложной ситуации. Понятие «большие данные» охватывает несколько факторов: объемы данных, скорость обработки, структурированность и разнообразие данных. Большие данные имеют положительные и отрицательные стороны. Положительная сторона в большом количестве информации. Отрицательная сторона больших данных в том, что их сложно анализировать и обрабатывать. Человеческий интеллект не в состоянии без помощи компьютера анализировать большие данные. Это первый критерий больших данных. Второй критерий в том, что современное развитие программного обеспечения также не позволяет эффективно обрабатывать «большие данные». Для их обработки требуются специальные методы и программы. Проблема «больших данных» (Big Data) [5–7] интенсивно дискутируется в последние десятки лет. Упрощенно ее интерпретируют как феномен большого информационного объема. В широком смысле она включает другие факторы: слабая структурированность данных, отсутствие структурированных данных, множество разнообразных форматов, что затрудняет анализ и обработку. Появление самого термина «большие данные» определяют работой Клиффорда Линча [8]. Но это номинальное признание проблемы, которая существует более полусотни лет. Реально с этой проблемой впервые столкнулись исследователь Земли из космоса в 50–60-е гг. Следует напомнить, что в те годы вычислительная мощность компьютеров была на 4–5 порядков ниже современных. Большие объемы видеоинформации, получаемой со спутников, превосходили возмож
В.Я. Цветков ности вычислительных систем того времени. Но эта проблема была узкоспециальной, поскольку связана в основном с обработкой видеоинформации. В настоящее время эта проблема существует при исследовании Земли из космоса, при исследовании околоземного пространства и в космической геоинформатике [9, 10]. В широкой форме проблема «больших данных» открылась лишь в последние 20 лет для бизнес-аналитиков и журналистов. Это привело к повышенному вниманию к этому явлению и появлению соответствующего термина. Можно констатировать, что данная проблема является условной, как и «условная сложность». Она отражает невозможность на определенном этапе развития человечества обрабатывать условно большие объемы данных или условно сложные данные. Проблема «больших данных» шире, чем только объемы данных. Современное толкование «больших данных» характеризуются четырьмя факторами V: объемом (Volume), скоростью (Velocity), достоверностью (Veracity) и разнообразием (Variety), которые могут принести значительную ценность при обработке больших данных. Все четыре фактора проявляются независимо или в любой комбинации. Преобразование четырех V больших данных в пятое (Value — ценность) является основной задачей для существующих вычислительных возможностей. К большим данным относят данные с плохой структурированностью или слабо структурированные данные. Этот фактор требует применения новых методов обработки информации больших объемов. Фактор объем (Volume) характеризуется большими объемами информации. Этот фактор требует применения качественно новых методов обработки информации и методов сжатия информации при сохранении ее информативности. Примером сжатия информации является цифровое моделирование, которое представляет аналоговые объекты в виде дискретных моделей. Как средство сжатия информации при обра
Основы теории сложности ботке и моделировании пространственной информации часто используют процедуру векторизации изображения, которая выделяет контура и границы. Например, аналоговое изображение (растр) формата А4 при невысоком разрешении может иметь объем 27 Мбайт. Соответствующее ему векторное изображение имеет объем 150–200 Кбайт. Этот пример показывает принципиальную возможность перехода от одной модели к другой с сохранением информативности и сжатием информации на три порядка. Но этот пример сжатия и обработки не относится к области больших данных, потому что сотни мегабайт — недостаточно большой объем для характеристики больших данных. Фактор скорости (Velocity) отражает тенденцию на ограничение и сокращение времени обработки данных, особенно в сфере управления. То есть для этого фактора термин «большой» неуместен. Этот фактор требует применения новых скоростных методов обработки информации, на порядки сокращающих время принятия решений. Фактор достоверности (Veracity) обусловлен тем, что в больших объемах информации, наряду с достоверной информацией, встречается недостоверная информация, которая противоречит достоверной или заменяет ее. Чем больше объем информации, тем труднее выявить этот фактор. Фактически этот фактор говорит о наличии возможной недостоверной информации. Недостоверная информация может быть дополнительно обусловлена нечеткой и неопределенной информацией. В результате использования недостоверной информации принимаются ошибочные решения, которые могут привести к негативным последствиям. Этот фактор требует применения методов обработки информации, повышающих надежность и проверяющих достоверность информации. Часто это сводится к дополнительным расчетам, дублирующих основной вариант расчета или основной алгоритм. Фактор разнообразия (Variety) напрямую связан со сложностью. Он означает наличие большого количества форматов
В.Я. Цветков данных разного качественного свойства. Этот фактор также связан со слабой структурированностью данных. Структурированные данные обычно имеют ограниченное количество форматов и разнообразием не отличаются. Большое количества форматов данных создает вычислительные и аналитические сложности. Этот фактор требует применения интегрированной информационной основы, объединяющей разные модели данных в единую модель данных. Возможно применение не одной, а нескольких интегрированных основ. Но в любом случае они на порядок и более сокращают разнообразие данных. К числу новых методов обработки больших данных относят облачные вычисления [11]. Основное преимущество облачных вычислений — возможность хранения и обработки больших объемов данных. Технология облачных вычислений является новой парадигмой для предоставления вычислительных ресурсов в качестве сервисной службы для удовлетворения различных потребностей в обработке данных с помощью: а) самообслуживания по запросу; б) пула ресурсов; в) эластичности (гибкости); г) широкополосного сетевого доступа; д) измеряемых услуг При работе с большими данными существуют модификации этой проблемы: большие графы, интенсифицированные информационные потоки данных, объемные потоки данных, превосходящие пропускную способность. К этой проблеме относят: структурную и морфологическую сложность информационных моделей, возрастание когнитивных факторов при анализе моделей. Сравнительные качественные параметры, влияющие на обработку обычных и больших данных, даны в таблице 1.1. Приложения, ориентированные на обработку больших объемов данных, используют наборы данных, имеющие информационные объемы до петабайтов. Но это не главная трудность и сложность. Сложность обусловлена тем, что данные разнообразны и имеют разные форматы. Рост объема данных,