Книжная полка Сохранить
Размер шрифта:
А
А
А
|  Шрифт:
Arial
Times
|  Интервал:
Стандартный
Средний
Большой
|  Цвет сайта:
Ц
Ц
Ц
Ц
Ц

Power BI: моделирование на экспертном уровне

Построение оптимальных моделей данных с использованием Power BI
Покупка
Артикул: 817278.01.99
В этой книге описываются техники моделирования данных с помощью Power BI. Показано, как подключаться к данным в различных источниках, преобразовывать их с помощью Power Query и DAX, объединять посредством связей и строить модели данных с учетом разнообразных, даже самых изысканных, бизнес-требований. На примерах рассмотрена оптимизация сложных моделей данных без потери функционала. К концу книги читатель будет обладать всеми необходимыми знаниями для структурирования и обработки данных, поступающих из разных источников, и создания на их основании полноценных моделей, пригодных для построения отчетов. Книга предназначена для пользователей систем бизнес-аналитики, а также специалистов и разработчиков в области анализа данных, желающих повысить квалификацию и расширить навыки использования Power BI.
Бахши, С. Power BI: моделирование на экспертном уровне : практическое руководство / С. Бахши ; пер. с англ. А. Ю. Гинько. - Москва : ДМК Пресс, 2022. - 490 с. - ISBN 978-5-97060-906-4. - Текст : электронный. - URL: https://znanium.com/catalog/product/2109579 (дата обращения: 22.11.2024). – Режим доступа: по подписке.
Фрагмент текстового слоя документа размещен для индексирующих роботов
Сохейл Бахши

Power BI: моделирование  
на экспертном уровне

Soheil Bakhshi

Expert Data 
Modeling with 
Power BI

Get the best out of Power BI by building optimized 
data models for reporting and business needs

BIRMINGHAM — MUMBAI

Сохейл Бахши

Power BI: 
моделирование  
на экспертном уровне

Построение оптимальных моделей данных  
с использованием Power BI

Москва, 2022

УДК 004.424
ББК 32.372
Б30

Бахши С.
Б30  Power BI: моделирование на экспертном уровне / пер. с англ. А. Ю. Гинько. – 
М.: ДМК Пресс, 2022. – 490 с.: ил. 

ISBN 978-5-97060-906-4

В этой книге описываются техники моделирования данных с помощью Power 
BI. Показано, как подключаться к данным в различных источниках, преобразовывать их с помощью Power Query и DAX, объединять посредством связей и строить 
модели данных с учетом разнообразных, даже самых изысканных, бизнес-требований. На примерах рассмотрена оптимизация сложных моделей данных без 
потери функционала. К концу книги читатель будет обладать всеми необходимыми 
знаниями для структурирования и обработки данных, поступающих из разных 
источников, и создания на их основании полноценных моделей, пригодных для 
построения отчетов.
Книга предназначена для пользователей систем бизнес-аналитики, а также 
специалистов и разработчиков в области анализа данных, желающих повысить 
квалификацию и расширить навыки использования Power BI.

УДК 004.424
ББК 32.372

Copyright ©Packt Publishing 2021. First published in the English language under the title 
‘Expert Data Modeling with Power BI - (9781800205697) 

Все права защищены. Любая часть этой книги не может быть воспроизведена в какой бы то ни было форме и какими бы то ни было средствами без письменного разрешения 
владельцев авторских прав.

ISBN 978-1-80020-569-7 (англ.) 
©  Packt Publishing, 2021
ISBN 978-5-97060-906-4 (рус.)  
©  Перевод, оформление, издание,  
ДМК Пресс, 2022

Дизайн обложки разработан с использованием ресурса freepik.com

Я посвящаю эту книгу  
своей любимой жене Элике Мер (Elica Mehr)  
и нашей драгоценной дочери Авине (Avina).

Без их бесконечной поддержки все это было бы невозможно.

Также я обязан своим успехом родителям,  
которые всегда верили в меня и призывали следовать за своей мечтой

Содержание

От издательства ....................................................................................................13
Предисловие ..........................................................................................................14
Об авторе .................................................................................................................15
О технических редакторах .............................................................................16
Введение ..................................................................................................................17

Глава 1. Введение в моделирование данных в Power BI ................23

Понятие слоев в Power BI Desktop ...........................................................................24
Слой подготовки данных (Power Query) .............................................................25
Слой модели данных .............................................................................................25
Вкладка Данные .................................................................................................26
Вкладка Модель данных ...................................................................................27
Слой визуализации данных .................................................................................28
Вкладка Отчет ....................................................................................................28
Поток данных в Power BI .......................................................................................29
Что означает моделирование данных в Power BI ..................................................30
Семантическая модель..........................................................................................31
Построение эффективной модели данных в Power BI .....................................32
Схемы «звезда» (многомерное моделирование) и «снежинка» .....................34
Транзакционные модели против схемы «звезда» ........................................34
Схема «снежинка»..............................................................................................36
Понятие денормализации ................................................................................36
Варианты лицензирования в Power BI ....................................................................42
Максимальный размер набора данных ..............................................................43
Добавочная загрузка данных ...............................................................................43
Группы вычислений ..............................................................................................44
Общие наборы данных..........................................................................................45
Потоки данных Power BI .......................................................................................45
Итеративный подход к моделированию данных ..................................................45
Сбор информации от руководства ......................................................................46
Подготовка данных на основе бизнес-логики...................................................46
Моделирование данных ........................................................................................47
Проверка логики ....................................................................................................47
Демонстрация бизнес-логики в базовой визуализации ..................................47
Думай как профессиональный разработчик моделей данных .......................48
Заключение .................................................................................................................48

Глава 2. DAX и моделирование данных ...................................................50

Понимание виртуальных таблиц .............................................................................50

Содержание  7

Создание вычисляемой таблицы.........................................................................51
Использование виртуальных таблиц в мерах, часть 1 .....................................53
Использование виртуальных таблиц в мерах, часть 2 .....................................55
Визуальное представление виртуальных таблиц .............................................56
Создание вычисляемых таблиц в Power BI Desktop .....................................56
Использование DAX Studio ...............................................................................57
Связи в виртуальных таблицах ............................................................................58
Логика операций со временем и моделирование данных ..................................68
Определение валидности дат в измерении .......................................................68
Вычисления на основе сравнения периодов .....................................................76
Создание измерения дат при помощи DAX .......................................................84
Пометка календаря как таблицы дат ..............................................................86
Создание измерения времени при помощи DAX .............................................90
Заключение .................................................................................................................92

Глава 3. Подготовка данных с помощью Power Query .....................95

Введение в язык формул M, используемый в Power Query ..................................95
Power Query – регистрозависимый инструмент ...............................................96
Запросы ...................................................................................................................97
Выражения ..............................................................................................................97
Значения .................................................................................................................97
Примитивные значения ...................................................................................97
Структурированные значения .........................................................................98
Типы .......................................................................................................................102
Примитивные типы ........................................................................................102
Пользовательские типы ..................................................................................103
Введение в редактор Power Query ..........................................................................103
Панель Запросы ....................................................................................................105
Таблицы ............................................................................................................105
Настраиваемые функции ...............................................................................105
Параметры запросов .......................................................................................105
Константы .........................................................................................................105
Группы ...............................................................................................................105
Панель Параметры запроса ................................................................................106
Свойства ............................................................................................................108
Область данных ....................................................................................................109
Строка состояния .................................................................................................112
Расширенный редактор ......................................................................................113
Возможности Power Query в области моделирования данных .........................114
Качество столбца .................................................................................................115
Распределение столбцов .....................................................................................118
Профиль столбца ..................................................................................................121
Параметры запросов ...............................................................................................122
Настраиваемые функции ........................................................................................128
Рекурсивные функции ........................................................................................133
Заключение ...............................................................................................................135

 Содержание

Глава 4. Получение данных из различных источников .................136
Получение данных из распространенных источников данных ........................136
Папка .....................................................................................................................137
CSV/Текст/TSV ......................................................................................................142
Excel .......................................................................................................................148
Наборы данных Power BI.....................................................................................155
Потоки данных Power BI .....................................................................................159
SQL Server ..............................................................................................................160
SQL Server Analysis Services и Azure Analysis Services .....................................162
SSAS многомерная/табличная .......................................................................163
AAS .....................................................................................................................165
Канал OData ..........................................................................................................166
Сертификаты источников данных ........................................................................169
Bronze ....................................................................................................................169
Silver .......................................................................................................................169
Gold/Platinum ........................................................................................................170
Режимы подключения к данным ...........................................................................170
Импорт ..................................................................................................................171
Применение .....................................................................................................171
Ограничения ....................................................................................................171
DirectQuery ............................................................................................................171
Применение .....................................................................................................172
Ограничения ....................................................................................................172
Подключение в режиме реального времени ...................................................172
Применение .....................................................................................................173
Ограничения ....................................................................................................173
Режимы хранения данных ......................................................................................173
Режимы хранения наборов данных ......................................................................175
Заключение ...............................................................................................................177

Глава 5. Общие шаги по подготовке данных ......................................178
Изменение типов данных .......................................................................................179
Разделение столбцов по разделителю ..................................................................186
Объединение столбцов ............................................................................................189
Создание настраиваемого столбца ........................................................................190
Создание столбца из примеров .............................................................................193
Создание дубликата столбца ..................................................................................195
Фильтрация строк ....................................................................................................197
Группирование данных ...........................................................................................201
Добавление запросов ...............................................................................................203
Объединение запросов ............................................................................................206
Создание дубликата запроса и ссылки на запрос ...............................................208
Замена значений ......................................................................................................210
Извлечение чисел из текста ....................................................................................212
Работа с датой, временем и часовыми поясами .................................................215
Заключение ...............................................................................................................218

Содержание  9

Глава 6. Подготовка данных в Power Query для схемы  
«звезда» .................................................................................................................219

Выявление измерений и фактов ............................................................................219
Количество таблиц в источнике данных ..........................................................220
Связи между существующими таблицами .......................................................221
Наименьшая требуемая гранулярность полей с датой и временем ............222
Определение измерений и фактов ...................................................................223
Выявление возможных измерений ..............................................................224
Выявление возможных фактов .....................................................................225
Создание таблиц измерений ..................................................................................227
Geography ..............................................................................................................228
Sales Order .............................................................................................................230
Product ...................................................................................................................233
Currency .................................................................................................................236
Customer ................................................................................................................237
Sales Demographic ................................................................................................238
Date ........................................................................................................................241
Time ........................................................................................................................245
Создание измерений Date и Time – Power Query против DAX ......................246
Создание таблиц фактов .........................................................................................247
Заключение ...............................................................................................................254

Глава 7. Эффективные методики подготовки данных ...................256

Общие рекомендации по подготовке данных .....................................................256
При работе с источником OData используйте частичную загрузку  
данных ...................................................................................................................256
Не забывайте о регистрозависимости Power Query .......................................259
Помните о свертывании запросов и его влиянии на обновление  
данных ...................................................................................................................260
Понятие свертывания запросов ....................................................................260
Свертывание запросов и режимы хранения DirectQuery и Dual ..............261
Свертывание запросов и источники данных ..............................................261
Индикация свертывания запросов ...............................................................261
Рекомендации по выполнению свертывания запросов ............................263
Организуйте запросы в редакторе Power Query..............................................267
Преобразование типов ............................................................................................268
Преобразование типов и влияние на моделирование данных .....................269
Включение преобразования типов в шаги ......................................................275
Изменение типов данных за один шаг .............................................................276
Оптимизация размера запросов............................................................................277
Избавьтесь от лишних строк и столбцов ..........................................................277
Выполните агрегирование (группировку) .......................................................278
Отмените загрузку запросов ..............................................................................279
Соглашение о наименованиях ...............................................................................279
Заключение ...............................................................................................................280

 Содержание

Глава 8. Элементы моделирования данных ........................................282
Моделирование данных в Power BI Desktop .........................................................282
Введение в таблицы .................................................................................................283
Свойства таблицы ................................................................................................283
Рекомендуемые таблицы ....................................................................................286
Вычисляемые таблицы ........................................................................................287
Введение в поля ........................................................................................................292
Типы данных ........................................................................................................292
Пользовательское форматирование .................................................................294
Столбцы .................................................................................................................295
Вычисляемые столбцы ....................................................................................295
Группирование данных в столбцах и разделение их на ячейки ..............296
Свойства столбцов ...........................................................................................300
Иерархии ...............................................................................................................304
Меры ......................................................................................................................305
Неявные меры ..................................................................................................305
Явные меры ......................................................................................................308
Текстовые меры ...............................................................................................308
Использование связей .............................................................................................310
Первичные и внешние ключи ............................................................................311
Управление составными ключами ....................................................................311
Связь «один к одному» ....................................................................................316
Связь «один ко многим» .................................................................................316
Связь «многие ко многим» .............................................................................316
Распространение фильтров ................................................................................318
Двунаправленные связи .....................................................................................320
Заключение ...............................................................................................................323

Глава 9. Схема «звезда» и распространенные техники 
при моделировании данных .......................................................................324
Работа со связями типа «многие ко многим» ......................................................324
Связи «многие ко многим» с использованием таблицы-моста ....................327
Скрытие таблицы-моста .....................................................................................333
Повышенная бдительность при использовании двунаправленных связей .....334
Работа с неактивными связями .............................................................................337
Доступность таблицы по нескольким путям фильтра ...................................337
Несколько прямых связей между двумя таблицами ......................................339
Использование конфигурационных таблиц ........................................................341
Сегментирование .................................................................................................341
Динамическое условное форматирование с участием мер ..........................342
Минусы создания вычисляемых столбцов ...........................................................348
Организация модели данных .................................................................................351
Скрытие второстепенных объектов ..................................................................351
Скрытие неиспользуемых полей и таблиц ..................................................351
Скрытие ключевых полей ..............................................................................353
Скрытие неявных мер .....................................................................................354