Power BI: моделирование на экспертном уровне
Построение оптимальных моделей данных с использованием Power BI
Покупка
Издательство:
ДМК Пресс
Автор:
Бахши Сохейл
Перевод:
Гинько Александр Юрьевич
Год издания: 2022
Кол-во страниц: 490
Дополнительно
Вид издания:
Практическое пособие
Уровень образования:
Профессиональное образование
ISBN: 978-5-97060-906-4
Артикул: 817278.01.99
В этой книге описываются техники моделирования данных с помощью Power BI. Показано, как подключаться к данным в различных источниках, преобразовывать их с помощью Power Query и DAX, объединять посредством связей и строить модели данных с учетом разнообразных, даже самых изысканных, бизнес-требований. На примерах рассмотрена оптимизация сложных моделей данных без потери функционала. К концу книги читатель будет обладать всеми необходимыми знаниями для структурирования и обработки данных, поступающих из разных источников, и создания на их основании полноценных моделей, пригодных для построения отчетов.
Книга предназначена для пользователей систем бизнес-аналитики, а также специалистов и разработчиков в области анализа данных, желающих повысить квалификацию и расширить навыки использования Power BI.
- Полная коллекция по информатике и вычислительной технике
- ДМК Пресс. Информационные системы и технологии
- ДМК Пресс. ИТ-технологии для профессионалов
- Интермедиатор. Информационные системы и технологии (сводная)
- Интермедиатор. ИТ-технологии для профессионалов (сводная)
- Локальные компьютерные сети. Программное обеспечение локальных сетей. ОС
- Системное и сетевое администрирование
Тематика:
ББК:
УДК:
ОКСО:
- ВО - Бакалавриат
- 09.03.01: Информатика и вычислительная техника
- 09.03.02: Информационные системы и технологии
- 09.03.04: Программная инженерия
ГРНТИ:
Скопировать запись
Фрагмент текстового слоя документа размещен для индексирующих роботов
Сохейл Бахши Power BI: моделирование на экспертном уровне
Soheil Bakhshi Expert Data Modeling with Power BI Get the best out of Power BI by building optimized data models for reporting and business needs BIRMINGHAM — MUMBAI
Сохейл Бахши Power BI: моделирование на экспертном уровне Построение оптимальных моделей данных с использованием Power BI Москва, 2022
УДК 004.424 ББК 32.372 Б30 Бахши С. Б30 Power BI: моделирование на экспертном уровне / пер. с англ. А. Ю. Гинько. – М.: ДМК Пресс, 2022. – 490 с.: ил. ISBN 978-5-97060-906-4 В этой книге описываются техники моделирования данных с помощью Power BI. Показано, как подключаться к данным в различных источниках, преобразовывать их с помощью Power Query и DAX, объединять посредством связей и строить модели данных с учетом разнообразных, даже самых изысканных, бизнес-требований. На примерах рассмотрена оптимизация сложных моделей данных без потери функционала. К концу книги читатель будет обладать всеми необходимыми знаниями для структурирования и обработки данных, поступающих из разных источников, и создания на их основании полноценных моделей, пригодных для построения отчетов. Книга предназначена для пользователей систем бизнес-аналитики, а также специалистов и разработчиков в области анализа данных, желающих повысить квалификацию и расширить навыки использования Power BI. УДК 004.424 ББК 32.372 Copyright ©Packt Publishing 2021. First published in the English language under the title ‘Expert Data Modeling with Power BI - (9781800205697) Все права защищены. Любая часть этой книги не может быть воспроизведена в какой бы то ни было форме и какими бы то ни было средствами без письменного разрешения владельцев авторских прав. ISBN 978-1-80020-569-7 (англ.) © Packt Publishing, 2021 ISBN 978-5-97060-906-4 (рус.) © Перевод, оформление, издание, ДМК Пресс, 2022 Дизайн обложки разработан с использованием ресурса freepik.com
Я посвящаю эту книгу своей любимой жене Элике Мер (Elica Mehr) и нашей драгоценной дочери Авине (Avina). Без их бесконечной поддержки все это было бы невозможно. Также я обязан своим успехом родителям, которые всегда верили в меня и призывали следовать за своей мечтой
Содержание От издательства ....................................................................................................13 Предисловие ..........................................................................................................14 Об авторе .................................................................................................................15 О технических редакторах .............................................................................16 Введение ..................................................................................................................17 Глава 1. Введение в моделирование данных в Power BI ................23 Понятие слоев в Power BI Desktop ...........................................................................24 Слой подготовки данных (Power Query) .............................................................25 Слой модели данных .............................................................................................25 Вкладка Данные .................................................................................................26 Вкладка Модель данных ...................................................................................27 Слой визуализации данных .................................................................................28 Вкладка Отчет ....................................................................................................28 Поток данных в Power BI .......................................................................................29 Что означает моделирование данных в Power BI ..................................................30 Семантическая модель..........................................................................................31 Построение эффективной модели данных в Power BI .....................................32 Схемы «звезда» (многомерное моделирование) и «снежинка» .....................34 Транзакционные модели против схемы «звезда» ........................................34 Схема «снежинка»..............................................................................................36 Понятие денормализации ................................................................................36 Варианты лицензирования в Power BI ....................................................................42 Максимальный размер набора данных ..............................................................43 Добавочная загрузка данных ...............................................................................43 Группы вычислений ..............................................................................................44 Общие наборы данных..........................................................................................45 Потоки данных Power BI .......................................................................................45 Итеративный подход к моделированию данных ..................................................45 Сбор информации от руководства ......................................................................46 Подготовка данных на основе бизнес-логики...................................................46 Моделирование данных ........................................................................................47 Проверка логики ....................................................................................................47 Демонстрация бизнес-логики в базовой визуализации ..................................47 Думай как профессиональный разработчик моделей данных .......................48 Заключение .................................................................................................................48 Глава 2. DAX и моделирование данных ...................................................50 Понимание виртуальных таблиц .............................................................................50
Содержание 7 Создание вычисляемой таблицы.........................................................................51 Использование виртуальных таблиц в мерах, часть 1 .....................................53 Использование виртуальных таблиц в мерах, часть 2 .....................................55 Визуальное представление виртуальных таблиц .............................................56 Создание вычисляемых таблиц в Power BI Desktop .....................................56 Использование DAX Studio ...............................................................................57 Связи в виртуальных таблицах ............................................................................58 Логика операций со временем и моделирование данных ..................................68 Определение валидности дат в измерении .......................................................68 Вычисления на основе сравнения периодов .....................................................76 Создание измерения дат при помощи DAX .......................................................84 Пометка календаря как таблицы дат ..............................................................86 Создание измерения времени при помощи DAX .............................................90 Заключение .................................................................................................................92 Глава 3. Подготовка данных с помощью Power Query .....................95 Введение в язык формул M, используемый в Power Query ..................................95 Power Query – регистрозависимый инструмент ...............................................96 Запросы ...................................................................................................................97 Выражения ..............................................................................................................97 Значения .................................................................................................................97 Примитивные значения ...................................................................................97 Структурированные значения .........................................................................98 Типы .......................................................................................................................102 Примитивные типы ........................................................................................102 Пользовательские типы ..................................................................................103 Введение в редактор Power Query ..........................................................................103 Панель Запросы ....................................................................................................105 Таблицы ............................................................................................................105 Настраиваемые функции ...............................................................................105 Параметры запросов .......................................................................................105 Константы .........................................................................................................105 Группы ...............................................................................................................105 Панель Параметры запроса ................................................................................106 Свойства ............................................................................................................108 Область данных ....................................................................................................109 Строка состояния .................................................................................................112 Расширенный редактор ......................................................................................113 Возможности Power Query в области моделирования данных .........................114 Качество столбца .................................................................................................115 Распределение столбцов .....................................................................................118 Профиль столбца ..................................................................................................121 Параметры запросов ...............................................................................................122 Настраиваемые функции ........................................................................................128 Рекурсивные функции ........................................................................................133 Заключение ...............................................................................................................135
Содержание Глава 4. Получение данных из различных источников .................136 Получение данных из распространенных источников данных ........................136 Папка .....................................................................................................................137 CSV/Текст/TSV ......................................................................................................142 Excel .......................................................................................................................148 Наборы данных Power BI.....................................................................................155 Потоки данных Power BI .....................................................................................159 SQL Server ..............................................................................................................160 SQL Server Analysis Services и Azure Analysis Services .....................................162 SSAS многомерная/табличная .......................................................................163 AAS .....................................................................................................................165 Канал OData ..........................................................................................................166 Сертификаты источников данных ........................................................................169 Bronze ....................................................................................................................169 Silver .......................................................................................................................169 Gold/Platinum ........................................................................................................170 Режимы подключения к данным ...........................................................................170 Импорт ..................................................................................................................171 Применение .....................................................................................................171 Ограничения ....................................................................................................171 DirectQuery ............................................................................................................171 Применение .....................................................................................................172 Ограничения ....................................................................................................172 Подключение в режиме реального времени ...................................................172 Применение .....................................................................................................173 Ограничения ....................................................................................................173 Режимы хранения данных ......................................................................................173 Режимы хранения наборов данных ......................................................................175 Заключение ...............................................................................................................177 Глава 5. Общие шаги по подготовке данных ......................................178 Изменение типов данных .......................................................................................179 Разделение столбцов по разделителю ..................................................................186 Объединение столбцов ............................................................................................189 Создание настраиваемого столбца ........................................................................190 Создание столбца из примеров .............................................................................193 Создание дубликата столбца ..................................................................................195 Фильтрация строк ....................................................................................................197 Группирование данных ...........................................................................................201 Добавление запросов ...............................................................................................203 Объединение запросов ............................................................................................206 Создание дубликата запроса и ссылки на запрос ...............................................208 Замена значений ......................................................................................................210 Извлечение чисел из текста ....................................................................................212 Работа с датой, временем и часовыми поясами .................................................215 Заключение ...............................................................................................................218
Содержание 9 Глава 6. Подготовка данных в Power Query для схемы «звезда» .................................................................................................................219 Выявление измерений и фактов ............................................................................219 Количество таблиц в источнике данных ..........................................................220 Связи между существующими таблицами .......................................................221 Наименьшая требуемая гранулярность полей с датой и временем ............222 Определение измерений и фактов ...................................................................223 Выявление возможных измерений ..............................................................224 Выявление возможных фактов .....................................................................225 Создание таблиц измерений ..................................................................................227 Geography ..............................................................................................................228 Sales Order .............................................................................................................230 Product ...................................................................................................................233 Currency .................................................................................................................236 Customer ................................................................................................................237 Sales Demographic ................................................................................................238 Date ........................................................................................................................241 Time ........................................................................................................................245 Создание измерений Date и Time – Power Query против DAX ......................246 Создание таблиц фактов .........................................................................................247 Заключение ...............................................................................................................254 Глава 7. Эффективные методики подготовки данных ...................256 Общие рекомендации по подготовке данных .....................................................256 При работе с источником OData используйте частичную загрузку данных ...................................................................................................................256 Не забывайте о регистрозависимости Power Query .......................................259 Помните о свертывании запросов и его влиянии на обновление данных ...................................................................................................................260 Понятие свертывания запросов ....................................................................260 Свертывание запросов и режимы хранения DirectQuery и Dual ..............261 Свертывание запросов и источники данных ..............................................261 Индикация свертывания запросов ...............................................................261 Рекомендации по выполнению свертывания запросов ............................263 Организуйте запросы в редакторе Power Query..............................................267 Преобразование типов ............................................................................................268 Преобразование типов и влияние на моделирование данных .....................269 Включение преобразования типов в шаги ......................................................275 Изменение типов данных за один шаг .............................................................276 Оптимизация размера запросов............................................................................277 Избавьтесь от лишних строк и столбцов ..........................................................277 Выполните агрегирование (группировку) .......................................................278 Отмените загрузку запросов ..............................................................................279 Соглашение о наименованиях ...............................................................................279 Заключение ...............................................................................................................280
Содержание Глава 8. Элементы моделирования данных ........................................282 Моделирование данных в Power BI Desktop .........................................................282 Введение в таблицы .................................................................................................283 Свойства таблицы ................................................................................................283 Рекомендуемые таблицы ....................................................................................286 Вычисляемые таблицы ........................................................................................287 Введение в поля ........................................................................................................292 Типы данных ........................................................................................................292 Пользовательское форматирование .................................................................294 Столбцы .................................................................................................................295 Вычисляемые столбцы ....................................................................................295 Группирование данных в столбцах и разделение их на ячейки ..............296 Свойства столбцов ...........................................................................................300 Иерархии ...............................................................................................................304 Меры ......................................................................................................................305 Неявные меры ..................................................................................................305 Явные меры ......................................................................................................308 Текстовые меры ...............................................................................................308 Использование связей .............................................................................................310 Первичные и внешние ключи ............................................................................311 Управление составными ключами ....................................................................311 Связь «один к одному» ....................................................................................316 Связь «один ко многим» .................................................................................316 Связь «многие ко многим» .............................................................................316 Распространение фильтров ................................................................................318 Двунаправленные связи .....................................................................................320 Заключение ...............................................................................................................323 Глава 9. Схема «звезда» и распространенные техники при моделировании данных .......................................................................324 Работа со связями типа «многие ко многим» ......................................................324 Связи «многие ко многим» с использованием таблицы-моста ....................327 Скрытие таблицы-моста .....................................................................................333 Повышенная бдительность при использовании двунаправленных связей .....334 Работа с неактивными связями .............................................................................337 Доступность таблицы по нескольким путям фильтра ...................................337 Несколько прямых связей между двумя таблицами ......................................339 Использование конфигурационных таблиц ........................................................341 Сегментирование .................................................................................................341 Динамическое условное форматирование с участием мер ..........................342 Минусы создания вычисляемых столбцов ...........................................................348 Организация модели данных .................................................................................351 Скрытие второстепенных объектов ..................................................................351 Скрытие неиспользуемых полей и таблиц ..................................................351 Скрытие ключевых полей ..............................................................................353 Скрытие неявных мер .....................................................................................354