Валентин Арьков - Бизнес-аналитика. Извлечение, преобразование и загрузка данных. Учебное пособие

Бизнес-аналитика. Извлечение, преобразование и загрузка данных. Учебное пособие
Название: Бизнес-аналитика. Извлечение, преобразование и загрузка данных. Учебное пособие
Автор:
Жанры: Просто о бизнесе | Руководства | Книги о компьютерах | Прочая образовательная литература
Серии: Нет данных
ISBN: Нет данных
Год: Не установлен
О чем книга "Бизнес-аналитика. Извлечение, преобразование и загрузка данных. Учебное пособие"

Системы бизнес-аналитики работают с различными источниками данных с помощью функций ETL (Extract-Transform-Load). Название ETL можно перевести как «извлечение, преобразование и загрузка данных». Имеется в виду загрузка в хранилище данных для дальнейшей обработки в системе бизнес-аналитики.В простейшем случае это загрузка данных в виде одной, объединённой, консолидированной таблицы. В данной работе мы познакомимся с основными этапами ETL на примере загрузки данных в электронные таблицы.

Бесплатно читать онлайн Бизнес-аналитика. Извлечение, преобразование и загрузка данных. Учебное пособие


© Валентин Юльевич Арьков, 2020


ISBN 978-5-4498-4086-8

Создано в интеллектуальной издательской системе Ridero

Введение

Системы бизнес-аналитики работают с различными источниками данных с помощью функций ETL (Extract-Transform-Load). Название ETL можно перевести как «извлечение, преобразование и загрузка данных». Имеется в виду загрузка в хранилище данных для дальнейшей обработки в системе бизнес-аналитики [1—5]. В простейшем случае это загрузка данных в виде одной, объединённой таблицы Excel.

Задание. Прочитайте в Википедии статью «ETL» и выясните, какие действия над данными производят на каждом из трёх этапов.


Отчёт оформляем в виде рабочей книги Excel – как и в предыдущих работах. Процедура оформления отчёта подробно описана в работе [6].

Не забывайте записывать в отчёт ответы на задания типа «выясните…». Когда вы что-то узнали, зафиксируйте это в своём произведении. Упражнения на изучение – это часть данной лабораторной работы.

При использовании данных из внешних источников нужно указывать, откуда были получены данные, каким образом и когда.

Задание. Создайте файл отчёта. Оформите титульный лист и оглавление. Сохраните файл под коротким информативным названием.


В качестве исходных данных мы будем использовать сведения об акциях. Это так называемые ЦЕННЫЕ БУМАГИ. Акцию конкретной компании иногда называют просто «бумага». Акции приобретают с разными целями. Торговля акциями, в основном, происходит на бирже.

Задание. Прочитайте в Википедии статью «Акция (финансы)» и выясните, какие права она даёт владельцу, а также какие два вида акций существуют.


В оформлении обложки использованы изображения, разработанные компанией OnlineWebFonts.

1. Инструменты ETL в Microsoft Excel

В пакете Microsoft Excel версий 2010 и 2013 функции ETL реализованы с помощью надстройки Power Query.

Power Query позволяет решать следующие задачи:

– извлечение – импорт данных из различных источников;

– преобразование – приведение данных к единому формату;

– загрузка – консолидация / объединение данных из нескольких источников в виде одной таблицы Excel.

Название Power Query можно расшифровать как «Средство из комплекта PowerBI для выполнения запросов к источникам данных». В свою очередь, PowerBI – это программный комплекс (или платформа) бизнес-аналитики (BI – Business Intelligence), включающий целый ряд отдельных компонентов.

Задание. Прочитайте в Википедии статью «Power BI» и выясните, какие компоненты входят в настольную (локальную) версию Power BI Desktop и какова стоимость этой версии.


Платформа Power BI доступна в разных вариантах. Есть версии программы, которые можно скачать и установить бесплатно. Естественно, с рядом ограничений. Но это уже позволяет познакомиться с ключевыми возможностями продукта.

Задание. Перейдите на следующий сайт:

https://powerbi.microsoft.com.

Выясните, какие версии PowerBI доступны для скачивания.


Для установки Power Query потребуется сказать эту надстройку. Заходим на страницу Центра загрузки Microsoft:

https://download.microsoft.com

Вызываем поиск:

Power Query Excel.

Получаем ссылки для скачивания (рис. 1.1).


Рис. 1.1. Power Query в Центре загрузки


Задание. Найдите страницу Power Query в Центре загрузки и выясните год выпуска этой надстройки и поддерживаемые версии Excel.


Кроме ссылок для скачивания файлов, здесь имеются пояснения по поводу инструментов загрузки данных. Переходим по следующей ссылке:

Get & Transform Data.

Выясняем, как всё это связано с надстройкой Power Query и пакетом PowerBI (рис. 1.2).


Рис. 1.2. Инструменты загрузки данных


Задание. Выясните, как связан инструментарий Get & Transform с Power BI и Power Query.


В пакете Excel версий 2016, 2019 и 365 функции ETL доступны в группе инструментов Get & Transform (рис. 1.3).


Рис. 1.3. Группа инструментов ETL


Задание. Найдите группу Get & Transform в разделе Data и изучите названия основных кнопок на ленте, а также всплывающую подсказку для кнопки Get Data.


В группе Get & Transform скрывается кнопка запуска редактора запросов Power Query Editor:

Data – Get & Transform – Get Data – Launch Power Query Editor.

Всплывающая подсказка поясняет, что Power Query позволяет нам создавать новые запросы и редактировать существующие (рис. 1.4). Значит, Power Query по-прежнему жив и здоров.


Рис. 1.4. Запуск редактора запросов


Задание. Прочитайте статью Get & Transform and Power Pivot in Excel (Получение и преобразование и Power Pivot в Excel) в Центре справки и поддержки Microsoft Office:

https://support.office.com

Обратите внимание на следующие разделы:

– What is Get & Transform?

– What is Power Pivot?

– What is Power BI?

Кратко запишите в отчёт, что удалось выяснить про три варианта инструмента ETL.

2. Загрузка таблицы из Википедии

Один из стандартных источников данных —это интернет. Из интернет-страницы можно извлечь и загрузить выбранную таблицу.

Перейдём на сайт Википедии в браузере и найдём статью «Power BI» (рис. 2.1). В тексте статьи есть таблица с описанием лицензий. Попробуем загрузить эту таблицу в Excel. Скопируем адрес выбранной страницы в буфер обмена.


Рис. 2.1. Страница сайта в интернете


Задание. Найдите таблицу по лицензиям в статье «Power BI».


Возвращаемся в Excel.

Выбираем в верхнем меню загрузку данных из интернета (рис. 2.2):

Data – Get & Transform Data – From Web.


Рис.2.2. Получение данных из интернета


В диалоговом окне From Web вставляем адрес интернет-страницы из буфера обмена (рис. 2.3). По умолчанию выбран вариант загрузки Basic. Нажимаем кнопку OK.


Рис. 2.3. Ввод адреса страницы


Задание. Вызовите загрузку данных со страницы статьи «Power BI» в Википедии.


В диалоговом окне Navigator можно увидеть список из нескольких таблиц, которые были найдены на указанной странице сайта. Выбираем таблицу по лицензированию. Рассматриваем нашу таблицу в окне предварительного просмотра

Table View.

Убеждаемся, что выбрали нужную таблицу (рис. 2.4). Нажимаем кнопку

Load.


Рис. 2.4. Выбор таблицы для загрузки


Задание. Выберите для загрузки таблицу по лицензиям.


Таблица загружается в Excel (рис. 2.5). Сравниваем с источником (рис. 2.1). Заголовки столбцов и содержимое ячеек распознаны и загружены без ошибок. Таблица оформлена как таблица Excel.

Переходим в группу Table Tools в верхнем меню ленты. Выбираем раздел Design. Проверяем название таблицы:

Table Name – Лицензирование…

Значит мы загрузили не только саму таблицу, но и её заголовок (название).


Рис. 2.5. Загруженная таблица


Задание. Загрузите в Excel таблицу «Лицензирование» из статьи «Power BI» на сайте Википедии и ознакомьтесь с результатами.


Рассмотрим поподробнее название таблицы и сравним его с заголовком раздела в источнике данных (рис. 2.1).


С этой книгой читают
Изучая операционные системы, важно и понимать теорию, и уметь практически работать на компьютере. Функции любой операционной системы сводятся к понятию управления. Реализация этих функций – это выбор интерфейса пользователя: командная строка, файловый менеджер или оконная система. В курсе ОС мы рассматриваем все три вида интерфейса – практически, но с пониманием теории. Для упражнений будем использовать популярную ОС, название которой буквально п
Гистограмма – это один из самых простых инструментов статистического управления качеством производства. В этой работе будет использоваться электронная таблица для создания исходных данных, а также для построения и анализа гистограммы. Можно также использовать любой другой программный инструмент, позволяющий строить гистограммы.
Перед вами продолжение серии пособий, позволяющих познакомиться с основными технологиями бизнес-аналитики. Многое можно сделать в рамках электронной таблицы, которая превращается в интуитивно понятный интерфейс к продвинутым инструментам анализа данных.В данной работе мы рассмотрим создание реляционной модели и визуализацию иерархии в агрегированных данных с использованием специализированных надстроек.
Методические указания к выполнению лабораторной работы на тему «Сводка и группировка данных». Работа выполняется в электронных таблицах.
Полезная книга по копирайтингу, с помощью которой можно проникнуть в тайны сознания и научиться думать как покупатель. На страницах книги представлена информацию о том, как психологические аспекты личности влияют на совершение покупок в Интернете и в реальной жизни.
Поиск персонала – настоящее искусство. Профессиональными хедхантерами не рождаются. Особые навыки и знания приобретаются на практике. Руководитель Recruitment boutique S.M.Art Анастасия Глебова более 10 лет находится на передовой хедхантинга. Из книги «Хедхантинг с умом» вы узнаете о творческой составляющей в поиске персонала, особенностях хедхантинга как бизнеса и заглянете за кулисы – в будущее.
«Владелец как профессия» – это сборник эссе на горящие темы создания и управления собственным бизнесом. Почему стоит её прочесть? Потому что выгоднее учиться на чужих ошибках и опыте, но главное – по-настоящему здорово, когда тебе подставляют плечо, а не локоть, протягивают руку и дают практические советы.
Книга о быстром старте в Интернете от практика. Научим привлекать клиентов в Интернете за 1 день. «Быстрый старт» основан на общедоступном инструментарии. Стратегия показывает, как из набора сервисов построить схему привлечения клиентов. Некоторые из предлагаемых инструментов совершенно бесплатны, часть из них потребует вложений, эффективность которых вы будете отслеживать в ежедневном режиме.
Рассказы Геннадия Васильева – смесь реального и удивительного, очевидного и невероятного, горечи и юмора, горькой иронии и оптимизма. Основанные на настоящих переживаниях автора, они вводят читателя в знакомый – и в то же время другой мир. Мы входим в этот знакомый с детства мир как будто с черного хода.
В книгу вошли 3 произведения начинающего писателя. Книга рассчитана на большой круг лиц. Приятного прочтения и хорошего настроения. С уважением, К. В. Загорулько
В публикации вниманию читателя представлен теоретический материал для высшей школы – финансово-экономических ВУЗов по предмету «Финансовый менеджмент». В ней в лаконичной форме и доступно изложена тема: «Управление финансовыми инструментами хозяйствующего субъекта», раскрыты основные положения данной проблематики. Представленная информация, несомненно, поможет преподавателю качественно донести до аудитории предложенный материал, а для слушателей
После безуспешных поисков своей пары Анастасия сбегает от всех в далекое поселение оборотней. Тихая размеренная жизнь – то, что ей нужно. Только кто сказал, что все будет так, как ты задумываешь?Привыкший добиваться своего оборотень Руслан уж точно не оставит в покое девушку, которая притягивает его. Только он не знает, что у нее есть одна тайна из прошлого, которой она не намерена ни с кем делиться, и с которой будет сложно примириться будущему