Валентин Арьков - Бизнес-аналитика. Извлечение, преобразование и загрузка данных. Учебное пособие

Бизнес-аналитика. Извлечение, преобразование и загрузка данных. Учебное пособие
Название: Бизнес-аналитика. Извлечение, преобразование и загрузка данных. Учебное пособие
Автор:
Жанры: Просто о бизнесе | Руководства | Книги о компьютерах | Прочая образовательная литература
Серии: Нет данных
ISBN: Нет данных
Год: Не установлен
О чем книга "Бизнес-аналитика. Извлечение, преобразование и загрузка данных. Учебное пособие"

Системы бизнес-аналитики работают с различными источниками данных с помощью функций ETL (Extract-Transform-Load). Название ETL можно перевести как «извлечение, преобразование и загрузка данных». Имеется в виду загрузка в хранилище данных для дальнейшей обработки в системе бизнес-аналитики.В простейшем случае это загрузка данных в виде одной, объединённой, консолидированной таблицы. В данной работе мы познакомимся с основными этапами ETL на примере загрузки данных в электронные таблицы.

Бесплатно читать онлайн Бизнес-аналитика. Извлечение, преобразование и загрузка данных. Учебное пособие


© Валентин Юльевич Арьков, 2020


ISBN 978-5-4498-4086-8

Создано в интеллектуальной издательской системе Ridero

Введение

Системы бизнес-аналитики работают с различными источниками данных с помощью функций ETL (Extract-Transform-Load). Название ETL можно перевести как «извлечение, преобразование и загрузка данных». Имеется в виду загрузка в хранилище данных для дальнейшей обработки в системе бизнес-аналитики [1—5]. В простейшем случае это загрузка данных в виде одной, объединённой таблицы Excel.

Задание. Прочитайте в Википедии статью «ETL» и выясните, какие действия над данными производят на каждом из трёх этапов.


Отчёт оформляем в виде рабочей книги Excel – как и в предыдущих работах. Процедура оформления отчёта подробно описана в работе [6].

Не забывайте записывать в отчёт ответы на задания типа «выясните…». Когда вы что-то узнали, зафиксируйте это в своём произведении. Упражнения на изучение – это часть данной лабораторной работы.

При использовании данных из внешних источников нужно указывать, откуда были получены данные, каким образом и когда.

Задание. Создайте файл отчёта. Оформите титульный лист и оглавление. Сохраните файл под коротким информативным названием.


В качестве исходных данных мы будем использовать сведения об акциях. Это так называемые ЦЕННЫЕ БУМАГИ. Акцию конкретной компании иногда называют просто «бумага». Акции приобретают с разными целями. Торговля акциями, в основном, происходит на бирже.

Задание. Прочитайте в Википедии статью «Акция (финансы)» и выясните, какие права она даёт владельцу, а также какие два вида акций существуют.


В оформлении обложки использованы изображения, разработанные компанией OnlineWebFonts.

1. Инструменты ETL в Microsoft Excel

В пакете Microsoft Excel версий 2010 и 2013 функции ETL реализованы с помощью надстройки Power Query.

Power Query позволяет решать следующие задачи:

– извлечение – импорт данных из различных источников;

– преобразование – приведение данных к единому формату;

– загрузка – консолидация / объединение данных из нескольких источников в виде одной таблицы Excel.

Название Power Query можно расшифровать как «Средство из комплекта PowerBI для выполнения запросов к источникам данных». В свою очередь, PowerBI – это программный комплекс (или платформа) бизнес-аналитики (BI – Business Intelligence), включающий целый ряд отдельных компонентов.

Задание. Прочитайте в Википедии статью «Power BI» и выясните, какие компоненты входят в настольную (локальную) версию Power BI Desktop и какова стоимость этой версии.


Платформа Power BI доступна в разных вариантах. Есть версии программы, которые можно скачать и установить бесплатно. Естественно, с рядом ограничений. Но это уже позволяет познакомиться с ключевыми возможностями продукта.

Задание. Перейдите на следующий сайт:

https://powerbi.microsoft.com.

Выясните, какие версии PowerBI доступны для скачивания.


Для установки Power Query потребуется сказать эту надстройку. Заходим на страницу Центра загрузки Microsoft:

https://download.microsoft.com

Вызываем поиск:

Power Query Excel.

Получаем ссылки для скачивания (рис. 1.1).


Рис. 1.1. Power Query в Центре загрузки


Задание. Найдите страницу Power Query в Центре загрузки и выясните год выпуска этой надстройки и поддерживаемые версии Excel.


Кроме ссылок для скачивания файлов, здесь имеются пояснения по поводу инструментов загрузки данных. Переходим по следующей ссылке:

Get & Transform Data.

Выясняем, как всё это связано с надстройкой Power Query и пакетом PowerBI (рис. 1.2).


Рис. 1.2. Инструменты загрузки данных


Задание. Выясните, как связан инструментарий Get & Transform с Power BI и Power Query.


В пакете Excel версий 2016, 2019 и 365 функции ETL доступны в группе инструментов Get & Transform (рис. 1.3).


Рис. 1.3. Группа инструментов ETL


Задание. Найдите группу Get & Transform в разделе Data и изучите названия основных кнопок на ленте, а также всплывающую подсказку для кнопки Get Data.


В группе Get & Transform скрывается кнопка запуска редактора запросов Power Query Editor:

Data – Get & Transform – Get Data – Launch Power Query Editor.

Всплывающая подсказка поясняет, что Power Query позволяет нам создавать новые запросы и редактировать существующие (рис. 1.4). Значит, Power Query по-прежнему жив и здоров.


Рис. 1.4. Запуск редактора запросов


Задание. Прочитайте статью Get & Transform and Power Pivot in Excel (Получение и преобразование и Power Pivot в Excel) в Центре справки и поддержки Microsoft Office:

https://support.office.com

Обратите внимание на следующие разделы:

– What is Get & Transform?

– What is Power Pivot?

– What is Power BI?

Кратко запишите в отчёт, что удалось выяснить про три варианта инструмента ETL.

2. Загрузка таблицы из Википедии

Один из стандартных источников данных —это интернет. Из интернет-страницы можно извлечь и загрузить выбранную таблицу.

Перейдём на сайт Википедии в браузере и найдём статью «Power BI» (рис. 2.1). В тексте статьи есть таблица с описанием лицензий. Попробуем загрузить эту таблицу в Excel. Скопируем адрес выбранной страницы в буфер обмена.


Рис. 2.1. Страница сайта в интернете


Задание. Найдите таблицу по лицензиям в статье «Power BI».


Возвращаемся в Excel.

Выбираем в верхнем меню загрузку данных из интернета (рис. 2.2):

Data – Get & Transform Data – From Web.


Рис.2.2. Получение данных из интернета


В диалоговом окне From Web вставляем адрес интернет-страницы из буфера обмена (рис. 2.3). По умолчанию выбран вариант загрузки Basic. Нажимаем кнопку OK.


Рис. 2.3. Ввод адреса страницы


Задание. Вызовите загрузку данных со страницы статьи «Power BI» в Википедии.


В диалоговом окне Navigator можно увидеть список из нескольких таблиц, которые были найдены на указанной странице сайта. Выбираем таблицу по лицензированию. Рассматриваем нашу таблицу в окне предварительного просмотра

Table View.

Убеждаемся, что выбрали нужную таблицу (рис. 2.4). Нажимаем кнопку

Load.


Рис. 2.4. Выбор таблицы для загрузки


Задание. Выберите для загрузки таблицу по лицензиям.


Таблица загружается в Excel (рис. 2.5). Сравниваем с источником (рис. 2.1). Заголовки столбцов и содержимое ячеек распознаны и загружены без ошибок. Таблица оформлена как таблица Excel.

Переходим в группу Table Tools в верхнем меню ленты. Выбираем раздел Design. Проверяем название таблицы:

Table Name – Лицензирование…

Значит мы загрузили не только саму таблицу, но и её заголовок (название).


Рис. 2.5. Загруженная таблица


Задание. Загрузите в Excel таблицу «Лицензирование» из статьи «Power BI» на сайте Википедии и ознакомьтесь с результатами.


Рассмотрим поподробнее название таблицы и сравним его с заголовком раздела в источнике данных (рис. 2.1).


С этой книгой читают
Изучая операционные системы, важно и понимать теорию, и уметь практически работать на компьютере. Функции любой операционной системы сводятся к понятию управления. Реализация этих функций – это выбор интерфейса пользователя: командная строка, файловый менеджер или оконная система. В курсе ОС мы рассматриваем все три вида интерфейса – практически, но с пониманием теории. Для упражнений будем использовать популярную ОС, название которой буквально п
Гистограмма – это один из самых простых инструментов статистического управления качеством производства. В этой работе будет использоваться электронная таблица для создания исходных данных, а также для построения и анализа гистограммы. Можно также использовать любой другой программный инструмент, позволяющий строить гистограммы.
Перед вами продолжение серии пособий, позволяющих познакомиться с основными технологиями бизнес-аналитики. Многое можно сделать в рамках электронной таблицы, которая превращается в интуитивно понятный интерфейс к продвинутым инструментам анализа данных.В данной работе мы рассмотрим создание реляционной модели и визуализацию иерархии в агрегированных данных с использованием специализированных надстроек.
Учебное пособие позволяет освоить базовые методы статистического анализа распределения с помощью сводки и группировки данных в электронных таблицах. Практическое знакомство происходит подробно, шаг за шагом, с примерами и комментариями. Попутно можно улучшить навыки практической работы в офисном пакете, что само по себе уже полезно как элемент современной компьютерной грамотности.
Статья написана в 2018 году. Но сейчас актуальность создания альтернативной Ямайской валютной системы только возросла. В статье обоснование того, как и почему необходимо возвращать золотой стандарт.
Если раньше для вас слова «Цифровизация» и «Цифровая трансформация» были просто громкими новостными заголовками, то благодаря этой книге вы сможете разбираться в этих темах на уровне директора по внедрению подобных проектов.Вы поймете, насколько важна роль лидера, как правильно взаимодействовать с командой при внедрении изменений.Ведь, в конце концов, среди большого количества данных и технологий сердцем цифровизации всегда будут оставаться люди.
Эта книга о будущем налогообложения, для будущих поколений не только России, но может быть принята другими странами для улучшения социальных условий своих граждан и налогоплательщиков, учета и распределения внутренних средств страны, а также перехода на плановую микро экономику.
Представлена история книги по новому тайм-менеджменту, которая насчитывает более 40 лет. Последним было 5-е издание в 8 книгах и двух сериях – по стратегии новой карьеры и менеджменту эмоций.В настоящее время началась реализация стратегии, представленной в последней серии книг по новому тайм-менеджменту с названием «Стань продюсером своей жизни».
Рассказы Геннадия Васильева – смесь реального и удивительного, очевидного и невероятного, горечи и юмора, горькой иронии и оптимизма. Основанные на настоящих переживаниях автора, они вводят читателя в знакомый – и в то же время другой мир. Мы входим в этот знакомый с детства мир как будто с черного хода.
В книгу вошли 3 произведения начинающего писателя. Книга рассчитана на большой круг лиц. Приятного прочтения и хорошего настроения. С уважением, К. В. Загорулько
Жозефина Арманд - наследница обнищавшего древнего рода. В мире, где человечество покорило космос, её титул не должен бы значить ничего. Роналд Баттлер - делец, выскочка, ветеран войны с Эрханом, забытый и преданный собственной страной. Рон выстроил свою жизнь с нуля, но теперь его карьера достигла предела - высокомерные эрханцы не желают иметь дела ни с кем, кроме аристократии. Так у Жозефины появляется шанс выбраться из безденежья. Но всему м
Элейна де Ритт, дочь герцога де Ритта лишается отца на балу в честь своего совершеннолетия. И встречает там же свою первую любовь. Но уже много лет назад отец обещал ее руку другому мужчине. Мужчине, от одного имени которого в дрожь бросает не только Лейну. Судьба подарила ей выбор. Осталось лишь совершить его и узнать, какой из путей единственно верный. Внимание! 18+ Участник Конкурса НАСЛЕДНИЦА