Бизнес-аналитика. Извлечение, преобразование и загрузка данных

Бизнес-аналитика. Извлечение, преобразование и загрузка данных

Авторы:

Жанры: Научная литература, Компьютерная литература, О бизнесе популярно

Циклы: не входит в цикл

Формат: Фрагмент

Всего в книге 14 страниц. Год издания книги - 2020.

Системы бизнес-аналитики работают с различными источниками данных с помощью функций ETL (Extract-Transform-Load). Название ETL можно перевести как «извлечение, преобразование и загрузка данных». Имеется в виду загрузка в хранилище данных для дальнейшей обработки в системе бизнес-аналитики. В простейшем случае это загрузка данных в виде одной, объединённой, консолидированной таблицы. В данной работе мы познакомимся с основными этапами ETL на примере загрузки данных в электронные таблицы.

Читать онлайн Бизнес-аналитика. Извлечение, преобразование и загрузка данных


© Валентин Юльевич Арьков, 2020


ISBN 978-5-4498-4086-8

Создано в интеллектуальной издательской системе Ridero

Введение

Системы бизнес-аналитики работают с различными источниками данных с помощью функций ETL (Extract-Transform-Load). Название ETL можно перевести как «извлечение, преобразование и загрузка данных». Имеется в виду загрузка в хранилище данных для дальнейшей обработки в системе бизнес-аналитики [1—5]. В простейшем случае это загрузка данных в виде одной, объединённой таблицы Excel.

Задание. Прочитайте в Википедии статью «ETL» и выясните, какие действия над данными производят на каждом из трёх этапов.


Отчёт оформляем в виде рабочей книги Excel — как и в предыдущих работах. Процедура оформления отчёта подробно описана в работе [6].

Не забывайте записывать в отчёт ответы на задания типа «выясните…». Когда вы что-то узнали, зафиксируйте это в своём произведении. Упражнения на изучение — это часть данной лабораторной работы.

При использовании данных из внешних источников нужно указывать, откуда были получены данные, каким образом и когда.

Задание. Создайте файл отчёта. Оформите титульный лист и оглавление. Сохраните файл под коротким информативным названием.


В качестве исходных данных мы будем использовать сведения об акциях. Это так называемые ЦЕННЫЕ БУМАГИ. Акцию конкретной компании иногда называют просто «бумага». Акции приобретают с разными целями. Торговля акциями, в основном, происходит на бирже.

Задание. Прочитайте в Википедии статью «Акция (финансы)» и выясните, какие права она даёт владельцу, а также какие два вида акций существуют.


В оформлении обложки использованы изображения, разработанные компанией OnlineWebFonts.

1. Инструменты ETL в Microsoft Excel

В пакете Microsoft Excel версий 2010 и 2013 функции ETL реализованы с помощью надстройки Power Query.

Power Query позволяет решать следующие задачи:

— извлечение — импорт данных из различных источников;

— преобразование — приведение данных к единому формату;

— загрузка — консолидация / объединение данных из нескольких источников в виде одной таблицы Excel.

Название Power Query можно расшифровать как «Средство из комплекта PowerBI для выполнения запросов к источникам данных». В свою очередь, PowerBI — это программный комплекс (или платформа) бизнес-аналитики (BI — Business Intelligence), включающий целый ряд отдельных компонентов.

Задание. Прочитайте в Википедии статью «Power BI» и выясните, какие компоненты входят в настольную (локальную) версию Power BI Desktop и какова стоимость этой версии.


Платформа Power BI доступна в разных вариантах. Есть версии программы, которые можно скачать и установить бесплатно. Естественно, с рядом ограничений. Но это уже позволяет познакомиться с ключевыми возможностями продукта.

Задание. Перейдите на следующий сайт:

https://powerbi.microsoft.com.

Выясните, какие версии PowerBI доступны для скачивания.


Для установки Power Query потребуется сказать эту надстройку. Заходим на страницу Центра загрузки Microsoft:

https://download.microsoft.com

Вызываем поиск:

Power Query Excel.

Получаем ссылки для скачивания (рис. 1.1).


Рис. 1.1. Power Query в Центре загрузки


Задание. Найдите страницу Power Query в Центре загрузки и выясните год выпуска этой надстройки и поддерживаемые версии Excel.


Кроме ссылок для скачивания файлов, здесь имеются пояснения по поводу инструментов загрузки данных. Переходим по следующей ссылке:

Get & Transform Data.

Выясняем, как всё это связано с надстройкой Power Query и пакетом PowerBI (рис. 1.2).


Рис. 1.2. Инструменты загрузки данных


Задание. Выясните, как связан инструментарий Get & Transform с Power BI и Power Query.


В пакете Excel версий 2016, 2019 и 365 функции ETL доступны в группе инструментов Get & Transform (рис. 1.3).


Рис. 1.3. Группа инструментов ETL


Задание. Найдите группу Get & Transform в разделе Data и изучите названия основных кнопок на ленте, а также всплывающую подсказку для кнопки Get Data.


В группе Get & Transform скрывается кнопка запуска редактора запросов Power Query Editor:

Data — Get & Transform — Get Data — Launch Power Query Editor.

Всплывающая подсказка поясняет, что Power Query позволяет нам создавать новые запросы и редактировать существующие (рис. 1.4). Значит, Power Query по-прежнему жив и здоров.


Рис. 1.4. Запуск редактора запросов


Задание. Прочитайте статью Get & Transform and Power Pivot in Excel (Получение и преобразование и Power Pivot в Excel) в Центре справки и поддержки Microsoft Office:

https://support.office.com

Обратите внимание на следующие разделы:

— What is Get & Transform?

— What is Power Pivot?

— What is Power BI?

Кратко запишите в отчёт, что удалось выяснить про три варианта инструмента ETL.

2. Загрузка таблицы из Википедии

Один из стандартных источников данных —это интернет. Из интернет-страницы можно извлечь и загрузить выбранную таблицу.

Перейдём на сайт Википедии в браузере и найдём статью «Power BI» (рис. 2.1). В тексте статьи есть таблица с описанием лицензий. Попробуем загрузить эту таблицу в Excel. Скопируем адрес выбранной страницы в буфер обмена.


Рис. 2.1. Страница сайта в интернете


Задание. Найдите таблицу по лицензиям в статье «Power BI».


С этой книгой читают
Власть, влияние и политика в организациях

За десятилетия, на протяжении которых профессор Джеффри Пфеффер консультировал корпорации и обучал студентов МВА нюансам власти в компаниях, он не раз наблюдал, как карьера одних идет под откос, тогда как другие преуспевают, несмотря на трудности.«Власть, влияние и политика в организациях» — это книга о том, как преуспеть и добиться власти в реальном мире. Советы, примеры из реалий разных стран, удивительные исследовательские находки — книга знакомит читателя с тактикой и стратегией, которые отличают победителей от побежденных.


Саксон Грамматик о дохристианской славянской религии. Новый перевод соответствующих фрагментов XIV книги Деяний Данов

Данный перевод предназначен для того, чтобы не только сделать текст Саксона Грамматика более доступным для широкого круга читателей, но и представить часто игнорируемые фрагменты и альтернативный вариант прочтения неоднозначных фрагментов текста. Перевод сопровождает оригинальный латинский текст, а в русском варианте была сделана попытка передать структуру оригинала без искажения смысла, насколько это было возможно.


Сандинистская революция в Никарагуа. Предыстория и последствия

Книга посвящена первой успешной вооруженной революции в Латинской Америке после кубинской – Сандинистской революции в Никарагуа, победившей в июле 1979 года.В книге дан краткий очерк истории Никарагуа, подробно описана борьба генерала Аугусто Сандино против американской оккупации в 1927–1933 годах. Анализируется военная и экономическая политика диктатуры клана Сомосы (1936–1979 годы), позволившая ей так долго и эффективно подавлять народное недовольство. Особое внимание уделяется роли США в укреплении режима Сомосы, а также истории Сандинистского фронта национального освобождения (СФНО) – той силы, которая в итоге смогла победоносно завершить революцию.


Наследие аграрного закона Тиберия Гракха. Земельный вопрос и политическая борьба в Риме 20-х гг. II в. до н.э.

В книге рассматривается широкий круг исторических вопросов, связанных с аграрной реформой Тиберия Семпрония Гракха (133–124 гг. до и. э.) и законодательной деятельностью его младшего брата Гая. На основе сведений античных источников (письменных, эпиграфических и археологических) предпринимается попытка осветить некоторые малоизученные события из истории гракханского движения, такие, например, как политический кризис 129 г. до н. э., ценз 125/124 гг. до н. э. и аграрный закон Гая Гракха. Кроме того, даётся оценка новейшим концепциям (преимущественно зарубежным) социально-экономического и политического развития Рима в гракханское время.Не меньшее внимание уделяется и проблеме преемственности в политике братьев Гракхов, а также судьбе аграрной реформы после кризиса 129 г.


Хмурые будни холодной войны. Ее солдаты, прорабы и невольные участники

Данный сборник составлен по материалам докладов, прозвучавших на конференции по «холодной войне», проведенной Университетом Дмитрия Пожарского 6–7 февраля 2010 года. Эта конференция являлась первым шагом в инициированной Университетом Дмитрия Пожарского программе по изучению истории послевоенного периода. В сборнике представлены статьи ведущих специалистов по истории двадцатого века, истории спецслужб и военной истории. Авторы затрагивают различные аспекты «холодной войны» от анализа идеологических диверсий в сфере культуры и искусства, до изучения процесса формирования оборонной промышленности и деятельности разведки.


Невидимый фронт войны на море. Морская радиоэлектронная разведка в первой половине ХХ века

В монографии рассмотрен исторический опыт развития и боевого применения сил и средств морской радиоэлектронной разведки (разведки связи) в первой половине XX века – периода двух мировых войн и множества менее масштабных военных конфликтов.Исследование ранее закрытых документов и широкого круга других источников и литературы, с учетом эволюции военного дела и радиоразведки в России и за рубежом, позволило автору выявить тенденции, изменения перечня и содержания задач, решаемых отечественной морской РЭР, установить основные направления развития способов и методов ее ведения; определить место морской РЭР в разведывательном обеспечении флота и ее роль в решении отечественными флотами и группировками войск стоящих перед ними оперативных и стратегических задач.


Табакерка Робеспьера

Унылая однообразная жизнь скромного администратора Вероники вдруг в одночасье коренным образом меняется. Девушку начинают преследовать бандиты, и все – из-за того, что в один прекрасный день сотрудники фотоателье поручили ей купить для шефа, Михаила Рубцова, подарок ко дню рождения. Зайди Вероника в обычный магазин сувениров – может быть, ничего и не произошло и не впуталась бы она в эту мистическую историю с непонятными тайнами. Но судьба привела ее в антикварный магазин, где продавец убедил купить старинную табакерку, ту самую, которая когда-то принадлежала Робеспьеру, одному из известнейших деятелей Французской революции.


Эгмонт

Трагедия Гете изображает начальный момент Нидерландской революции XVI века, первой буржуазной революции в Европе.


Подвал. В плену

Комиссар Вехтер ведет расследование по делу Розы Беннингхофф. Офицер многое повидал на своем веку, но это убийство его шокировало. Слишком жестокое, слишком беспощадное… Кто способен на такое? И что делал в подвале дома убитой четырнадцатилетний мальчик в крови? Чем ближе к разгадке, тем больше вопросов возникает. Возможно, смерть Розы связана с одним старым преступлением…


Сотворение оперного спектакля

Книга известного советского режиссера, лауреата Ленинской премии, народного артиста СССР Б.А.Покровского рассказывает об эстетике современного оперного спектакля, о способности к восприятию оперы, о том, что оперу надо уметь не только слушать, но и смотреть.


Другие книги автора
Анализ и визуализация данных в электронных таблицах

Перед вами продолжение серии пособий, позволяющих познакомиться с основными технологиями бизнес-аналитики. Многое можно сделать в рамках электронной таблицы, которая превращается в интуитивно понятный интерфейс к продвинутым инструментам анализа данных. В данной работе мы рассмотрим создание реляционной модели и визуализацию иерархии в агрегированных данных с использованием специализированных надстроек.


Организация параллельных потоков. Часть 1

В данной лабораторной работе рассматриваются основы организации параллельных потоков с помощью стандартных вызовов операционной системы. В работе используется бесплатная интегрированная среда разработки. Приводятся примеры программ на языке Си.


Применение гистограмм в управлении качеством

Гистограмма — это один из самых простых инструментов статистического УПРАВЛЕНИЯ КАЧЕСТВОМ производства. В этой работе будет использоваться пакет Microsoft Excel для создания исходных данных, а также для построения и анализа гистограммы. Можно также использовать любой другой программный инструмент, позволяющий строить гистограммы.


Бизнес-аналитика. Сводные таблицы. Часть 2

Данная работа посвящена дальнейшему изучению методов бизнес-аналитики на примере «продвинутых» возможностей функций сводных таблиц. Мы продолжаем использовать общий подход к практическому освоению программного пакета: моделирование и исследование. Мы поработаем с генератором случайных чисел и сформируем реалистичные наборы данных для анализа.


Поделиться мнением о книге