Анализ и визуализация данных в электронных таблицах

Анализ и визуализация данных в электронных таблицах

Авторы:

Жанры: Научная литература, Компьютерная литература

Циклы: не входит в цикл

Формат: Полный

Всего в книге 18 страниц. Год издания книги - 2020.

Перед вами продолжение серии пособий, позволяющих познакомиться с основными технологиями бизнес-аналитики. Многое можно сделать в рамках электронной таблицы, которая превращается в интуитивно понятный интерфейс к продвинутым инструментам анализа данных. В данной работе мы рассмотрим создание реляционной модели и визуализацию иерархии в агрегированных данных с использованием специализированных надстроек.

Читать онлайн Анализ и визуализация данных в электронных таблицах


© Валентин Юльевич Арьков, 2020


ISBN 978-5-4498-4910-6

Создано в интеллектуальной издательской системе Ridero

Предисловие

Перед вами продолжение серии работ, позволяющих познакомиться с основными технологиями бизнес-аналитики. Как ни странно, многое можно сделать в рамках пакета Excel, который теперь выступает в роли знакомого и интуитивно понятного интерфейса к продвинутым инструментам анализа данных.

В данной работе мы рассмотрим создание реляционной модели данных, а также построение и визуализацию иерархии в агрегированных данных с использованием надстроек Power Pivot и Power View для Excel.

Введение

В предыдущих работах мы рассмотрели базовый инструмент анализа данных — сводные таблицы PivotTables. Затем мы познакомились со средствами ETL (извлечения, преобразования и загрузки данных) — Get & Transform / Power Query.

В данной работе мы сделаем следующий шаг в освоении средств бизнес-аналитики — рассмотрим модель данных и надстройку Power Pivot. Мы познакомимся с ними на примере Microsoft Excel в сочетании с надстройками из программного комплекса Power BI.

Power Pivot позволяет работать с гораздо бóльшими объёмами данных, чем стандартный Excel. Напомним, что в пакете Excel максимальное количество строк на одном листе составляет чуть больше ОДНОГО МИЛЛИОНА. Использование специализированной надстройки снимает это ограничение.

Название Power Pivot говорит о том, что это средство для обобщения данных: Pivot Table — это сводная таблица. Слово Power означает, что это часть программного комплекса Power BI.

Power Pivot позволяет обрабатывать данные и вычислять обобщённые показатели, которые затем можно представить на экране с помощью разнообразных средств визуализации:

— Excel;

— Power View;

— Power Map / 3D Maps;

— Power BI Dashboards.

Задание. Прочитайте статью «Power Pivot» в английской версии Википедии. При необходимости используйте машинный перевод, например, в браузере Google Chrome. Выясните, какую модель аналитической обработки реализует Power Pivot.

Модель данных

Построение сводных таблиц и агрегирование данных может выполняться по нескольким таблицам с использованием модели данных.

Английское название: Data Model.

Модель данных в Excel соответствует логической структуре реляционной базы данных. Данные расположены в нескольких таблицах, которые связаны друг с другом по ключевому полю.

Модель данных можно импортировать из базы данных либо сформировать вручную.

Надстройка PowerPivot позволяет работать с визуальным преставлением модели данных и создавать связи «один ко многим».

Задание. Прочитайте в Википедии статьи «База данных» и «Система управления базами данных». Выясните, чем отличаются эти два понятия.

Задание. Прочитайте в Википедии статью «Модель данных» и выясните, чем различаются МОДЕЛЬ ДАННЫХ и МОДЕЛЬ БАЗЫ ДАННЫХ.

Задание. Прочитайте в английской версии Википедии статьи «Logical schema» и «Physical schema». Выясните, чем различаются логическая и физическая модели (схемы) базы данных.

Отчёт по работе

Отчёт оформляется в виде многостраничной рабочей книги Excel. Отчёт начинается с титульного листа. Далее идёт оглавление. Затем следуют основные страницы отчёта.

Подробности оформления мы подробно описали в предыдущих пособиях [6]. При необходимости можно обратиться к этим материалам.

Задание. Создайте рабочую книгу Excel и организуйте в ней титульный лист и оглавление — в соответствии с рекомендациями из предыдущих работ.


Созданный файл нужно сохранить в файле под коротким, простым и понятным названием.

Зачем нужно стараться и правильно называть файлы? Это уважение к себе и к другим.

Этот файл отправится по электронной почте, а то и в систему дистанционного обучения. А там таких файлов видимо-невидимо. Хорошее название файла очень помогает. Так же, как и хорошая тема электронного письма. Так же, как и понятное имя отправителя в электронном письме.

Представьте, что преподаватель получает письмо, где нет темы, отправитель указан как Масяня2009 , а приложенный файл назван МойОтчёт. xlsx. В тексте письма говорится: «Отчёт по лабам». Поможет ли это в общении?

Задание. Сохраните файл под коротким информативным названием.


Напомним, что результаты выполнения каждого задания нужно отразить в своём отчёте. Например, в задании говорится: «Выясните, какие надстройки для Excel используются в составе Power BI». Это означает не просто «узнать что-то для себя и никому не об этом не рассказывать». Это задание требует, чтобы вы сообщили о результатах своих изысканий в отчёте. Для этого можно завести отдельную страничку.

Задание. Прочитайте в Википедии статью «Power BI» и выясните, какие компоненты входят в состав Power BI Desktop. Опишите результаты изысканий на отдельной странице отчёта.

Анализ данных в PowerPivot

1. Установка или активизация Power Pivot

Надстройка Power Pivot входит в состав многих версий Microsoft Office и Microsoft Excel. Многих, но не всех.

Задание. Прочитайте статью «Where is Power Pivot?» на сайте поддержки:

https://support.office.com

Выясните, входит ли Power Pivot в состав вашей версии пакета Microsoft Office.


С этой книгой читают
Лес. Как устроена лесная экосистема

Что такое, в сущности, лес, откуда у людей с ним такая тесная связь? Для человека это не просто источник сырья или зеленый фитнес-центр – лес может стать местом духовных исканий, служить исцелению и просвещению. Биолог, эколог и журналист Адриане Лохнер рассматривает лес с культурно-исторической и с научной точек зрения. Вы узнаете, как устроена лесная экосистема, познакомитесь с различными типами леса, характеризующимися по составу видов деревьев и по условиям окружающей среды, а также с видами лесопользования и с некоторыми аспектами охраны лесов. «Когда видишь зеленые вершины холмов, которые волнами катятся до горизонта, вдруг охватывает оптимизм.


Технологии против Человека. Как мы будем жить, любить и думать в следующие 50 лет?

Эксперты пророчат, что следующие 50 лет будут определяться взаимоотношениями людей и технологий. Грядущие изобретения, несомненно, изменят нашу жизнь, вопрос состоит в том, до какой степени? Чего мы ждем от новых технологий и что хотим получить с их помощью? Как они изменят сферу медиа, экономику, здравоохранение, образование и нашу повседневную жизнь в целом? Ричард Уотсон призывает задуматься о современном обществе и представить, какой мир мы хотим создать в будущем. Он доступно и интересно исследует возможное влияние технологий на все сферы нашей жизни.


Князь Евгений Николаевич Трубецкой – философ, богослов, христианин

Монография протоиерея Георгия Митрофанова, известного историка, доктора богословия, кандидата философских наук, заведующего кафедрой церковной истории Санкт-Петербургской духовной академии, написана на основе кандидатской диссертации автора «Творчество Е. Н. Трубецкого как опыт философского обоснования религиозного мировоззрения» (2008) и посвящена творчеству в области религиозной философии выдающегося отечественного мыслителя князя Евгения Николаевича Трубецкого (1863-1920). В монографии показано, что Е.


Интеллигенция в поисках идентичности. Достоевский – Толстой

Монография посвящена проблеме самоидентификации русской интеллигенции, рассмотренной в историко-философском и историко-культурном срезах. Логически текст состоит из двух частей. В первой рассмотрено становление интеллигенции, начиная с XVIII века и по сегодняшний день, дана проблематизация важнейших тем и идей; вторая раскрывает своеобразную интеллектуальную, духовную, жизненную оппозицию Ф. М. Достоевского и Л. Н. Толстого по отношению к истории, статусу и судьбе русской интеллигенции. Оба писателя, будучи людьми диаметрально противоположных мировоззренческих взглядов, оказались “versus” интеллигентских приемов мышления, идеологии, базовых ценностей и моделей поведения.


Историческое образование, наука и историки сибирской периферии в годы сталинизма

Настоящая монография посвящена изучению системы исторического образования и исторической науки в рамках сибирского научно-образовательного комплекса второй половины 1920-х – первой половины 1950-х гг. Период сталинизма в истории нашей страны характеризуется определенной дихотомией. С одной стороны, это время диктатуры коммунистической партии во всех сферах жизни советского общества, политических репрессий и идеологических кампаний. С другой стороны, именно в эти годы были заложены базовые институциональные основы развития исторического образования, исторической науки, принципов взаимоотношения исторического сообщества с государством, которые определили это развитие на десятилетия вперед, в том числе сохранившись во многих чертах и до сегодняшнего времени.


На траверзе — Дакар

Послевоенные годы знаменуются решительным наступлением нашего морского рыболовства на открытые, ранее не охваченные промыслом районы Мирового океана. Одним из таких районов стала тропическая Атлантика, прилегающая к берегам Северо-западной Африки, где советские рыбаки в 1958 году впервые подняли свои вымпелы и с успехом приступили к новому для них промыслу замечательной деликатесной рыбы сардины. Но это было не простым делом и потребовало не только напряженного труда рыбаков, но и больших исследований ученых-специалистов.


Проданные годы [Роман в новеллах]

«Я хорошо еще с детства знал героев романа „Проданные годы“. Однако, приступая к его написанию, я понял: мне надо увидеть их снова, увидеть реальных, живых, во плоти и крови. Увидеть, какими они стали теперь, пройдя долгий жизненный путь со своим народом.В отдаленном районе республики разыскал я своего Ализаса, который в „Проданных годах“ сошел с ума от кулацких побоев. Не физическая боль сломила тогда его — что значит физическая боль для пастушка, детство которого было столь безрадостным! Ализас лишился рассудка из-за того, что оскорбили его человеческое достоинство, унизили его в глазах людей и прежде всего в глазах любимой девушки Аквнли.


Загадочные места планеты
Жанр: Эзотерика

В 2006–2009 годах издательства Книжный клуб «Клуб семейного досуга» (Белгород) и Книжный клуб «Клуб семейного досуга» (Харьков) выпустило в свет потрясающую серию книг «Опасно: Аномальная зона» (харьковских исследователей-аномалистов). Все книги в твердом переплете, вышли тиражом в 5000 экз. каждая и нашли своего читателя._____Земля даже в наш космический век является планетой загадок. Сегодня выявлено немало аномальных зон, которые заставляют исследователей собирать подробнейшую информацию о происходящих там удивительных событиях.


Женщины Великого века

Красавицы, бунтовщицы, авантюристки, фаворитки и шпионки времен царствования Людовика Великого в изображении Жюльетты Бенцони предстают перед читателями во всем великолепии. Интриги, заговоры, похищения, придворные тайны – через все это проходят женщины Великого века, тайные агентки Короля-солнце. Они не просто живут, любят, страдают, борются за свои интересы, но и влияют на ход французской истории.


Рандеву с петлей на шее (сборник)

На собственной даче бельевой веревкой задушен преуспевающий риелтор Алексей Водопьянов. Вдова погибшего настаивает, чтобы дело расследовал полковник МУРа Лев Гуров. Вместе со своим другом и коллегой Станиславом Крячко Гуров начинает отрабатывать возможные версии преступления. Выясняется, что смерть эта была выгодна многим из окружения бизнесмена. Но циничность замысла убийцы поразила даже видавших виды сыщиков.


Другие книги автора
Организация параллельных потоков. Часть 1

В данной лабораторной работе рассматриваются основы организации параллельных потоков с помощью стандартных вызовов операционной системы. В работе используется бесплатная интегрированная среда разработки. Приводятся примеры программ на языке Си.


Применение гистограмм в управлении качеством

Гистограмма — это один из самых простых инструментов статистического УПРАВЛЕНИЯ КАЧЕСТВОМ производства. В этой работе будет использоваться пакет Microsoft Excel для создания исходных данных, а также для построения и анализа гистограммы. Можно также использовать любой другой программный инструмент, позволяющий строить гистограммы.


Бизнес-аналитика. Извлечение, преобразование и загрузка данных

Системы бизнес-аналитики работают с различными источниками данных с помощью функций ETL (Extract-Transform-Load). Название ETL можно перевести как «извлечение, преобразование и загрузка данных». Имеется в виду загрузка в хранилище данных для дальнейшей обработки в системе бизнес-аналитики. В простейшем случае это загрузка данных в виде одной, объединённой, консолидированной таблицы. В данной работе мы познакомимся с основными этапами ETL на примере загрузки данных в электронные таблицы.


Анализ рядов динамики в электронных таблицах

В данной работе мы рассмотрим раздел «Динамика». Здесь изучают данные, привязанные ко времени. Мы будем опираться на две предыдущие работы: «Анализ распределения (Сводка и группировка)» и «Анализ взаимосвязи (Корреляция и регрессия)». Работа выполняется в пакете типа электронных таблиц. Как и в предыдущих работах, вначале мы сгенерируем случайные числа и поиграем с ними, а затем поработаем с реальными данными.