Статистический анализ взаимосвязи в Excel

Статистический анализ взаимосвязи в Excel

Авторы:

Жанры: Научная литература, Компьютерная литература, О бизнесе популярно

Циклы: не входит в цикл

Формат: Фрагмент

Всего в книге 18 страниц. Год издания книги - 2019.

Рассматриваются такие инструменты статистического анализа взаимосвязи, как корреляционный и регрессионный анализ. Техника работы в пакете Excel изучается на примере смоделированных данных. Затем полученные навыки применяются к анализу реальных данных по ценам в интернет-магазине и биржевым котировкам на Московской бирже.

Читать онлайн Статистический анализ взаимосвязи в Excel


© Валентин Юльевич Арьков, 2019


ISBN 978-5-0050-4525-6

Создано в интеллектуальной издательской системе Ridero

Предисловие

Предлагаемое учебное пособие позволяет освоить базовые методы исследования взаимосвязей в пакете Microsoft Excel. Все действия описаны подробно, шаг за шагом, с примерами и комментариями. Попутно можно улучшить навыки работы в Excel, что само по себе уже полезно как элемент современной компьютерной грамотности.

Данное учебное пособие представляет собой второй выпуск серии «Бизнес-аналитика и статистика в Excel». При выполнении работы советуем использовать знания и навыки, полученные при изучении первого выпуска под названием «Анализ распределения в Excel». Рекомендуем изучать материал последовательно — и в рамках данной работы, и в рамках данной серии.

Мы будем использовать простые условные обозначения и названия:

— жирный шрифт — названия функций и пунктов меню;

— ЗАГЛАВНЫЕ БУКВЫ — выделение основных терминов и ключевых данных;

— КНОПКИ — кнопки на экране компьютера;

— КЛАВИШИ — клавиши на клавиатуре компьютера.

В тексте описана работа в текущей англоязычной версии Microsoft Excel из пакета Microsoft Office 365. Далее будем называть этот программный продукт просто Excel. При указании функций и пунктов меню мы будем давать оба варианта — на английском и на русском языке. На рисунках будем давать примеры англоязычного интерфейса.

Введение

Взаимосвязи между явлениями бывают самые разные. В данном выпуске мы будем рассматривать самый популярный вид взаимосвязи между случайными величинами, когда текущее значение одной случайной величины Y В СРЕДНЕМ определяется значением другой случайной величины X. Вокруг этого предсказуемого среднего имеется случайный непредсказуемый разброс. Лучше всего, если этот разброс постоянного размаха, то есть «сигма» разброса не меняется. Это так называемая КОРРЕЛЯЦИОННАЯ ЗАВИСИМОСТЬ.

Эта две случайные величины называют по-разному:

X — факторный признак, фактор, независимая переменная, independent variable;

Y — результативный признак, результат, зависимая переменная, dependent variable.

На графике «иксы» откладывают по горизонтальной оси, а «игреки» — по вертикальной. В математике принято откладывать аргумент функции по оси X, а значение функции — по оси Y. В данном случае мы поступаем точно так же. Это намекает, что Y зависит от Х. Например, люди высокого роста в среднем весят больше. Поэтому рост можно будет обозначить через X, а вес — через Y.

Корреляционная зависимость изучается с помощью методов КОРРЕЛЯЦИОННОГО И РЕГРЕССИОННОГО АНАЛИЗА. Кроме того, здесь мы снова проведём СВОДКУ И ГРУППИРОВКУ ДАННЫХ, но не для изучения распределения, а для анализа взаимосвязи.

Отчёт о работе оформляется по общим правилам, которые мы уже описали в первом выпуске серии и которые (как мы надеемся) уже удалось освоить в процессе выполнения заданий. Поэтому повторять рекомендации не будем, а сразу займёмся делом.

Общие сведения

В данной работе мы будем исследовать взаимосвязь между случайными величинами статистическими методами.

Мы познакомимся с одним из самых известных видов взаимосвязи под названием КОРРЕЛЯЦИОННАЯ ЗАВИСИМОСТЬ, или просто КОРРЕЛЯЦИЯ. Можно сказать, что это «зависимость в среднем». Пример показан на рисунке ниже.


Корреляционная зависимость


На нашем рисунке видно, что с увеличением «икса» В СРЕДНЕМ увеличивается «игрек». Можно сказать, что здесь просматривается линия и разброс точек вокруг этой воображаемой линии. В этом случае говорят, что между «иксом» и «игреком» есть КОРРЕЛЯЦИЯ, или корреляционная зависимость, или корреляционная взаимосвязь.

Изображение того, как разбросаны точки по графику, называют по-разному:

— корреляционное поле;

— поле корреляции;

— диаграмма разброса;

— диаграмма рассеяния;

— «точечная диаграммма»;

— scatter plot.

Далее мы будем использовать название ДИАГРАММА РАЗБРОСА.

Корреляционная зависимость встречается в жизни. Вот некоторые примеры такой зависимости «в среднем»:

— рост и вес человека;

— площадь квартиры и её цена;

— уровень доходов и продолжительность жизни;

— доходы и расходы домашнего хозяйства;

— длина поездки и расход бензина;

— посещаемость занятий и оценка на экзамене.

Если рассматривать картину в целом, то здесь будет какая-то общая тенденция (прямая или кривая линия), а в каждом конкретном случае к ней добавляется случайный разброс, непредсказуемость, погрешность. По реальным данным можно оценить наличие (силу, степень, тесноту) взаимосвязи и даже построить уравнение такой зависимости. Такое уравнение даст нам только ориентир, среднюю картину и позволит делать приблизительные прогнозы.

Мы будем строить модель в виде одного уравнения, в котором есть один факторный признак и один результативный. Такая модель называется ПÁРНАЯ РЕГРЕССИЯ. Это означает, что у нас рассматривается ПАРА случайных величин, то есть в уравнении участвуют ДВЕ переменные.

Как и в предыдущей работе, вначале мы смоделируем исходные данные и познакомимся со статистическими методами. Затем мы возьмём реальные данные и применим к ним эти изученные технологии. Моделирование даёт идеальные, «красивые» данные, по которым можно начать обучение. Реальные данные всегда «угловатые», «шершавые», «некрасивые», неидеальные. Но это жизнь, и именно с реальными данными приходится иметь дело исследователям, инженерам, программистам, экономистам.


С этой книгой читают
Власть, влияние и политика в организациях

За десятилетия, на протяжении которых профессор Джеффри Пфеффер консультировал корпорации и обучал студентов МВА нюансам власти в компаниях, он не раз наблюдал, как карьера одних идет под откос, тогда как другие преуспевают, несмотря на трудности.«Власть, влияние и политика в организациях» — это книга о том, как преуспеть и добиться власти в реальном мире. Советы, примеры из реалий разных стран, удивительные исследовательские находки — книга знакомит читателя с тактикой и стратегией, которые отличают победителей от побежденных.


Саксон Грамматик о дохристианской славянской религии. Новый перевод соответствующих фрагментов XIV книги Деяний Данов

Данный перевод предназначен для того, чтобы не только сделать текст Саксона Грамматика более доступным для широкого круга читателей, но и представить часто игнорируемые фрагменты и альтернативный вариант прочтения неоднозначных фрагментов текста. Перевод сопровождает оригинальный латинский текст, а в русском варианте была сделана попытка передать структуру оригинала без искажения смысла, насколько это было возможно.


Сандинистская революция в Никарагуа. Предыстория и последствия

Книга посвящена первой успешной вооруженной революции в Латинской Америке после кубинской – Сандинистской революции в Никарагуа, победившей в июле 1979 года.В книге дан краткий очерк истории Никарагуа, подробно описана борьба генерала Аугусто Сандино против американской оккупации в 1927–1933 годах. Анализируется военная и экономическая политика диктатуры клана Сомосы (1936–1979 годы), позволившая ей так долго и эффективно подавлять народное недовольство. Особое внимание уделяется роли США в укреплении режима Сомосы, а также истории Сандинистского фронта национального освобождения (СФНО) – той силы, которая в итоге смогла победоносно завершить революцию.


Наследие аграрного закона Тиберия Гракха. Земельный вопрос и политическая борьба в Риме 20-х гг. II в. до н.э.

В книге рассматривается широкий круг исторических вопросов, связанных с аграрной реформой Тиберия Семпрония Гракха (133–124 гг. до и. э.) и законодательной деятельностью его младшего брата Гая. На основе сведений античных источников (письменных, эпиграфических и археологических) предпринимается попытка осветить некоторые малоизученные события из истории гракханского движения, такие, например, как политический кризис 129 г. до н. э., ценз 125/124 гг. до н. э. и аграрный закон Гая Гракха. Кроме того, даётся оценка новейшим концепциям (преимущественно зарубежным) социально-экономического и политического развития Рима в гракханское время.Не меньшее внимание уделяется и проблеме преемственности в политике братьев Гракхов, а также судьбе аграрной реформы после кризиса 129 г.


Хмурые будни холодной войны. Ее солдаты, прорабы и невольные участники

Данный сборник составлен по материалам докладов, прозвучавших на конференции по «холодной войне», проведенной Университетом Дмитрия Пожарского 6–7 февраля 2010 года. Эта конференция являлась первым шагом в инициированной Университетом Дмитрия Пожарского программе по изучению истории послевоенного периода. В сборнике представлены статьи ведущих специалистов по истории двадцатого века, истории спецслужб и военной истории. Авторы затрагивают различные аспекты «холодной войны» от анализа идеологических диверсий в сфере культуры и искусства, до изучения процесса формирования оборонной промышленности и деятельности разведки.


Невидимый фронт войны на море. Морская радиоэлектронная разведка в первой половине ХХ века

В монографии рассмотрен исторический опыт развития и боевого применения сил и средств морской радиоэлектронной разведки (разведки связи) в первой половине XX века – периода двух мировых войн и множества менее масштабных военных конфликтов.Исследование ранее закрытых документов и широкого круга других источников и литературы, с учетом эволюции военного дела и радиоразведки в России и за рубежом, позволило автору выявить тенденции, изменения перечня и содержания задач, решаемых отечественной морской РЭР, установить основные направления развития способов и методов ее ведения; определить место морской РЭР в разведывательном обеспечении флота и ее роль в решении отечественными флотами и группировками войск стоящих перед ними оперативных и стратегических задач.


Игла Мэсона
Автор: Лен Кошевой

Переработанный вариант повести «Цена миллисекунды», написанный Александром Лаврентьевичем Колпаковым под псевдонимом Лен Кошевой.


Отступившие в океан [Самуры; Пришельцы из Гондваны]
Автор: А. Мегалов

На отдаленном острове появляются гигантские насекомые. Теперь от них надо как-то спастись!Опубликован под псевдонимом А. Мегалов.


Будь со мной

Главные герои пройду через многое, прежде чем поймут, что созданы друг для друга. Но, и после этого, их ждут преграды и испытания разлукой…


Крик ангелов

Пропавшего во время экспедиции на Мертвое море священника-археолога Хуана Варгаса обнаруживают в больнице в совершенно невменяемом состоянии. Он бессвязно бормочет на каком-то непонятном языке и никого не узнает. Команде «Эхо» предстоит расследовать это загадочное происшествие. Следы уводят по ту сторону океана, в пустыню Нью-Мексико. Там доблестных рыцарей-тамплиеров ждут страшные испытания. Но когда силы смертных иссякают, на помощь приходят жители неба.Впервые на русском языке!


Другие книги автора
Анализ и визуализация данных в электронных таблицах

Перед вами продолжение серии пособий, позволяющих познакомиться с основными технологиями бизнес-аналитики. Многое можно сделать в рамках электронной таблицы, которая превращается в интуитивно понятный интерфейс к продвинутым инструментам анализа данных. В данной работе мы рассмотрим создание реляционной модели и визуализацию иерархии в агрегированных данных с использованием специализированных надстроек.


Организация параллельных потоков. Часть 1

В данной лабораторной работе рассматриваются основы организации параллельных потоков с помощью стандартных вызовов операционной системы. В работе используется бесплатная интегрированная среда разработки. Приводятся примеры программ на языке Си.


Применение гистограмм в управлении качеством

Гистограмма — это один из самых простых инструментов статистического УПРАВЛЕНИЯ КАЧЕСТВОМ производства. В этой работе будет использоваться пакет Microsoft Excel для создания исходных данных, а также для построения и анализа гистограммы. Можно также использовать любой другой программный инструмент, позволяющий строить гистограммы.


Бизнес-аналитика. Извлечение, преобразование и загрузка данных

Системы бизнес-аналитики работают с различными источниками данных с помощью функций ETL (Extract-Transform-Load). Название ETL можно перевести как «извлечение, преобразование и загрузка данных». Имеется в виду загрузка в хранилище данных для дальнейшей обработки в системе бизнес-аналитики. В простейшем случае это загрузка данных в виде одной, объединённой, консолидированной таблицы. В данной работе мы познакомимся с основными этапами ETL на примере загрузки данных в электронные таблицы.


Поделиться мнением о книге