Валентин Арьков - Статистический анализ взаимосвязи. Учебное пособие

Статистический анализ взаимосвязи. Учебное пособие
Название: Статистический анализ взаимосвязи. Учебное пособие
Автор:
Жанры: Просто о бизнесе | Руководства | Книги о компьютерах | Прочая образовательная литература
Серии: Нет данных
ISBN: Нет данных
Год: Не установлен
О чем книга "Статистический анализ взаимосвязи. Учебное пособие"

Рассматриваются такие инструменты статистического анализа взаимосвязи, как корреляционный и регрессионный анализ. Техника работы в электронных таблицах изучается на примере смоделированных данных. Затем полученные навыки применяются к анализу реальных данных по ценам в интернет-магазине и биржевым котировкам.

Бесплатно читать онлайн Статистический анализ взаимосвязи. Учебное пособие


© Валентин Юльевич Арьков, 2020


ISBN 978-5-0050-4525-6

Создано в интеллектуальной издательской системе Ridero

Предисловие

Предлагаемое учебное пособие позволяет освоить базовые методы исследования взаимосвязей в пакете Microsoft Excel. Все действия описаны подробно, шаг за шагом, с примерами и комментариями. Попутно можно улучшить навыки работы в Excel, что само по себе уже полезно как элемент современной компьютерной грамотности.

Данное учебное пособие представляет собой второй выпуск серии «Бизнес-аналитика и статистика в Excel». При выполнении работы советуем использовать знания и навыки, полученные при изучении первого выпуска под названием «Анализ распределения в Excel». Рекомендуем изучать материал последовательно – и в рамках данной работы, и в рамках данной серии.

Мы будем использовать простые условные обозначения и названия:

– жирный шрифт – названия функций и пунктов меню;

– ЗАГЛАВНЫЕ БУКВЫ – выделение основных терминов и ключевых данных;

– КНОПКИ – кнопки на экране компьютера;

– КЛАВИШИ – клавиши на клавиатуре компьютера.

В тексте описана работа в текущей англоязычной версии Microsoft Excel из пакета Microsoft Office 365. Далее будем называть этот программный продукт просто Excel. При указании функций и пунктов меню мы будем давать оба варианта – на английском и на русском языке. На рисунках будем давать примеры англоязычного интерфейса.

Введение

Взаимосвязи между явлениями бывают самые разные. В данном выпуске мы будем рассматривать самый популярный вид взаимосвязи между случайными величинами, когда текущее значение одной случайной величины Y В СРЕДНЕМ определяется значением другой случайной величины X. Вокруг этого предсказуемого среднего имеется случайный непредсказуемый разброс. Лучше всего, если этот разброс постоянного размаха, то есть «сигма» разброса не меняется. Это так называемая КОРРЕЛЯЦИОННАЯ ЗАВИСИМОСТЬ.

Эта две случайные величины называют по-разному:

X – факторный признак, фактор, независимая переменная, independent variable;

Y – результативный признак, результат, зависимая переменная, dependent variable.

На графике «иксы» откладывают по горизонтальной оси, а «игреки» – по вертикальной. В математике принято откладывать аргумент функции по оси X, а значение функции – по оси Y. В данном случае мы поступаем точно так же. Это намекает, что Y зависит от Х. Например, люди высокого роста в среднем весят больше. Поэтому рост можно будет обозначить через X, а вес – через Y.

Корреляционная зависимость изучается с помощью методов КОРРЕЛЯЦИОННОГО И РЕГРЕССИОННОГО АНАЛИЗА. Кроме того, здесь мы снова проведём СВОДКУ И ГРУППИРОВКУ ДАННЫХ, но не для изучения распределения, а для анализа взаимосвязи.

Отчёт о работе оформляется по общим правилам, которые мы уже описали в первом выпуске серии и которые (как мы надеемся) уже удалось освоить в процессе выполнения заданий. Поэтому повторять рекомендации не будем, а сразу займёмся делом.

Общие сведения

В данной работе мы будем исследовать взаимосвязь между случайными величинами статистическими методами.

Мы познакомимся с одним из самых известных видов взаимосвязи под названием КОРРЕЛЯЦИОННАЯ ЗАВИСИМОСТЬ, или просто КОРРЕЛЯЦИЯ. Можно сказать, что это «зависимость в среднем». Пример показан на рисунке ниже.


Корреляционная зависимость


На нашем рисунке видно, что с увеличением «икса» В СРЕДНЕМ увеличивается «игрек». Можно сказать, что здесь просматривается линия и разброс точек вокруг этой воображаемой линии. В этом случае говорят, что между «иксом» и «игреком» есть КОРРЕЛЯЦИЯ, или корреляционная зависимость, или корреляционная взаимосвязь.

Изображение того, как разбросаны точки по графику, называют по-разному:

– корреляционное поле;

– поле корреляции;

– диаграмма разброса;

– диаграмма рассеяния;

– «точечная диаграммма»;

– scatter plot.

Далее мы будем использовать название ДИАГРАММА РАЗБРОСА.

Корреляционная зависимость встречается в жизни. Вот некоторые примеры такой зависимости «в среднем»:

– рост и вес человека;

– площадь квартиры и её цена;

– уровень доходов и продолжительность жизни;

– доходы и расходы домашнего хозяйства;

– длина поездки и расход бензина;

– посещаемость занятий и оценка на экзамене.

Если рассматривать картину в целом, то здесь будет какая-то общая тенденция (прямая или кривая линия), а в каждом конкретном случае к ней добавляется случайный разброс, непредсказуемость, погрешность. По реальным данным можно оценить наличие (силу, степень, тесноту) взаимосвязи и даже построить уравнение такой зависимости. Такое уравнение даст нам только ориентир, среднюю картину и позволит делать приблизительные прогнозы.

Мы будем строить модель в виде одного уравнения, в котором есть один факторный признак и один результативный. Такая модель называется ПÁРНАЯ РЕГРЕССИЯ. Это означает, что у нас рассматривается ПАРА случайных величин, то есть в уравнении участвуют ДВЕ переменные.

Как и в предыдущей работе, вначале мы смоделируем исходные данные и познакомимся со статистическими методами. Затем мы возьмём реальные данные и применим к ним эти изученные технологии. Моделирование даёт идеальные, «красивые» данные, по которым можно начать обучение. Реальные данные всегда «угловатые», «шершавые», «некрасивые», неидеальные. Но это жизнь, и именно с реальными данными приходится иметь дело исследователям, инженерам, программистам, экономистам.

Модели описывают реальную жизнь очень приблизительно, но даже такое приближённое описание может быть полезно при решении реальных задач на производстве и в бизнесе. Слово ПРИБЛИЖЁННОЕ указывает, что есть некоторая погрешность и что наша модель, наше уравнение ПРИБЛИЖАЕТСЯ к реальной жизни. То есть близко, но не точно. И это уже лучше, чем полная неизвестность и неопределённость. А полной, абсолютной точности никогда не бывает. Даже на рынке можно поторговаться, и цена изменится, причём у разных покупателей получится по-разному. Так что, выходя из дома за покупками, человек только очень приблизительно может оценить предстоящие расходы.

Варианты задания

Варианты заданий представлены в таблице ниже. Здесь мы используем следующие условные обозначения.

X – факторный признак, или фактор, или независимая переменная. Мы моделируем Х как случайную величину с РАВНОМЕРНЫМ РАСПРЕДЕЛЕНИЕМ в указанном диапазоне.

E – случайная составляющая. Будем моделировать Е как случайную величину со СТАНДАРТНЫМ НОРМАЛЬНЫМ РАСПРЕДЕЛЕНИЕМ, то есть с нулевым средним и единичной дисперсией.

Y – результативный признак, или результат, или зависимая переменная. При моделировании мы вычисляем Y по формуле, в которой участвуют фактор X и случайность E. Коэффициент при случайной составляющей определяет её СИГМУ (стандартное отклонение) и, соответственно, разброс вокруг среднего.


С этой книгой читают
Изучая операционные системы, важно и понимать теорию, и уметь практически работать на компьютере. Функции любой операционной системы сводятся к понятию управления. Реализация этих функций – это выбор интерфейса пользователя: командная строка, файловый менеджер или оконная система. В курсе ОС мы рассматриваем все три вида интерфейса – практически, но с пониманием теории. Для упражнений будем использовать популярную ОС, название которой буквально п
Гистограмма – это один из самых простых инструментов статистического управления качеством производства. В этой работе будет использоваться электронная таблица для создания исходных данных, а также для построения и анализа гистограммы. Можно также использовать любой другой программный инструмент, позволяющий строить гистограммы.
Перед вами продолжение серии пособий, позволяющих познакомиться с основными технологиями бизнес-аналитики. Многое можно сделать в рамках электронной таблицы, которая превращается в интуитивно понятный интерфейс к продвинутым инструментам анализа данных.В данной работе мы рассмотрим создание реляционной модели и визуализацию иерархии в агрегированных данных с использованием специализированных надстроек.
Системы бизнес-аналитики работают с различными источниками данных с помощью функций ETL (Extract-Transform-Load). Название ETL можно перевести как «извлечение, преобразование и загрузка данных». Имеется в виду загрузка в хранилище данных для дальнейшей обработки в системе бизнес-аналитики.В простейшем случае это загрузка данных в виде одной, объединённой, консолидированной таблицы. В данной работе мы познакомимся с основными этапами ETL на пример
Brow Expert – это методическое пособие, по которому можно научиться делать брови. Тут собрана самая важная информация: от материалов, их составов и использования – до архитектуры и асимметрии; от техник нанесения красителя – до разборов топовых брендов хны и краски. Подходит новичкам и мастерам с любым опытом. А также преподавателям, которые с помощью этой методички смогут составить свое собственной пособие для курсов и план обучения. Пособие доп
Это ваш путеводитель по миру копчения, который поможет вам превратить любимое хобби в прибыльное дело.От выбора оборудования до маркетинговых стратегий.Как создавать вкуснейшие копченые деликатесы, которые понравятся вашим клиентам.Как оформить документы и получить необходимые разрешения.Как построить бизнес-модель, которая принесет вам прибыль.Как расширить ассортимент, найти новые каналы сбыта и вывести бизнес на новый уровень.Эта книга станет
Открытие и развитие бизнеса на маркетплейсах требует усилий и времени, но с правильным подходом и планированием вы можете достичь успеха. Используйте доступные инструменты, учитесь на своих ошибках, и обязательно следите за новыми трендами, чтобы оставаться конкурентоспособным на рынке. Работая последовательно и упорно, вы сможете построить успешный бизнес на маркетплейсах.
Монография посвящена проблемам прогнозирования и планирования развития социально-экономического потенциала города Череповца. Исследованы сущность, структура социально-экономического потенциала города, методы его прогнозирования и планирования, нормативно-правовая база. Проведен анализ социально-экономического потенциала Череповца, разработан прогноз его развития до 2029 года. Предложен комплекс мер и проектов по диверсификации экономики, развитию
Учебник рекомендуется учащимся школ, студентам и широкому кругу лиц, изучающим английский язык на курсах, с репетитором или самостоятельно; подойдет как самоучитель и начинающим, и тем, кто уже имеет определенные знания. В нем рассматриваются все времена английского глагола, их употребление, построение, сигнальные слова; даны тесты и упражнения по переводу с русского языка на английский для закрепления полученных навыков. Все упражнения адаптиров
Эта книга – ключ к Индонезии. Как туда приехать или прилететь? Как лучше поехать – с визой или без визы? Транспорт, морской, железнодорожный, автобусный, автостоп, пешком и на самолёте – как попасть в любые уголки этой страны? Ночлег (бесплатный и платный), обычаи, религии, регистрация и погранзоны, покорение вулканов и гор, джунгли Папуа, особенности местного менталитета и язык, – всё это описано в книге. Ваше путешествие по Индонезии будет безо
13
Любите страшные истории, от которых кровь стынет в жилах? Наши леденящие душу сюжеты без сомнений поднимут дыбом все волоски на вашем теле, заставят нервно оглядываться на любой звук.Мы приготовили чертову дюжину рассказов для любителей пощекотать себе нервы.Герои наших историй сталкиваются с ужасным и необъяснимым, мистическим, иррациональным, пугающим. Они убегают и сражаются, предают и влюбляются. А путь их сопровождается зловещим хохотом. Тяг
Я, единственная оставшаяся в живых представительница древнего рода, вынуждена вернуться в разрушенный замок, чтобы найти таинственный артефакт и доказать свою невиновность. Вот только за мной по пятам следуют проблемы, а единственный, кто верит в мою историю, это молодой офицер, не обладающий властью спасти меня от плахи. Еще и таинственный голос из снов окончательно переворачивает все с ног на голову. Смогу ли я выжить, или крах моей семьи неизб