Владимир Савельев - Статистика и котики

Статистика и котики
Название: Статистика и котики
Автор:
Жанры: Экономическая статистика | Политика и власть
Серия: Звезда Рунета. Бизнес
ISBN: Нет данных
Год: 2018
О чем книга "Статистика и котики"

Из этой книги вы узнаете, что такое дисперсия и стандартное отклонение, как найти t-критерий Стьюдента и U-критерий Манна-Уитни, для чего используются регрессионный и факторный анализы, а также многое и многое другое. И все это – на простых и понятных примерах из жизни милых и пушистых котиков, которые дарят нам множество приятных эмоций.

Бесплатно читать онлайн Статистика и котики


© Савельев Владимир, текст

© ООО «Издательство АСТ»

* * *

Предисловие. От автора

Мало кто любит статистику.

Одни считают эту науку сухой и безжизненной. Другие боятся и избегают ее. Третьи полагают, что она бесполезна. Но у меня другое мнение на этот счет.

На мой взгляд, статистика обладает своей особой внутренней красотой. Ее можно увидеть, вглядываясь в корреляционную матрицу, рассматривая дендрограммы или интерпретируя результаты факторного анализа. За каждым статистическим коэффициентом стоит маленькое чудо, раскрывающее скрытые закономерности окружающего нас мира.

Но чтобы найти эту красоту, чтобы услышать поэзию, которая пронизывает статистику насквозь, необходимо преодолеть первоначальный страх и недоверие, вызванное внешней сложностью этого предмета.

Для того и написана эта книга. Чтобы показать, что статистика не такая страшная, как о ней думают. И что она вполне может быть такой же милой и пушистой, как котики, которые встретятся вам на страницах этой книги.

От партнера издания

При слове «статистика» я вспоминаю британских ученых и выборы. Статистика – это многогранный инструмент. Иногда статистикой манипулируют, а можно открывать знания о реальном мире.

Автор написал книгу о базовой статистике в забавном формате. Старая система образования выдает порцию неинтересных и бесполезных знаний. А котики обучают, развлекая.

Когда мы изучаем данные, мы осознаем, что задача – найти соломинку в стоге иголок. И понять, сколько ещё стогов и соломы найдем дальше. Статистика в бизнесе помогает нам экономить деньги и открывать новые рынки. Экономия питает амбиции и потихоньку делает жизнь людей чуточку лучше.

Респект читателям. Респект автору.

Юрий Корженевский,
Центр Исследований и Разработки.
www.rnd.center

Глава 1. Как выглядят котики или Основы описательной статистики

Котики бывают разные. Есть большие котики, а есть маленькие. Есть котики с длинными хвостами, а есть и вовсе без хвостов. Есть котики с висячими ушками, а есть котики с короткими лапками. Как же нам понять, как выглядит типичный котик?



Для простоты мы возьмем такое котиковое свойство, как размер.

Первый и наиболее очевидный способ – посмотреть, какой размер котиков встречается чаще всего. Такой показатель называется модой.



Второй способ: мы можем упорядочить всех котиков от самого маленького до самого крупного, а затем посмотреть на середину этого ряда. Как правило, там находится котик, который обладает самым типичным размером. И этот размер называется медианой.



Если же посередине находятся сразу два котика (что бывает, когда их четное количество), то, чтобы найти медиану, нужно сложить их размеры и поделить это число пополам.



Последний способ нахождения наиболее типичного котика – это сложить размер всех котиков и поделить на их количество. Полученное число называется средним значением, и оно является очень популярным в современной статистике.



Однако, среднее арифметическое далеко не всегда является лучшим показателем типичности.

Предположим, что среди наших котиков есть один уникум размером со слона. Его присутствие может существенным образом сдвинуть среднее значение в большую сторону, и оно перестанет отражать типичный котиковый размер.



Такой «слоновый» котик, так же как и котик размером с муравья, называется выбросом, и он может существенно исказить наши представления о котиках. И, к большому сожалению, многие статистические критерии, содержащие в своих формулах средние значения, также становятся неадекватными в присутствии «слоновых» котиков.

Чтобы избавиться от таких выбросов, иногда применяют следующий метод: убирают по 5–10 % самых больших и самых маленьких котиков и уже от оставшихся считают среднее. Получившийся показатель называют усеченным (или урезанным) средним.



Альтернативный вариант – применять вместо среднего медиану.

Итак, мы рассмотрели основные методы нахождения типичного размера котиков: моду, медиану и средние значения. Все вместе они называются мерами центральной тенденции. Но, кроме типичности, нас довольно часто интересует, насколько разнообразными могут быть котики по размеру. И в этом нам помогают меры изменчивости.

Первая из них – размах – является разностью между самым большим и самым маленьким котиком. Однако, как и среднее арифметическое, эта мера очень чувствительна к выбросам. И, чтобы избежать искажений, мы должны отсечь 25 % самых больших и 25 % самых маленьких котиков и найти размах для оставшихся. Эта мера называется межквартильным размахом.



Вторая и третья меры изменчивости называются дисперсией и стандартным отклонением. Чтобы разобраться в том, как они устроены, предположим, что мы решили сравнить размер некоторого конкретного котика (назовем его Барсиком) со средним котиковым размером. Разница (а точнее разность) этих размеров называется отклонением.



И совершенно очевидно, что чем сильнее Барсик будет отличаться от среднего котика, тем больше будет это самое отклонение.

Логично было бы предположить, что чем больше у нас будет котиков с сильным отклонением, тем более разнообразными будут наши котики по размеру. И, чтобы понять, какое отклонение является для наших котиков наиболее типичным, мы можем просто найти среднее значение по этим отклонениям (т. е. сложить все отклонения и поделить их на количество котиков).



Однако если мы это сделаем, то получим 0. Это происходит, поскольку одни отклонения являются положительными (когда Барсик больше среднего), а другие – отрицательными (когда Барсик меньше среднего). Поэтому необходимо избавиться от знака. Сделать это можно двумя способами: либо взять модуль от отклонений, либо возвести их в квадрат, который, как мы помним, всегда положителен. Последнее применяется чаще.



И, если мы найдем среднее от квадратов отклонений, мы получим то, что называется дисперсией. Однако, к большому сожалению, квадрат в этой формуле делает дисперсию очень неудобной для оценки разнообразия котиков: если мы измеряли размер в сантиметрах, то дисперсия имеет размерность в квадратных сантиметрах. Поэтому для удобства использования дисперсию берут под корень, получая по итогу показатель, называемый среднеквадратическим отклонением.



К несчастью, дисперсия и среднеквадратическое отклонение так же неустойчивы к выбросам, как и среднее арифметическое.

Среднее значение и среднеквадратическое отклонение очень часто совместно используются для описания той или иной группы котиков. Дело в том, что, как правило, большинство (а именно около 68 %) котиков находится в пределе одного среднеквадратического отклонения от среднего. Эти котики обладают так называемым нормальным размером. Оставшиеся 32 % либо очень большие, либо очень маленькие. В целом же для большинства котиковых признаков картина выглядит вот так:


С этой книгой читают
В мире, где каждую секунду нас отвлекают десятки уведомлений сразу из нескольких мессенджеров и приложений, где всегда можно «поразвлечься» игрой «три в ряд», просмотром ленты в соцсетях или роликов на YouTube – самым ценным ресурсом становится внимание. Внимание клиентов, сотрудников, учеников – и даже свое собственное. Как перестать отвлекаться и прокрастинировать? Как поднять мотивацию в отделе продаж? Как заполучить лояльность клиентов? Что д
Попробуй ответить себе на следующие вопросы:1. Чего ты хочешь от жизни в целом и чего ты хочешь от жизни каждый день?2. Чем ты отличаешься… скажем, от осла? Он ест, спит, справляет нужду, занимается сексом, защищается, почуяв угрозу, и трудится за морковку. Что уникального делаешь ты?3. Зачем ты живешь? Ты уже нашел смысл своей жизни? Каково твое предназначение? Что полезного ты можешь сделать в этом мире?Размышление над такими вопросами авторы с
С чего начинается бизнес? Принято считать, что с идеи.На самом деле – нет. Сама по себе идея ничего не стоит. Идея – это мысль, продукт сложных химических процессов, происходящих в нашем мозге. Она обретает стоимость и значение лишь тогда, когда воплощается в дело, становится толчком к действию. И вот тут-то перед человеком, решившим (или наконец-то решившимся) открыть свое дело, встает множество преград и вечный вопрос – что делать?100 книг даду
Книга известного видеоблогера Стаса Быкова поможет любому человеку, вне зависимости от возраста и профессии, создать свой канал на YouTube. Следуя его советам, вы сможете самостоятельно оформить и наполнить канал информацией, научитесь создавать видеоролики и грамотно загружать их на канал, узнаете, как набрать первые просмотры и подписчиков, и в итоге заработать реальные деньги в Интернете.В этой книге нет воды, только самая суть для качественно
Из этой книги вы узнаете, что такое дисперсия и стандартное отклонение, как найти t-критерий Стьюдента и U-критерий Манна-Уитни, для чего используются регрессионный и факторный анализы, а также многое и многое другое.И все это – на простых и понятных примерах из жизни милых и пушистых котиков, которые дарят нам множество приятных эмоций.
Из этой книги вы узнаете, что такое дисперсия и стандартное отклонение, как найти t-критерий Стьюдента и U-критерий Манна-Уитни, для чего используются регрессионный и факторный анализы, а также многое и многое другое. И все это – на простых и понятных примерах из жизни милых и пушистых котиков, которые дарят нам множество приятных эмоций.
В монографии разрабатываются вопросы методологии с позиции применения статистических методов для изучения качественных и количественных показателей качества услуг. Проводится всесторонний анализ качества услуг общественного транспорта, мобильной связи и системы жилищно-коммунального хозяйства на примере г. Оренбурга.
Мы живём в экономическом мире, но часто пытаемся создать свои собственные законы экономики. По большому счёту, экономика – это не столько точная наука, сколько сфера закономерностей, которые каждый день возникают в нашей жизни в виде цены, курса валют, ситуаций на работе, решений о покупках и множества других событий. Мы можем точно рассчитать траекторию движения небесных тел, но зачастую своё следующее экономическое решение предсказать не можем.
В книге дается представление авторов об экономике Северного Кавказа, существенно отличающееся от общепризнанного. Под вопрос ставятся многие сложившиеся мифы и стереотипы – тотальная депрессивность; масштабы безработицы и бедности; наличие барьеров, полностью исключающих модернизацию; дефицит финансовых средств как основная причина недостаточного экономического развития. Формулируются базовые принципы регионального развития, альтернативные традиц
Эта книга сформирована как коллекция наиболее интересных примеров из разработанных авторами в последние 12 лет десятков прогнозных документов социально-экономического развития городов, районов и регионов России. Главное кредо авторов состоит в необходимости индивидуального, «штучного» подхода в этом процессе. Уход от рутины в региональном стратегировании напрямую связан со значительным вниманием к пространственным факторам развития – экономико-ге
Летнее настроение такое мрачное и печальное… Еще и этот бесконечно холодный дождь… Он постоянно открывает странные видения и показывает нам давно забытые образы… Мужчина был на грани, еще один шаг и роковое решение могло бы быть принято, но лишь одно видение из прошлого подарило новую надежду…
В многотомнике собраны биографии военных деятелей, которые дослужились до званий генералов и адмиралов и проходили службу в Главном разведывательном управлении Генерального штаба Советской Красной армии и флота, а также Российской армии и флота, были начальниками войсковой разведки штаба военных округов, фронтов, армий и флотов, резидентами разведки СССР и военными атташе, а также военными инструкторами и советниками за границей и командирами бри
Легко ли выжить в Империи таким, как я? Почти невозможно. Элари уничтожали всегда - всплеск нашего дара смертельно опасен для магов, однако любого может наделить абсолютной силой. Чтобы спасти себя и брата, я вынуждена помогать наследному принцу, подчиняться тайному советнику и находиться в самом центре коварных интриг. А заодно поступить в Академию, влюбиться и раскрыть тайну своей магии... - ОДНОТОМНИК. - Книга вышла в издательстве ЭКСМО.
БУКТРЕЙЛЕР! Моя жизнь по вине обстоятельств раскололась на две половины: белую и чёрную... В одной я студентка-отличница, в другой танцовщица стриптиза, зарабатывающая деньги, необходимые как воздух... В одной я отчаянно пытаюсь воскресить в сердце невинную первую любовь, в другой, помимо своей воли, сгораю от страсти к непонятному мужчине... Но я не могу вечно жить двумя кардинально разными жизнями! Редактор — Валентина Блинкова. Обложка - Е