Алексей Благирев, Наталья Хапаева - Big data простым языком

Big data простым языком
Название: Big data простым языком
Авторы:
Жанры: Базы данных | Научно-популярная литература
Серия: Бизнес-бук
ISBN: Нет данных
Год: 2019
О чем книга "Big data простым языком"

Наш телефон знает о нас больше, чем мы думаем. Он умеет собирать и анализировать информацию о том, как мы передвигаемся по городу, какие посты лайкаем и какими приложениями пользуемся. Он сообщит о пробках и поторопит на работу, чтобы мы не опоздали; подберет музыку под наше настроение и составит список персональных рекомендаций, чем можно занять себя в течение дня. Телефон – больше не устройство, по которому звонят, это уже средство управления окружающим нас миром. Незаметно мы окружили себя такими интерфейсами, которые создают невидимый барьер между человеком и окружающей средой. Планирование, управление, коммуникация, все теперь строится через эти программы и девайсы. Даже человеческие отношения.

Но насколько глубока кроличья нора? Каждому предстоит разобраться в этом самому. Эта книга поможет донести основные принципы проектирования и создания таких интерфейсов управления бизнесом, обществом и окружающим нас миром посредством Больших данных. Читайте, наслаждайтесь и помните: сожжение книг противозаконно.

Бесплатно читать онлайн Big data простым языком


© Благирев А., текст, иллюстрации

© ООО «Издательство АСТ»

* * *

Предисловие

Люблю людей.

Именно такие мысли остаются в голове, когда тебе предлагают полностью переписать книгу. А если вы читаете это, значит, мне удалось, и я все-таки ее переписал.

Началось все с того, что один мой друг спросил, не знаю ли я людей, которые могли бы простым языком написать про Большие данные. Тогда я сразу представил бесконечное количество писем от издательства, разговоров, уточнений, переписываний, – всей этой суеты, и первое, что мне хотелось ответить: «Нет, таких разумных существ я не знаю».



Да и смысл писать про Большие данные, если про них уже столько всего написано и рассказано? Вероятность написать что-то умное – минимальна.

И вот я начал писать… Я даже уже представлял себе, как героически заканчиваю эту книгу, становлюсь миллионером и на все деньги с продаж бесконечных тиражей иду погашать ипотеку.

План был гениален, оставалось только его воплотить.

Но, когда я показал плод своих трудов редактору, он сказал, что книга сложна для восприятия, иными словами, подходит только для ботанов. Я честно писал ее с использованием книжной лексики, сложных эвфемизмов, деепричастных оборотов и кропотливо вставлял в текст ссылки на источники, если вдруг упоминал материалы других авторов.

Один раз даже пришлось взять DMBOK, такую специальную «поваренную книгу» с инструкциями и стандартами организации работы с данными. Я перевел из нее целую главу на русский, но мне сказали, что это точно «слишком мощно» для читателя, как и попытка проанализировать существующее регулирование данных.

Итак, в поисках правды, баланса и закрытия личных гештальтов – как сейчас популярно говорить, мне дали книгу «Хулиномика» как пример образцовой книги жанра нон-фикшн.

Когда я взял в руки «Хулиномику», помимо ненормативной лексики в мыслях у меня появились смелые очертания нового эксперимента, поэтому вы держите в руках книгу про Большие данные, изданную под влиянием уникальной простоты и творческой логики изложения.

Мир данных – это компот, из которого трудно отделить то, что нужно знать, а что нет. И вроде бы все интересно, про все можно рассказать, но как понять, что из этого важно, например, учителю физкультуры, который на досуге решил погрузиться в данные?

Задачка оказалась сложнее, чем я думал.

Если вы пишите, скажем, про физику, то план изложения поправит научный редактор. А тут – технологии, англицизмы, и людей, знающих ключевые понятия, широту и многогранность Больших данных в издательстве просто-напросто нет.

И я взялся за дело. Сам.

Для начала я решил, что в каждой главе будет два уровня сложности. Первый – для тех, кто собрался почитать про данные, сидя на белом друге в тихой комнате, второй – для тех, чья сфера деятельности связана с данными.

Я написал большую главу про стратегию данных для тех, кто вынужден проектировать стратегию с нуля; попытался разобраться, как данные влияют на корпоративное управление компаниями; показал на ошибках людей, рисующих сложные, малопонятные графики, что формат изложения информации не менее важен, чем сам процесс получения знания.

Конечно, то, что вы держите в руках, – сильно переработанный вариант, но не менее достойный. Наверное.

Сегодня этот компот под названием «мир данных» – уже целая экономика, которая сильно повлияла на все вокруг, включая людей. Теперь нашими данными располагают голосовые помощники, а банки и компании, с которыми мы когда-либо имели дело, все чаще напоминают о себе и требуют внимания. Наш телефон знает, когда мы собираемся на работу, и заранее подгоняет нас к выходу, чтобы мы не опоздали из-за пробок, а когда мы выбираем песню, которую хотим послушать в машине, он выдает нам подходящий плейлист.

Важно знать, что за данные, а точнее за искусственный интеллект, начали активно «топить» в обществе и бизнесе, поднимая проблемы этики их использования.

Просто задумайтесь, вся цифровая среда уже оперирует такими понятиями как «лайки», «репосты», «конверсии». Люди уже обсуждают, как и где подешевле купить трафик себе на сайт, а накруткой подписчиков в Инстаграме не пользуется только ленивый.

Мы оставили позади (в первой версии книги) весь романтизм и большие надежды, поместив в новую версию экспертное мнение по основным блокам работы с данными.

Читайте, наслаждайтесь и помните: сожжение книг противозаконно.

Алексей Благирев

Глава 1

Что такое Big Data?

Марсианские диалекты

О Больших данных, или Big Data сегодня знают все.

Или еще нет?

Регулярно данные обсуждаются на сложных конференциях, где популярные компании собирают под своими тентами от дождя пару тысяч молодых людей, размещают роботов и плюшевые пуфики, предлагают даже сыграть в игру с ботом, чтобы посетители могли поучаствовать в машинном обучении. Происходит это примерно так: за ограниченное количество ходов игроку необходимо как можно быстрее споить девушку-робота.

В общем, кто чем пытается покорить свою аудиторию, рассказывая о работе сервисов с данными. Вот только ни у кого нет единой картины.

Одни компании говорят про конфиденциальность, другие – про машинное обучение, перечислять можно бесконечно. Есть даже гипотеза о том, что общая картина больше никому не нужна.

«Как это не нужна?» – спросите вы и поспешите на ее поиски.

Выйдете вы из зоны комфорта, пройдетесь по ключевым конференциям, связанным с данными, прочтете статейки известных умных авторов, но все равно толком ничего не соберется вместе.

Чтобы погрузиться в эту тему, надо взять лопату и копать, копать, копать: по кусочкам собирать смыслы, общаться с разными людьми. Администраторы баз данных могут рассказать вам о том, как настраивать кластеры, а ребята, которые копаются в аналитике, помогут разобрать общую логику процесса.

Только вот почему-то каждый эксперт понимает один и тот же термин по-своему. Будто люди строили Вавилонскую башню из данных, чтобы достучаться до небес, а в конце концов все равно заговорили на разных языках, как написано в Ветхом завете. И эти эксперты вкладывают в, казалось бы, обычные слова, какое-то свое понимание, близкое только им.

Конечно, всех бы мог спасти робот-переводчик, который знает тридцать три наречия межпланетных иезуитов. Но, боюсь, пока его функционал не вырос до такого уровня, придется прикидываться оленеводами, которые впервые услышали о Больших данных. Надо признать, что в некоторых историях мне пришлось разбираться прям с самого что ни на есть нуля, так что расслабьтесь и получайте удовольствие. Будет весело!

А начнем с того, что познакомимся с народом.

#1.

Есть такие важные и бессмертные инженеры по машинному обучению. Задача их проста – проектировать логику и обучать алгоритмы, известные как нейронные сети, заводя в них все новые и новые данные. Если спросить этих инженеров о чем-нибудь другом из области данных, то в большинстве случаев они понятия не будут иметь, о чем их спрашивают – например, кто такие дата-стюарды?


С этой книгой читают
«Стартап – почти как запуск корабля в космос. Очень сложная штука! Гарантировать успех тут не может никто. Сложнее запустить любой стартап, чем управлять большим и развитым бизнесом. Но сложно – еще не значит невозможно», – считает Алекс Яновский, американский миллионер и бизнесмен, востребованный международный бизнес-тренер, основатель самой крупной русскоязычной онлайн-школы для предпринимателей.Как удачно стартовать в бизнесе? На что следует о
Юра Ра – инвестор, владелец более 20 бизнесов, основатель ресторанов живой кухни Ra family, сети отелей и центров развития в России и за рубежом.Как сам себя называет Юра Ра, он – человек перемен. Его главная цель – развитие. В его центрах проходят различные ретриты и фестивали саморазвития и творчества. Он выучил 7 языков по своей авторской методике, пишет стихи, танцует бачату, рисует картины, практикует осознанные сновидения. И верит, что кажд
Эта книга – ваш первый шаг в сложный, но увлекательный инвестиционный мир. Юлия Кузнецова точно знает все о финансах и благосостоянии. Вы получите основные инструменты, которые помогут создать достойное будущее себе и своей семье.Не обязательно копить большие суммы для старта в инвестициях: начните с малого, прочитайте эту книгу и попробуйте потренировать навыки инвестора с минимальным риском, имея 10 000 или даже 5000 рублей. Вот увидите, вам по
Если вы считаете, что digital-маркетинг – это гораздо больше, чем «создание и раскрутка сайта», то эта книга для вас. С помощью нее вы сможете узнать о стратегическом планировании и принятии бизнес-решений, поймете, как использовать инновации, научитесь экспериментировать, измерять результат и корректировать тактику на основе результатов этих действий. А главное, вы начнете стабильно занимать лидирующие позиции на рынке.
Учебное пособие предназначено для студентов, изучающих в дисциплинах «Базы данных» и «Управление данными» языковые и программные средства создания баз данных и манипулирования данными. Рассматривается реляционная модель данных. Приводятся содержательные определения основных понятий из области проектирования реляционных баз данных. Язык SQL изучается на примере версии Access SQL (Microsoft Jet SQL), поскольку учебное пособие рассчитано на начинающ
Вести работу в бизнесе и в жизни быстрее с Access! Программа Access есть в любом доме. Её можно легко приобрести. Но не каждый может ею пользоваться и делает работу вручную. Microsoft Access применяется для автоматизации несчётного количества процессов в медицине, бухгалтерии, складских службах, МВД, бизнесе: туристическом, гостиничном, книжном, торговом, библиотечном, музыкальном. Освоив азы этой науки по предложенному изданию, вы сможете Создав
Как жить в мире, где информацию о тебе может получить кто угодно и когда угодно? Ведущий мировой эксперт по будущему Big Data Андреас Вайгенд знает ответ. Он разрабатывал стратегию данных таких крупных рыб, как Alibaba, Goldman Sachs, Lufthansa, Thomson Reuters. Работал руководителем по Big Data в компании Amazon, является Директором компании Social Data Lab, преподаёт в IT-школе Калифорнийского университета Беркли.Андреас уверен, что этот «дом с
Эта pdf-книга о том, как за счет имеющихся внутренних ресурсов обеспечивать рост онлайн-школ. Pdf-книга написана в поддержку программы РКС, о которой вы узнаете по ходу чтения.Далее, в процессе изложения своего видения взрывных системных стратегий, pdf-книгу я буду называть материалом. Для меня же самого и, надеюсь, для вас этот материал станет пособием с приставкой «ввод» в большую тему работы с базой.В формате PDF A4 сохранен издательский макет
Финансовый рынок – это информационные джунгли с постоянно возникающими опасностями, возможностями, заблуждениями и открытиями. Как увеличить шансы на выживание и получение прибыли? На какие методы анализа можно полагаться? Какие риски приемлемы? Какие стратегии вероятнее всего приведут к успеху?Книга Саймона Вайна, управляющего директора «Альфа-Банка», отвечает на эти вопросы и позволяет читателю сформировать индивидуальный стиль трейдинга. Автор
Ставки на спорт – это интеллектуальный поединок между букмекером и игроком. Кто выйдет победителем в долгосрочной перспективе, предсказать трудно. Здесь все зависит не столько от случая, сколько от хорошего знания матчасти обоими участниками.По мировым меркам букмекерский бизнес в России достаточно молод, однако за последние годы он не только сформировался, но и значительно вырос, обрел свое профессиональное лицо, деловую репутацию и экспертный с
В один прекрасный день Саймон обнаруживает, что может останавливать время. Все замирает – солнце, занавеска, раздуваемая ветром, люди на улице. Он ходит по улицам между неподвижных фигур и предметов, оживляя их прикосновением, но стоит ему убрать руку, и они вновь застывают.Мир Безвременья, странный, со своими законами, соблазнами и опасностями. Мир, в котором все дозволено, и только ему решать, где проходит граница добра и зла. И есть ли она воо
Жанром книги является концепция (понимание взаимосвязи человека и природы). Глобальной экологической проблемой является перенаселение планеты, которое ведет к истощению всевозможных природных ресурсов, голоду, нищете и т. д. В книге отмечены причины изменения климата, загрязнения окружающей среды, влияние химии на урожайность и способы борьбы с этими явлениями. В издании приводятся мероприятия и документы ООН по разным экологическим проблемам. Кн