Евгений Штольц - Машинное обучение на практике – от модели PyTorch до Kubeflow в облаке для BigData

Название:	Машинное обучение на практике – от модели PyTorch до Kubeflow в облаке для BigData
Автор:	Евгений Штольц
Жанры:	Программы \| Программирование \| Научно-популярная литература
Серии:	Нет данных
ISBN:	Нет данных
Год:	2021

О чем книга "Машинное обучение на практике – от модели PyTorch до Kubeflow в облаке для BigData"

В этой книге Главный Архитектор Департамента Архитектуры Управления Технической Архитектуры (Центра Облачных Компетенций Cloud Native и Корпоративного университета архитекторов) и архитектор решения Сбербанка делится знаниями и опытом с читателей в области ML, полученных в работе Школе архитекторов. Автор:

* проводит читателя через процесс создания, обучения и развития нейронной сети, показывая детально на примерах

* повышает кругозор, показывая, какое она может занимать место в BigData с точки зрения Архитектора

* знакомит с реальными моделями в продуктовой среде

Бесплатно читать онлайн Машинное обучение на практике – от модели PyTorch до Kubeflow в облаке для BigData

О книге

Книга построена как учебник – от простого к сложному. Читатель сможет:

* в первых трёх главах создать простейшую нейронную сеть распознавания и классификации изображений,

* в последующих – углубиться в устройство и архитектуру для оптимизации,

* далее расширить понимание экосистемы как компании в целом, в которой работают нейронные сети, как её составная часть, способы ее взаимодействия с окружающими технологиями и их использование,

* закончить изучение развёртыванием полномасштабной производственной системы в облаке полного цикла.

Фактически каждая глава в начале даёт общую информацию, необходимую для последующей практической части. В практической части:

* демонстрируется процесс подготовки окружения, но чаще используются бесплатные готовые облачные сервисы,

* демонстрируется процесс написания совместно с разбором написанного и обзором альтернативных решений,

* проводится анализ результата и формирование способов дальнейшего развития.

Книга состоит из разделов:

* Введение в Машинное обучение. Это единственная глава без практической части, созданная для того, чтобы дать начальное представление о границах применимости машинного обучения, преимуществах перед другими методами и об общем устройстве нейронных сетей для начинающих. Также производится классификация нейронных сетей по принципам, заложенных в них, и разделение на группы, о которых будет говориться в книге.

* Основы для написания сетей. Здесь даются базовые знания, необходимые для написания первой сети на PyTorch, знакомство со средой разработки Jupyter в облачном сервисе Google Colab, которая является упрощенным вариантом облачной платформы Google ML, запуск кода в нём и использование фреймворка на написания нейронных сетей PyTorch.

* Создаём первую сеть. Автор демонстрирует для практики читателя создание простой нейронной сети на PyTorch в Colab с детальным разбором написанного кода, обучение её на DataSet изображений MNIST и запуском.

* Улучшаем распознавание нейросети на сложных изображениях. Здесь автор для читателя демонстрирует на практике обучение нейронным сетям для цветных картинок, методы повышения качества предсказаний сети. Детально разбирается устройство, подводные камни при написании и обучении эффективных нейронных сетей.

* Современные архитектуры нейронных сетей. Приводятся архитектурные принципы, используемые в современных нейронных сетях для повышения качества предсказаний. Приводится разбор различных архитектур нейронных сетей, сделавших прорыв в качестве обучения и принёсших новые подходы. Рассматриваются различные архитектурные универсальные паттерны увеличения качества, такие как создание ансамблей нейронных сетей.

* Использование предобученных сетей. Демонстрируется использование в своих сетях уже обученных слоёв.

* Масштабирование ML. Приводятся примеры подготовки окружения для запуска их в облачной инфраструктуре.

* Получение данных от BigData. Рассказывается, как можно из Jupyter подключаться к различным источникам данных, в том числе BigData, для обучения моделей.

* Подготовка больших данных. В этом разделе описываются BigData технологии, такие как Hadoop и Spark, которые являются источниками данных для обучения моделей.

* ML в промышленной среде. В этом разделе рассказываются о таких системах, как Kubeflow и MLflow. Читатель может попробовать развернуть платформу, настроить процесс обучения и запустить в облачной среде модель, как это делается в компаниях.

Об авторе. Автор является корпоративным (главным) архитектором крупного подразделения (трайба) компании Сбер. Сбер лидер по объёмам накопленных данных в России и обладатель вычислительного центра для обучения моделей Кристофари, занимающей 39 место в ТОП500 мира и самый мощный в России и СНГ (первое место в ТОП50 СНГ), в нём разработано более 5000 моделей более тысячью DataSience учёных. Автор проходил обучение (Sber AI Architect, Sber Certified Architect) в Сбер в области искусственного интеллекта, создавал внутренние курсы по этой тематике для других архитекторов, разрабатывал предиктивную аналитику на машинном обучении в нейронных сетях для универсальных облачных систем, участвовал в качестве ментора (команда заняла 2 место среди всех команд Сбер) и оценщиком на соревнованиях Сбер.

Введение в машинное обучение

Искусственный интеллект (Artificial Intelligence, AI) – это область науки, созданная на стыке многих академических наук. Терми бы введён в 1956 году, в эпоху попыток эмитировать работу человеческого мозга. Один из способов его достижения – машинное обучение (Machine Learning). Дисциплина машинное обучение (ML) строится на трёх составляющих: данных (разнородные данные), алгоритмах и признаках. Другие, смежные дисциплины, строятся на двух сущностях. Так, классическое программирование строится на алгоритмах, применяемых к конкретным признакам, Data Scienes – на данных и получаемых из них фичах, Data Mining – на обработке алгоритмах и данных. ML с помощью алгоритмов и фич предоставляет новые данных. Так, как ML использует фичи, которые подаются как основа для обучения, то он использует результаты Data Scienes. Для разработки самих сетей используются языки программирования.

Когда мы подаём нейронные сети данных, на их основе происходит обучение нахождению решений и выявление закономерностей и данных, ранее которых не было. Для обучения могут использоваться статистические алгоритмы, например, на языке R, поиск в глубину на языке Prolog или поиск в ширину на Refal, а также подстраивающиеся структуры – нейронные сети. Нейронные сети, в зависимости от задач, строятся по разным принципам, имеют структуру и по–разному обучаются. В последнее время наибольший прорыв получили нейронные сети представления данных (Representation learning), занимающиеся выявлением в информации закономерностей, так как саму информацию из–за её размеров они не могут запомнить. Большой эффект дают глубокие нейронные сети, имеющие множество уровней признаков, признаки на последующих уровнях строятся на основании признаков с предыдущих уровней, о них и пойдёт речь в этой главе.

Под Machine Learning (ML) понимается адаптация преобразования входных данных в выходные данные в зависимости от истории решений. Такой класс задач решается или алгоритмическим способом, или с помощью нейронных сетей. О том, где какое решение и в какой ситуации лучше применять далее и пойдёт речь. Для практического примера мы возьмём классификацию изображений с помощью обучения глубокой нейронной сети с учителем. Посмотрим её местоположение в классификации.

Типы построения:

* Классическое обучение (экспертное);

* Нейронные сети.

Следующая страница

С этой книгой читают

Excel. Трюки и эффекты

Алексей Анатольевич Гладкий Александр Анатольевич Чиртик

Данная книга предназначена для пользователей Microsoft Excel и содержит описание приемов и методов работы, которые из-за своей специфичности недостаточно представлены (либо вообще не представлены) в пользовательской, справочной и иной соответствующей документации. Изучение приведенных в книге примеров позволит читателю открыть для себя не известные ранее возможности Excel. Предлагаемый материал легко усваивается благодаря тому, что излагается дос

Читать

Секреты компьютерного дизайна

Сергей Погорелый

Вы хотите попробовать свои силы в компьютерной графике и создать в растровом редакторе Photoshop красивый монтаж? У вас есть все составляющие для собственной работы, но ничего не получается? Не унывайте! Эта книга даст вам шанс и поможет научиться создавать удивительные изображения.Автор, известный специалист в области фотомонтажа и компьютерного дизайна, в легкой и доступной форме познакомит вас с историей появления и становления фотомонтажа как

Читать

GraphRAG в когнитивном программировании корпоративного сознания – внедряем Neo4j и Cypher

Лэй Энстазия

Эта книга – руководство по использованию графовых технологий и когнитивного программирования в корпоративной среде. Она охватывает эволюцию графовых баз данных, принципы работы Neo4j и языка запросов Cypher, а также концепцию GraphRAG – инновационного подхода к обработке знаний на основе графов. Читатель познакомится с основами моделирования корпоративного сознания, интеграцией когнитивных методов с графовыми структурами и их влиянием на бизнес-р

Читать

Тестируй, а не гадай: Как проводить А/В-тесты правильно

Артем Демиденко

Хотите принимать решения на основе данных, а не интуиции? Книга «Тестируй, а не гадай: Как проводить А/В-тесты правильно» станет вашим надёжным гидом в мире экспериментов! Вы узнаете, как превращать гипотезы в точные данные, избегать распространённых ошибок и грамотно интерпретировать результаты. Автор шаг за шагом объясняет принципы планирования и проведения А/В-тестов, раскрывает секреты успешного анализа и помогает найти правильные метрики для

Читать

Зима мира

Кен Фоллетт

Действие романа относится к первой половине ХХ века и охватывает события, происходившие в канун Второй мировой войны, а также военное и послевоенное время.Главные его герои – интеллектуалы и рабочие, аристократы, военные и политики России, Германии, Англии и США, чьи судьбы переплелись в затейливый и непредсказуемый узор. На их глазах рушится мир, к власти в Европе приходит Гитлер, ввергший континенты в войну, а их жизни вмещают в себя и эпохальн

Читать

Обретение настоящего

Елена Семёнова

Героями вошедших в книгу рассказов стали самые разные люди: актёры и художники, врачи и учителя, сельские жители – люди, объединённые одним – живыми сердцами и “живыми глазами”, как говорит персонаж одной из повестей. В нашем холодеющем, суетном мире, во вселенском сиротстве обезбоженного человечества каждое такое сердце – на вес золота. И хотя живым, горящим сердцам часто всего труднее приходится выживать “с этой безмерностью в мире мер” (М. Цве

Читать

Предатель. Рассказы

Александр Карасёв

Это очень профессиональная проза. С наблюдательностью, с точным воспроизведением речи, с мастерским выстраиванием диалогов, с благородным лаконизмом языка, с сильными сквозными образами, с «боковой подачей» темы (когда самое главное происходит не на первом плане, а где-то сзади – как в фильмах Алексея Германа). Профессионализм стал довольно редким явлением в современной литературе – так что от души радуешься самому факту наличия профессионализма.

Читать

Чеченские рассказы

Александр Карасёв

Александр Карасёв родился в 1971 году в Краснодаре. Окончил истфак и юрфак КубГУ. В звании лейтенанта командовал взводом внутренних войск на чеченской войне. Известность писателю принесла книга «Чеченские рассказы», ставшая открытием года Бунинской премии (2008).Эта книга о том, как вживается, втягивается в войну нормальный человек, как война становится его жизнью, становится очень быстро и незаметно для него самого. Книга содержит нецензурную бр

Читать