Алексей Михнин - Реализация проекта машинного обучения от A до Я на примере приложения для обобщения текста

Название:	Реализация проекта машинного обучения от A до Я на примере приложения для обобщения текста
Автор:	Алексей Михнин
Жанры:	Программы \| Интернет \| Программирование
Серии:	Нет данных
ISBN:	Нет данных
Год:	2023

О чем книга "Реализация проекта машинного обучения от A до Я на примере приложения для обобщения текста"

Книга посвящена практической реализации проекта машинного обучения. Рассматривается весь жизненный цикл создания продукта на основе моделей машинного обучения, от формулировки бизнес-задачи до развертывания веб-приложения.Автор на конкретном кейсе демонстрирует процесс исследования проблемы, поиска алгоритмов, разработки и обучения AI моделей. Особое внимание уделяется вопросам проектирования кода и архитектуры, позволяющим создавать гибкие и масштабируемые системы искусственного интеллекта.Читатель получает ценные практические навыки по модульной разработке, тестированию, контейнеризации моделей и их интеграции через веб-интерфейсы. Книга содержит примеры кода и инструкции для создания собственных приложений машинного обучения.Это издание станет полезным как для начинающих, так и для опытных разработчиков в области искусственного интеллекта.

Бесплатно читать онлайн Реализация проекта машинного обучения от A до Я на примере приложения для обобщения текста

Введение

В эпоху стремительного развития технологий искусственного интеллекта всё больше компаний и разработчиков пытаются применить машинное обучение в своих продуктах и проектах. Однако зачастую процесс создания работающего продукта на основе моделей машинного обучения представляет собой «черный ящик» для новичков в этой сфере.

Эта книга ставит своей целью максимально подробно и пошагово рассказать о том, как создать полноценный проект в сфере искусственного интеллекта – от исследования идеи до готового веб-приложения с моделью машинного обучения. Мы возьмем за основу конкретный проект по текстовому обобщению (рафинированию) – это процесс создания более короткой версии длинного текста или диалога и увидим, как он был реализован от начала и до конца.

Эта книга станет настоящей «библией» для всех, кто хочет разобраться в прикладном применении машинного обучения и понять весь процесс от А до Я.

После ее прочтения вы получите бесценные знания о том, как подходить к разработке подобных проектов, что позволит вам:

Структурировать код проекта с использованием передовых практик

Организовать процесс исследования и поиска решения

Разрабатывать и обучать эффективные модели машинного обучения

Создавать тренировочные и прогнозирующие конвейеры

Развертывать модели в виде готовых веб-приложений

Автоматизировать процесс непрерывной интеграции и доставки моделей

Книга содержит реальный код, примеры и шаги по созданию проекта от начала до конца. Это позволит вам не только изучить, но и применить на практике паттерны и подходы разработки проектов в сфере ИИ.

После прочтения вы сможете использовать полученные знания как шаблон для создания собственных приложений и сервисов с машинным обучением.

Начало проекта по

Data

Science

Бизнес-постановка – основа любого коммерческого проекта по Data science

В 90% случаев коммерческие проекты по Data science начинаются с бизнес-постановки от заказчика. Это означает, что заказчик четко определяет, какую задачу необходимо решить с помощью данных.

Бизнес-постановка включает в себя следующие элементы:

Цель проекта. Что заказчик хочет достичь с помощью данных?

Задачи проекта. Какие шаги необходимо предпринять для достижения цели?

Данные. Какие данные необходимы для выполнения проекта?

Ожидаемые результаты. Что заказчик ожидает получить в результате проекта?

Дано:

Заказчик обратился с потребностью автоматически суммаризировать большие объемы текста, в особенности длинные диалоги. Основная цель состояла в том, чтобы пользователи могли быстро понять основное содержание предоставленного текста без необходимости читать его полностью. Это особенно актуально для быстрого анализа новостей, длинных документов или корпоративных диалогов.

Кроме того, заказчик предоставил специфические данные для обучения, чтобы модель лучше понимала и адаптировалась к уникальной специфике и структуре диалогов в компании заказчика.

Ожидание заказчика – Web API интерфейс для решения задач по суммаризации текста

Заказчик ожидает, что исполнитель предоставит Web API интерфейс для решения задач по суммаризации текста. Этот интерфейс должен соответствовать следующим требованиям:

Легкость использования. Интерфейс должен быть простым и понятным в использовании. Он должен быть доступен через стандартные методы HTTP, такие как POST, GET и PUT.

Производительность. Интерфейс должен быть производительным. Он должен обеспечивать быстрое и эффективное выполнение запросов.

Надежность. Интерфейс должен быть надежным. Он должен поддерживать высокую доступность и отказоустойчивость.

Цели заказчика:

Эффективность:

Сократить время, затрачиваемое на анализ и понимание больших объемов текста, предоставляя краткие и точные резюме.

Адаптация к специфике:

Улучшить качество и точность суммаризации, адаптируя модель к уникальным особенностям и структуре диалогов в компании заказчика.

Интеграция:

Возможность легко интегрировать решение в существующие корпоративные системы для автоматизации процесса суммаризации.

Улучшение взаимодействия:

Помочь сотрудникам быстрее и эффективнее взаимодействовать с информацией, улучшая таким образом коммуникации и принятие решений в компании.

Данные:

Для наглядности обсуждения примем ситуацию, где заказчик предоставил, среди прочего, размеченный датасет для дополнительного обучения нашей предстоящей модели.

В целях демонстрации, мы взяли обучающий датасет с платформы Hugging Face. После получения всей необходимой информации от заказчика, включая данные, исполнитель переходит к этапу прототипирования решения. Если прототип удовлетворяет требованиям заказчика, следуют действия по внедрению решения в рабочую среду. Данный процесс будет описан в деталях в нашей книге.

Прототип решения задачи по обобщению текста

Предположим, что исполнитель успешно справился с реализацией представленной бизнес-постановки. В качестве результата работы он предоставил прототип решения задачи по обобщению текста в формате Jupyter Notebook. (см. Приложение №1)

Основные этапы работы, представленные в файле Jupyter Notebook:

Подготовка рабочей среды:

Установка всех необходимых библиотек и пакетов, проверка доступности графического процессора для ускоренных вычислений.

Загрузка данных:

Импорт предоставленных заказчиком данных и их предварительная обработка.

Выбор и загрузка модели:

Выбрана модель PEGASUS из библиотеки Hugging Face's Transformers для задачи обобщения.

Дообучение модели:

Используя предоставленные заказчиком данные, произведено дообучение модели для лучшей адаптации к специфике диалогов заказчика.

Оценка качества:

Проведена валидация и оценка качества модели на отложенной выборке.

Демонстрация работы:

Представлены примеры обобщения различных текстов с использованием обученной модели.

Этот Jupyter Notebook служит как детальное руководство по реализации решения, так и демонстрацией его эффективности.

Приложение №1 Прототип по обобщению текста в формате Jupyter Notebook

Пошаговая инструкция по запуску в реализацию проекта

По итогам предоставления прототипа заказчиком принято решение о запуске данного решения в продакшен.

Это открывает новый этап работы для исполнителя.

Модульное кодирование:

Необходимо структурировать код из Jupyter Notebook, разделив его на модули и функции, что облегчит последующую интеграцию, тестирование и поддержку решения.

Создание Web-API интерфейса:

Разработка пользовательского интерфейса, который позволит конечным пользователям легко и удобно использовать решение для обобщения текстов.

Контейнеризация:

Все компоненты решения, включая зависимости, модель и интерфейс, необходимо упаковать в Docker-контейнер. Это обеспечит портативность, масштабируемость и надежность при развертывании решения.

Следующая страница

С этой книгой читают

Оценка качества моделей машинного обучения: выбор, интерпретация и применение метрик

Алексей Михнин

В данной книге рассматриваются метрики качества моделей машинного обучения, обеспечивая понимание их выбора, интерпретации и применения. Описываются различные метрики, их особенности и применение в задачах машинного обучения. Книга содержит практические примеры использования метрик для наглядности. Она будет полезна специалистам в области машинного обучения, бизнес-аналитикам и новичкам, желающим освоить оценку качества моделей и принимать обосно

Читать

ChatGPT для саморазвития: Освоения программирования, консалтинга и изучения иностранных языков

Алексей Михнин

Эта книга посвящена возможностям использования чат-бота ChatGPT для самообразования и повышения производительности в различных областях. В ней подробно рассматриваются примеры применения чат-бота для изучения программирования на Python, ABAP. Для консультирования в сфере SAP ERP, для создания макросов в Excel, а также для изучения английского языка.Книга демонстрирует пошаговые примеры обучения чата выполнению конкретных задач, анализирует качест

Читать

Умный бизнес с ChatGPT. Инновационные подходы для оптимизации работы и роста производительности

Алексей Михнин

В наше время бизнес-процессы становятся все более сложными и разнообразными, и для создания эффективной бизнес-стратегии необходимы надежные инструменты. Книга предлагает пошаговую инструкцию по использованию ChatGPT – мощного инструмента искусственного интеллекта, который может применяться в разных сферах бизнеса.В ней читатели найдут подробные инструкции по применению ChatGPT в качестве помощника по созданию бизнес-постановки, шаблона методики,

Читать

Табличное мастерство. Осваиваем модели машинного обучения для анализа табличных данных

Алексей Михнин

Машинное обучение становится ключевым фактором успеха в повседневной жизни, бизнесе и науке. Эта книга – комплексное руководство по анализу табличных данных с помощью машинного обучения. Она полезна для бизнеса, руководителей проектов и всех, кто интересуется данной темой. Книга рассматривает классические алгоритмы, ансамблирование, AutoML и нейронные сети. Охватывает предобработку данных, отбор признаков, разработку и валидацию моделей, внедрени

Читать

200 лучших программ для Интернета. Популярный самоучитель

И. Краинский

Если вам наскучило работать в Интернете только с помощью Internet Explorer и забирать почту, только используя Outlook Express, если вы хотите узнать, какие еще программы, кроме ICQ, помогают общаться в Сети, если вы чувствуете, что для работы в Интернете вам еще что-то нужно, но не знаете что, то вам стоит заглянуть в эту книгу. Здесь рассмотрены самые разные программы, помогающие выполнять различные задачи в Интернете: альтернативные браузеры и

Читать

ArCon. Дизайн интерьеров и архитектурное моделирование для всех

Максим Кидрук

В книге рассказывается об известной немецкой разработке – программе ArCon, предназначенной для быстрого моделирования жилых зданий и оформления их интерьера и экстерьера. Программа достаточно проста в использовании, не требует практически никаких навыков трехмерного моделирования, однако позволяет создавать дизайнерские проекты, которые почти ничем не уступают разработанным в 3ds Max или Maya.Книга содержит подробное описание функционала последне

Читать

Выжить в цифровом мире. Иллюстрированные советы от «Лаборатории Касперского»

Михаил Дьяков Эльдар Кудинов

Расцвет цифрового мира оказался не совсем таким, как мы ожидали. Персональные компьютеры и мобильные устройства подарили людям доступ к знаниям и новые возможности для обмена ими, жизнь стала проще и лучше благодаря новым технологиям, в первую очередь Всемирной паутине. Но очень скоро выяснилось, что у медали есть и обратная сторона: появились первые случаи кражи личной информации, цифровые вредоносные программы научились наносить реальный ущерб,

Читать

Как устроен ChatGPT? Полное погружение в принципы работы и спектр возможностей самой известной нейросети в мире. Стивен Вольфрам. Саммари

Smart Reading

Это саммари – сокращенная версия книги «Как устроен ChatGPT? Полное погружение в принципы работы и спектр возможностей самой известной нейросети в мире» Стивена Вольфрама. Только самые ценные мысли, идеи, кейсы, примеры.ChatGPT умеет генерировать читабельный текст, анализируя миллионы аналогичных текстов. Стивен Вольфрам поясняет, как работает чат-бот, и предлагает научить его не просто имитировать результат человеческого мышления, но мыслить сам

Читать

Лахесис

Максим Мальцев

Трагедия маленького человека заключается в его неукоснительной вере в судьбу и то, что каждое несчастье – предначертано.Безымянный герой этой короткой и яркой истории с самого детства позволял себя унижать. Ему казалось это нормой, чем-то предопределённым. Но маленькие люди имеют свойство превращаться в больших чудовищ, чьи судьбы кончаются трагедиями и безумием… Книга содержит нецензурную брань.

Читать

Пламя надежды. Часть 1. Забытое королевство

Павел Дробницкий

Далёкое королевство потрясла невероятная весть – маги решили свергнуть короля и захватить власть. Простой крестьянин Артур вместе с другими новобранцами вынужден отправиться в самое пекло разгорающейся войны, даже не осознавая, что ему суждено сыграть не самую последнюю роль в грядущих событиях.

Читать

Волчье логово божьих коровок

Маргарита Южина

Если тебе изрядно за…, если твоя фигура напоминает колбаску «Вязанка», если у тебя имеется законный муж, то это совсем не беда, и все это совсем не мешает влюбиться в прекрасного молодого и горячего мачо. Ну, а что делать, если он первый в тебя влюбился? Именно так считала Дездемона Карповна и даже позволила себе испытать некое греховное чувство, пока ей не открылась страшная тайна…

Читать

Академия Злого Колдовства

Светлана Белоусова

Когда приходит незнакомец и сообщает, будто ты родилась в ином мире, в мире, полном сказок и волшебства, хочется протереть глаза, чтоб убедиться, не сон ли это. Оказалось, не сон. Я – злая колдунья в десятом поколении. Пришло время вернуться домой и там, в специальной Академии, научиться настоящему Злу. Но я даже догадаться не могла, что меня ждёт впереди. Золушка, Белоснежка, Рапунцель, которые вовсе не так хороши, как в старых сказках. Прекрасн

Читать