Стивен Вольфрам - Как устроен ChatGPT? Полное погружение в принципы работы и спектр возможностей самой известной нейросети в мире

Название:	Как устроен ChatGPT? Полное погружение в принципы работы и спектр возможностей самой известной нейросети в мире
Автор:	Стивен Вольфрам
Жанры:	Программы \| Интернет \| Зарубежная компьютерная литература \| Научпоп: прочее
Серия:	Цифровые технологии
ISBN:	Нет данных
Год:	2024

Другие книги серии "Цифровые технологии"

Устойчивы к будущему. 9 правил для людей в эпоху машин
Управляя компаниями будущего. Мышление полного спектра для развития бизнеса
Как устроен ChatGPT? Полное погружение в принципы работы и спектр возможностей самой известной нейросети в мире

О чем книга "Как устроен ChatGPT? Полное погружение в принципы работы и спектр возможностей самой известной нейросети в мире"

Никто этого не ожидал – даже его создатели: ChatGPT ворвался в наш мир как искусственный интеллект, способный создавать тексты, словно человек. Но как именно он работает? Что происходит внутри его «ИИ-разума»?

В этой книге выдающийся ученый и пионер вычислительной техники Стивен Вольфрам предлагает понятное и увлекательное объяснение устройства нейросети, основываясь на своем многолетнем научном опыте.

Узнайте, как ChatGPT, объединяя новейшие технологии нейронных сетей с фундаментальными знаниями о языке и человеческом мышлении, делает будущее настоящим.

Для кого книга

Если вы хотите не просто пользоваться нейросетями, а понимать, на что они способны и как именно работают, эта книга для вас.

Бесплатно читать онлайн Как устроен ChatGPT? Полное погружение в принципы работы и спектр возможностей самой известной нейросети в мире

Научный редактор Здоров Антон

На русском языке публикуется впервые

Никакая часть данной книги не может быть воспроизведена в какой бы то ни было форме без письменного разрешения владельцев авторских прав.

What Is ChatGPT Doing … and Why Does It Work?

Original English language edition published by Wolfram Media 100 Trade Center Dr. 6th Floor, Champaign Illinois 61820, USA.

* * *

Предисловие

Эта небольшая книга представляет собой попытку объяснить, как работает ChatGPT. В некотором смысле это история о технологиях. Но еще и разговор о науке и философии. И для того, чтобы рассказать эту историю, нам придется собрать воедино огромный спектр идей и открытий, сделанных на протяжении многих столетий.

Я сам с большим интересом и волнением наблюдаю, как вещи, которые так долго меня интересовали, объединяются в результате такого прогресса. Сложное поведение простых программ, погружение в суть языка и смыслообразования, а также практические возможности больших компьютерных систем – все это является частью истории ChatGPT.

ChatGPT основан на концепции нейронных сетей, составленной в 1940-х годах в качестве модели работы головного мозга. Я сам впервые спрограммировал нейронную сеть в 1983 году, но тогда ничего интересного из нее не вышло. Однако 40 лет спустя, когда у нас есть компьютеры, считающие в миллион раз быстрее, миллиарды страниц текста в интернете и целый ряд инженерных инноваций, ситуация совершенно иная. И, ко всеобщему удивлению, современная нейронная сеть, которая в миллиард раз больше созданной мной в 1983 году, способна делать то, что раньше считалось под силу только человеку, – генерировать осмысленный текст.

Эта книга, написанная вскоре после дебюта ChatGPT, состоит из двух частей. В первой объясняется, что такое ChatGPT и как ему удается выполнять сугубо человеческую работу по генерированию текста. Вторая посвящена вычислительным инструментам ChatGPT (выходящим за рамки человеческих возможностей) и сверхспособностям нашей системы Wolfram|Alpha в области вычисляемых знаний.

На момент написания книги прошло всего три месяца с запуска ChatGPT, и мы только начинаем понимать последствия этого события – как практические, так и интеллектуальные. Но пока ChatGPT служит напоминанием о том, что, несмотря на множество уже сделанных изобретений и открытий, сюрпризы всё еще возможны.

Стивен Вольфрам, 28 февраля 2023 года

Что делает ChatGPT и почему это работает?

Он просто добавляет по одному слову за раз

Тот факт, что ChatGPT может автоматически генерировать текст, который выглядит так, словно написан человеком, поражает наше воображение. Большинство людей недоумевают, как чат-бот выполняет интеллектуальную работу, которая прежде считалась доступной исключительно человеку. Как он это делает? Моя цель – дать вам хотя бы общее представление о том, что происходит внутри ChatGPT, а затем исследовать, как ему удается так хорошо создавать то, что выглядит как осмысленный текст. Хочу сразу сказать, что я собираюсь сосредоточиться на общих принципах работы ChatGPT и, хотя буду упоминать некоторые технические детали, не стану в них углубляться. (Все, о чем я буду говорить, применимо и к другим большим языковым моделям, подобным ChatGPT.)

Первое, что нужно объяснить, – ChatGPT всегда пытается создать «разумное продолжение» любого текста, который у него есть на данный момент. Под словами «разумное продолжение» мы подразумеваем «то, что можно ожидать, исходя из того, что люди уже написали на миллиардах веб-страниц».

Итак, давайте предположим, что у нас есть предложение «Самое лучшее в ИИ – это его способность…». Представьте, что вы прочитываете миллиарды страниц текста, написанных людьми (скажем, веб-страницы в интернете и оцифрованные книги), и находите все аналогичные предложения, а затем смотрите, какое слово чаще всего встречается в них на месте многоточия. ChatGPT делает что-то подобное, за исключением того, что (как я объясню позже) он не просматривает тексты буквально – он ищет фрагменты, которые «совпадают по смыслу». Результатом его работы является список слов, которые логически могут следовать за основным словом, ранжированных по степени вероятности их присутствия в этом предложении:

Самое лучшее в ИИ – это его способность…

(англ. The best thing about AI is its ability to…)

…учиться (англ. learn) – 4,5 %

…предсказывать (англ. predict) – 3,5 %

…создавать (англ. make) – 3,2 %

…понимать (англ. understand) – 3,1 %

…делать (англ. do) – 2,9 %

Примечательно, что, когда ChatGPT пытается написать эссе, по сути он просто снова и снова спрашивает: «Учитывая текст на данный момент, каким должно быть следующее слово?» – и каждый раз добавляет это новое слово. (Точнее, он добавляет так называемый токен, который может быть и частью слова; именно поэтому ChatGPT иногда может «составлять новые слова». Но об этом позже.)

Итак, на каждом этапе ChatGPT создает список слов с указанием вероятности их присутствия на данном месте. Но какое из них нужно выбрать, например, для эссе? Можно предположить, что это должно быть слово с самым высоким рейтингом (то есть то, для которого определена самая высокая вероятность). Однако именно здесь ChatGPT начинает проявлять свои вуду-способности. Потому что по какой-то причине (возможно, однажды мы ее даже узнаем), если всегда будем выбирать слово с самым высоким рейтингом, мы получим очень гладенькое эссе без малейшего признака креативности (и которое будет слово в слово повторять множество других текстов). Но если мы наугад выбираем слова с более низким рейтингом, то эссе получается «более интересное».

Здесь действует фактор случайности, а это значит, что, даже используя каждый раз один и тот же промпт[1], мы, скорее всего, получим разные эссе. И, как мы уже упоминали, у ChatGPT есть своя вуду-идея, то есть у него существует так называемый температурный параметр, который определяет, как будут использоваться слова с более низким рейтингом, и для создания эссе, оказывается, лучше всего подходит температура, равная 0,8. (Нужно подчеркнуть, что это никакая не теория – это просто вывод из того, что работает на практике. И например, понятие «температура» применяется потому, что здесь используются экспоненциальные распределения, знакомые нам из статистической физики, но нет никакой физической связи – по крайней мере насколько нам известно.)

Прежде чем мы продолжим, я должен объяснить, что ради простоты изложения не стану рассматривать всю систему, лежащую в основе ChatGPT. Вместо этого буду работать с более простой системой – GPT-2, которую можно запустить на обычном персональном компьютере. И поэтому практически для всего, что вам здесь покажу, я включу код на языке Wolfram, который вы сможете немедленно запустить на своем компьютере.

Следующая страница

С этой книгой читают

Устойчивы к будущему. 9 правил для людей в эпоху машин

Кевин Руз

9 правил, чтобы преуспеть в эпоху искусственного интеллекта и автоматизации.Машины уже здесь. Искусственный интеллект вышел далеко за пределы научных лабораторий и Кремниевой долины. Алгоритмы влияют на все вокруг, и пока мы обсуждаем, уничтожит ли автоматизация рабочие места, более важный вопрос остается за кадром: что значит быть человеком в мире, который все больше формируется машинами и для машин?Технологический колумнист New York Times Кевин

Читать

Управляя компаниями будущего. Мышление полного спектра для развития бизнеса

Боб Йохансен

Ведущий мировой футуролог Боб Йохансен на основе исследований Института будущего показывает, как новый образ мышления позволит руководителям видеть и использовать возможности для развития бизнеса.Мышление полного спектра – это способность искать закономерности, выходя за рамки стереотипов. Мир быстро меняется, а в течение следующих 10 лет действительность изменится еще сильнее.Основные тенденции заключаются в том, что:– от экономики продукта мы п

Читать

200 лучших программ для Интернета. Популярный самоучитель

И. Краинский

Если вам наскучило работать в Интернете только с помощью Internet Explorer и забирать почту, только используя Outlook Express, если вы хотите узнать, какие еще программы, кроме ICQ, помогают общаться в Сети, если вы чувствуете, что для работы в Интернете вам еще что-то нужно, но не знаете что, то вам стоит заглянуть в эту книгу. Здесь рассмотрены самые разные программы, помогающие выполнять различные задачи в Интернете: альтернативные браузеры и

Читать

ArCon. Дизайн интерьеров и архитектурное моделирование для всех

Максим Кидрук

В книге рассказывается об известной немецкой разработке – программе ArCon, предназначенной для быстрого моделирования жилых зданий и оформления их интерьера и экстерьера. Программа достаточно проста в использовании, не требует практически никаких навыков трехмерного моделирования, однако позволяет создавать дизайнерские проекты, которые почти ничем не уступают разработанным в 3ds Max или Maya.Книга содержит подробное описание функционала последне

Читать

Проектирование, дизайн, строительство: самые полезные программы

Андрей Орлов

Эта книга – комплексное издание для всех специалистов, связанных со строительством. В ней описаны программы по дизайну интерьеров, ландшафтному дизайну, различные САПР, необходимые при строительстве и проектировании, программы для составления строительных смет и масса другого полезного программного обеспечения. Именно комплексный подход является уникальной особенностью, которая и выделяет данную книгу из множества подобных, присутствующих на рын

Читать

Как устроен ChatGPT? Полное погружение в принципы работы и спектр возможностей самой известной нейросети в мире. Стивен Вольфрам. Саммари

Smart Reading

Это саммари – сокращенная версия книги «Как устроен ChatGPT? Полное погружение в принципы работы и спектр возможностей самой известной нейросети в мире» Стивена Вольфрама. Только самые ценные мысли, идеи, кейсы, примеры.ChatGPT умеет генерировать читабельный текст, анализируя миллионы аналогичных текстов. Стивен Вольфрам поясняет, как работает чат-бот, и предлагает научить его не просто имитировать результат человеческого мышления, но мыслить сам

Читать

Осокин. Том 1

Вячеслав Григорюк

15 лет назад убили брата Осокина. Обидчики избежали наказания. И никаких доказательств, улик, только липовые показания несуществующих свидетелей. Наркоман, что не имеет никакого отношения к этому делу, но почему-то отсидел за убийство. И как связаны труп девушки, что обнаружили в коттедже бизнесмена Федоркова, записка о самоубийстве, рок-концерт в клубе «Факел», загаженная карета «скорой помощи» и смерть Максима Осокина.Лейтенант Данил Осокин и к

Читать

Фактчекинг. Чеховы. Изнанка мифа

Л. Сержевская

Главные чеховские мифотворцы, братья Александр и Михаил Чеховы, постарались на славу. Но, несмотря на то, что их рассказы отдают явным душком вранья, биографы писателя охотно тиражировали эти воспоминания, умалчивая об изнанке мифов.

Читать

Живая программа

Анна Висягина

В мире, где жизнь идет своим чередом,школа,работа,друзья встречаются два существа, которые не должны были пересечься. Она – обычная девочка-подросток, переживающая свои страхи и надежды в опустевшем для нее мире. Он – робот, созданный для служения человечеству, но познавший нечто большее, чем просто выполнение программ. Вопреки всему, между ними рождается нечто, что выходит за рамки привычного мира – чувство, которому нет места ни в алгоритмах, н

Читать

Ведьма и Жак

Aleksandr Petrov

Ведьма похищает маленького мальчика и сначала делает из него слугу, выполняющего самую грязную и тяжелую работу по дому, а потом, оседлав, заставляет нести себя через лес до дома своей сестры

Читать