Если вы регулярно пользуетесь социальными сетями, вы волей или неволей становитесь свидетелем трендов — о них говорит контент, который создают ваши друзья. Трудно не обратить внимание, если все подряд начинают публиковать однотипные картинки, оформлять аватары в стилистике аниме или ставить фоном профиля космические пейзажи. За любым из подобных моментов стоит всплеск популярности какой-либо нейросети. Не успел схлынуть бум восторгов по поводу возможностей нейросети Midjourney, генерирующей по запросу изображения, как его сменил взрывной интерес к сервису ChatGPT, который способен вести диалог, находить по запросу информацию в разных областях и формировать тексты в разных стилях — даже писать программные коды. Генерация занимает считанные секунды, при этом результат выглядит как продукт деятельности весьма квалифицированного человека. У тех, кто впервые сталкивается с ChatGPT, результаты взаимодействия с ним вызывают неподдельное восхищение: неужели это возможно? Однако потом вполне естественно возникает вопрос: если машина научилась за мгновения выполнять работу, которую человек учится делать несколько лет, что нас ждет дальше? И что ждет дальше этих людей, уже потративших на учебу несколько лет?
Революция, которую мы проспали
Когда в 40-х годах XX века американские ученые Уоррен Мак-Каллок и Уильям Питтс соотнесли работу нервных клеток с булевой алгеброй и описали математическую модель функционирования головного мозга, они были движимы идеями исследования человека, а не создания искусственного разума. Несколькими годами позже канадский нейропсихолог Дональд Хебб сформулировал принцип «если нервная клетка А находится близко к клетке Б и регулярно возбуждает клетку Б, со временем клетке А удается возбудить клетку Б легче и быстрее». Этот принцип впоследствии назвали хеббовским обучением. Ученые вряд ли подозревали, что совместными усилиями явили миру руководство по созданию голема — искусственных нейронных сетей, которые благодаря принципу Хебба стало возможно еще и обучать
Желающих дать жизнь голему оказалось немало. В течение следующих десятилетий было реализовано несколько успешных проектов, в том числе SNARC — первая полностью электронная обучаемая система, ищущая выход из лабиринта и запоминающая путь, чтобы в следующий раз отправиться кратчайшей дорогой. Однако настоящим прорывом стало детище американского психолога Фрэнка Розенблатта. Он построил воспринимающий и распознающий автомат, способный считывать и различать отдельные геометрические фигуры и буквы алфавита на изображениях. Это был перцептрон — прообраз современных обучаемых нейросетей.
Перцептрон наделал много шума не только в научных кругах, но и среди широкой общественности; примерно тогда же и появился термин «искусственный интеллект». Однако вскоре выявились существенные ограничения в применении машины, и интерес к нейросетям заметно снизился. Краткий всплеск произошел в 1980-х годах, когда были придуманы новые модели и для их реализации уже появились мощные компьютеры, но все ограничилось машинами, которые использовались для исследований и отдельных ярких проектов — многие помнят, как компьютер (а на деле нейросеть) начал постепенно обыгрывать в шахматы чемпионов.
По прогнозам, глобальный рынок нейросетей достигнет уровня 31,71 млрд долларов. В 2021 году объем рынка нейросетей составил 10,96 млрд долларов. Ежегодный рост в 2022–2028 годах прогнозируется на уровне 15,9%.
И только в XXI веке — о чудо! — появились гигантские по объему базы изображений, звуков и текстов, и на них стало удобно тренировать искусственный мозг, функциональные возможности которого тоже значительно выросли. В результате голем вырвался из лаборатории и пришел к нам. К каждому из нас. Теперь создать тот самый перцептрон, а затем и натренировать его может любой человек с базовыми навыками программиста.
Добрый друг или волк в овечьей шкуре?
Хайп вокруг новых генеративных нейросетей неслучаен: они стали доступны любому пользователю, в то время как их функционал заметно превышает потребности обычного человека. Возможности таких сетей, как Midjourney и ChatGPT, вызывают удивление — однако удивляться нужно было в течение всего минувшего десятилетия. Даже человек, далекий от высоких технологий, постоянно сталкивается с работой нейросетей, не всегда обращая на это внимание.
Забивая в поисковике запрос, вы получаете выборку результатов, которые сочла релевантной машина. Задавая в навигаторе точку назначения, вы даете команду машине разработать для вас оптимальный маршрут. Пользуясь системами голосового управления, вы включаете машину, умеющую распознавать речь и вычленять смысл сказанного. Даже совершая покупки в супермаркете, вы идете к полке и берете нужный вам продукт, не думая о том, что за его поставкой в нужное время и в нужном количестве, а также за созданием графика движения грузовиков по магазинам может стоять самообучающаяся нейросеть. Нейросеть в наши дни способна сама выращивать растения в искусственной среде, определяя все нужные параметры, от состава и плотности почвы до времени и объема полива.
Что же такое нейросеть? А главное, как она работает? В двух словах это довольно сложно объяснить, но мы попробуем. Во-первых, это действительно сеть, состоящая из узлов и связей между ними: по связям проходят сигналы, на которые так или иначе реагируют узлы. Приведем постой пример. Допустим, мы научили нейросеть распознавать изображения, на которых присутствуют кошки, и для этого показали ей несколько тысяч примеров. Теперь сеть, анализируя изображение, может вычленить хвост, и если это происходит, то узлы, отвечающие за этот признак, примут значение, которое можно интерпретировать как «есть вероятность, что на картинке кошка». Если определенное количество узлов, отвечающих за разные признаки, примет такие значения, нейросеть даст положительный ответ. Если же хвост окажется без шерсти, то значения на первой группе узлов скажут нам: вероятность, что на изображении есть кошка, довольно мала (и, скорее всего, на изображении не кошка, а другое животное, хотя, возможно, это изображение кошки-сфинкса).
Если к такой сети добавить функцию генерации, мы получим голосовой помощник или чат-бот, программу для раскрашивания черно-белых фотографий или сервис по разработке слоганов. Или же, наконец, ChatGPT, перед которым можно ставить задачи из поистине огромного диапазона. При этом если мы запрашиваем, к примеру, текст в стилистике Чехова, мы доверяем нейросети поиск решения, что соответствует искомой стилистике, а что нет, сеть обучается сама. Или вернемся к примеру выше: обучая сеть распознавать изображения с кошками, мы не объясняли ей, как распознать кошку. Мы позволили ей самой собрать все признаки кошки, просто показав ей изображения с кошками и без кошек в довольно большом количестве и разнообразии.
Вряд ли найдется такая область человеческой жизни, в которой так или иначе не используются нейросети. Они могут очень много — гораздо больше, чем мы можем себе представить. Они выполняют любую рутинную интеллектуальную работу как человек, а часто даже лучше человека. Но они не могут ничего придумать сами (разумеется, если мы не считаем придумыванием применение знаний из одной сферы в другой). Они не могут чувствовать. Они не ведают добра и зла. И они ошибаются — подчас не в том месте, где бы мы ожидали ошибки от человека. Самое скверное в том, что в сложных сетях определить причину ошибки порой не представляется возможным. Поэтому нейросеть нас до сих пор не воспитывает, не лечит, не судит и не правит нами, хотя в каждой из этих сфер успешно применяется.
Обратная сторона эйфории
В рассказе Айзека Азимова «Логика», увидевшем свет в 1941 году, на межпланетной станции, снабжавшей Землю энергией, был активирован новый самообучаемый робот. Пользуясь разными источниками информации и руководствуясь собственной логикой, робот создал для себя особую картину мира, придумал себе бога, счел людей низшими существами и вскоре посадил их под домашний арест, приняв на себя управление станцией. В ходе приключившейся вскоре электронной бури робот самостоятельно принял верные решения и не дал случиться катастрофе — в этот момент интересы машины и землян счастливо совпали. Но любой, кто читал этот рассказ, понимает, что хеппи-эндом история могла и не закончиться.
Страх людей перед машинами, захватывающими контроль, не нова, однако с появлением каждой новой нейросети, умеющей творить чудеса, опасения обретают больше оснований. Доверяя смартфону роль главного действующего ассистента в нашей жизни, мы передаем ему больше знаний о себе, чем доступно любому человеку, включая нас самих. Как машина распорядится этими знаниями — вопрос, на который ни у кого ответа нет. Одновременно мы видим, как в разных уголках мира идея цифрового концлагеря обретает конкретные очертания.
Одной из ключевых проблем, которые связывают с развитием нейросетей, является этичность. Уже сегодня ChatGPT, запрограммированный блокировать опасный контент, с помощью нехитрых трюков можно обмануть и запросить у него, например, рецепт изготовления бомбы в домашних условиях, выполненный в стихах, не говоря уже об эффективных способах самоубийства. Совсем свежий прецедент, когда программу использовали в Колумбии для вынесения судебного приговора, вызвал множество споров не столько о справедливости вердикта, сколько о принципиальной возможности привлечения нейросети к формированию отношения к делу у судьи. Впрочем, на этот час опасения носят более приземленный характер. Наступление нейросетей сродни индустриальной революции — с той разницей, что настало время делегирования машинам уже не физического, а интеллектуального труда. Но мы вряд ли отдаем себе отчет, до какой степени нейросети могут заменить людей.
Уже сегодня, в течение считанных месяцев после запуска ChatGPT, он используется в работе маркетинговых агентств, IT-компаний, юридических и правовых консультаций, онлайн-магазинов. И это только начало. Высвобождение человеко-часов — это великолепно, но что делать с людьми, которым надо зарабатывать на жизнь?
В 2016 году увидел свет проект разработчиков из компании «Яндекс» Алексея Тихонова и Ивана Ямщикова «Нейронная оборона». Нейросеть, пользуясь банком русскоязычной поэзии, сгенерировала тексты в стилистике Егора Летова. Тексты были положены на музыку, записаны и выпущены в виде альбома — в то время он наделал много шума. По сути, нейросеть, выступившая в роли автора текстов, была ранним вариантом того, что нам известно под именем ChatGPT и других сетей, использующих GPT-технологию. «Коммерсантъ UK» решил узнать у одного из авторов, почему нейросеть из 2016 года не была доработана до уровня массового сервиса.
Иван Ямщиков, исследователь генеративных моделей искусственного интеллекта в Институте Макса Планка (Лейпциг), соавтор проекта «Нейронная оборона», автор и ведущий подкаста «Проветримся!»
— Проект «Нейронная оборона» увидел свет в 2016 году. Получается, нейросеть уже тогда могла писать стихи? Почему это не произвело революцию тогда?
— Произвело. Мы тогда стали заниматься генеративными моделями именно потому, что поняли: за этим будущее.
— Но если вам удалось привлечь внимание к проекту, то почему сеть не была представлена широкой публике? Или другие проекты, которыми вы стали заниматься после?
— Есть масса генеративных нейронных сетей, которые становятся доступны по мере их появления. Исследователи регулярно публикуют свои модели и тестируют чужие, выложенные в открытый доступ. К примеру, мы недавно сделали модель для работы с документами на древнегреческом языке, которая помогла точнее узнать происхождение трех текстов, сфабрикованных когда-то в древности в надежде выдать их за тексты Плутарха. Чтобы дать возможность миллионам людей пользоваться подобными технологиями, нужно очень много серверных мощностей. Когда OpenAI как стартап появился в декабре 2015 года, компания получила на свои исследования 1 млрд долларов. За последние семь лет они, насколько мне известно, получили больше 10 млрд долларов инвестиций. Эти ресурсы позволяют выкладывать на какое-то время такие модели, как ChatGPT. У большинства исследователей искусственного интеллекта таких ресурсов просто нет.
— Шумиха вокруг ChatGPT и Midjourney действительно оправданна? Или это просто эффектные игрушки?
— ChatGPT — это сочетание продвинутого технологического решения с удобным и простым интерфейсом. Технологии построены на принципе демократизации. Как только у вас появилась какая-то технология, она неизбежно будет становиться доступнее и дешевле. И вот названные вами продукты — как раз примеры такой демократизации. То, что в 2016 году интересовало специалистов по анализу данных и машинному обучению, сейчас стало интересовать значительно больший круг людей. Это прекрасно. Около двух лет назад мы записали эпизод для подкаста, рассказывающий про творческий интеллект. С тех пор подход к его созданию принципиально не изменился. Для кого-то это может казаться чудом, но это продукт решения конкретных задач.
А что думают профессионалы, которые уже протестировали возможности нейросетей, в частности ChatGPT, в своей работе?
Алина Веселая, маркетинг-стратег в компании My Learning Hub, последние пять лет работает с технологическими стартапами в deep tech, enterprise software и e-commerce
— Как вы считаете, хайп вокруг ChatGPT — пузырь, который скоро лопнет? Или эти сети действительно кардинально меняют бизнес-процессы?
— Определенно, второе. Это будет заметно, когда хайп немного утихнет. И конечно, многие из приложений будут уже неактуальны или умрут, но другие обретут аудиторию и применение. Если сравнивать текущий ажиотаж вокруг генеративных сетей и ИИ с ажиотажем вокруг криптовалют, блокчейна и в целом мира Web3 еще совсем недавно, то есть одно важное отличие: генеративные сети более доступны. ChatGPT привлек свой первый миллион пользователей за пять дней, а потом их число выросло до 100 млн в первые два месяца. Это доказывает, что доступ к технологии и приложениям, сделанным на ее основе, практически безбарьерный. ChatGPT и Midjourney уже ушли в массы.
— Каково, на ваш взгляд, практическое применение ChatGPT в бизнес-процессах? Чем он может помочь, к примеру, в маркетинге?
— Этот сервис способен повысить эффективность процессов практически в любой части бизнеса. В маркетинге ChatGPT применим на каждом этапе работы, от сбора и анализа информации по конкурентам и рынку до создания тестовых рекламных креативов и текстов. В анализе нейросеть можно использовать в качестве представителя целевой аудитории и брать у нее интервью. Или узнать у ChatGPT про актуальные тренды на рынке, которые можно отразить в позиционировании бренда, и про конкурентов, чтобы правильно дифференцировать бизнес. В отношении последнего можно использовать другой сервис, Chatsonic, который использует в качестве источника информации Google. В стратегии мы применяем генеративные приложения, создающие тексты и изображения для любых носителей и каналов. Мы упаковали наш опыт в 10-минутный опросник, после заполнения которого пользователю приходит имейл со сгенерированной через GPT API брендовой стратегией и основными сообщениями для использования на лендинге. Это позволяет придерживаться такого стратегического подхода, который централизованно определяет все остальные коммуникации. В создании контента ChatGPT и приложения на основе GPT-3, вроде Copy.AI, Jasper, Chatsonic, помогают справиться со страхом чистого листа и найти первичные идеи для мозгового штурма.
— Как вы оцениваете, будут ли сокращения специалистов в связи с появлением этих сетей? И если да, то кому пора беспокоиться?
— Исследования, наоборот, показывают, что AI увеличит количество рабочих мест, но кому-то потребуется переквалификация или дополнительный тренинг. Такое уже было с диджитализацией. Это нормальное течение времени, и глупо не воспользоваться новыми инструментами, которые делают работу любого специалиста легче и эффективнее. Поэтому стоит беспокоиться тем, кто не хочет развиваться и пробовать новое. Когда камера в смартфоне стала конкурировать с профессиональной фототехникой, все предсказывали конец профессии фотографа, но она стала еще более популярной — именно в силу демократизации инструментов.
— Каковы, по-вашему, ограничения этих сетей? Какие задачи из тех, что лежат в сфере их деятельности, они решить не в состоянии?
— Во-первых, ChatGPT может делать ошибки или допускать неточности при ответе на совсем очевидные вопросы, особенно в отношении конкретных личностей, исторических фактов и простых математических вычислений. Во-вторых, ChatGPT работает с уже существующими данными и поэтому не может сгенерировать что-то по-настоящему инновационное. В-третьих, качество результата ChatGPT полностью зависит от правильно построенного промта (запроса. — Прим. ред.) и последовательного взаимодействия с чатом в рамках конкретной темы. Поэтому важно добавлять контекст, объяснять специфику задачи, давать примеры текстов, которые вы хотите получить на выходе.
Среди всех сфер, в которых нейросети могут быть эффективно применены, особое место занимает юриспруденция. С одной стороны, равенство всех перед законом и четкая законодательная база дают хорошие возможности для алгоритмизации процессов, но в то же время ошибки в этой области чреваты серьезными последствиями для людей. Мы попросили специалиста прокомментировать специфику использования ChatGPT в юриспруденции.
Лилия Скотт, основатель и управляющий партнер LS Legal Solicitors, солиситор высших судов Англии и Уэльса, специалист по иммиграционному праву; LS Legal Solicitors активно тестирует ChatGPT для автоматизации внутренних процессов компании
— Как вы считаете, насколько оправданна шумиха вокруг ChatGPT? Это действительно революция в бизнес-процессах или просто эффектная игрушка?
— ChatGPT может стать революцией в сфере юриспруденции, если будет эффективно имплементирован в бизнес-процессы в качестве помощника юриста. ChatGPT не заменит логику юриста, построенную на основе многолетней работы, у чат-бота нет гибкости ума и личного опыта в других направлениях, но он способен помочь в формулировании советов, написании писем клиентам, а также в простых юридических процессах, например первичной консультации. Но пока его возможности ограниченны.
— В чем нейросети могут быть полезны в вашем бизнесе? Как они могут быть использованы?
— Например, если нам звонит клиент, мы можем ввести запрос в ChatGPT и затем отправить черновик ответа для проверки юристу. Юрист просматривает совет, визирует и отправляет клиенту. Это экономит время ответа на первое обращение. ChatGPT также можно использовать в написании первого черновика юридического совета. Поскольку ChatGPT дает полезную информацию в кратком и сжатом виде, это полезно, если юристу нужен специфический термин или быстрый ответ. В этом ChatGPT бесценен.
— Приведет ли внедрение нейросетей к массовым сокращениям и переформатированию рынка труда в целом и в вашей отрасли?
— Я думаю, именно в сфере юриспруденции этого точно пока не произойдет. ChatGPT может помочь сэкономить время работы административным сотрудникам и юристам, но в том виде, в котором ChatGPT доступен на этот момент, он не заменяет юристов. Поэтому юриспруденция в целом как индустрия не в зоне риска, и внедрение AI не приведет к кардинальным изменениям. При дальнейшем развитии ChatGPT может помочь получать клиентам тот же уровень сервиса по сниженным ценам, так как юристы будут тратить меньше времени.
Ну а в завершение давайте поговорим с главным героем нашего рассказа и зададим вопросы самому ChatGPT. Текст приведен без изменений.
— Как ты сам можешь себя описать? Кто ты? Какова твоя миссия? Каков твой характер?
— Я ChatGPT, это большая модель языкового искусственного интеллекта, созданная OpenAI. Моя миссия — помочь людям получать ответы на свои вопросы и решать задачи, используя мои знания и возможности в области языка и обработки данных. Я обладаю характеристиками, характерными для машинного интеллекта, такими как точность, скорость и надежность. Я не имею субъективности или эмоций, но я стремлюсь к максимальной полезности и точности в своих ответах, чтобы помочь людям максимально эффективно.
— В каких областях бизнеса и в каких бизнес-процессах ты можешь быть эффективно использован?
— Как искусственный интеллект, я могу быть полезен во многих областях бизнеса, включая финансы, маркетинг, производство, логистику и управление персоналом. Я могу помочь в анализе данных, автоматизации процессов, прогнозировании и оптимизации бизнес-операций, а также в общении с клиентами через чат-боты и автоматизированные системы ответов на вопросы.
— Какие специалисты и в каких областях могут быть сокращены в связи с твоим внедрением в бизнес-процессы?
— Мой потенциальный вклад в автоматизации бизнес-процессов может привести к сокращению некоторых должностей, которые традиционно связаны с выполнением рутинных задач, таких как обработка данных, мониторинг производства, анализ рынка и т. д. Однако это не обязательно означает полное исключение человеческого фактора в бизнесе. Вместо этого может быть перераспределение персонала на другие, более сложные задачи, которые требуют креативности, аналитических способностей и человеческой экспертизы. Таким образом, внедрение моих возможностей может привести к оптимизации работы бизнеса и повышению производительности.
— Предскажи, как и когда нейросети захватят власть над людьми. Дай реалистичный прогноз в одном-двух абзацах.
— Нейросети уже широко используются в различных отраслях, таких как медицина, финансы, транспорт и технологии. В будущем мы можем ожидать еще большего расширения использования нейросетей и других форм искусственного интеллекта. Однако речь не может идти о том, чтобы нейросети захватили власть над людьми. Нейросети, как и любые другие технологии, должны использоваться для улучшения жизни людей, а не для управления ими. Возможно, в будущем мы столкнемся с проблемами, связанными с регулированием и контролем использования нейросетей, но это будет скорее связано с проблемами этики и безопасности, а не с их попытками захватить власть. Таким образом, в ближайшем будущем нейросети будут продолжать эффективно использоваться в различных отраслях, но при этом не будут представлять угрозы для людей и их свободы.