К сожалению, сайт не работает без включенного JavaScript. Пожалуйста, включите JavaScript в настройках вашего браузера.

Три года трансформации: почему разминку в сфере ИИ можно считать оконченной

Фото AaronP / Bauer-Griffin / GC Images / Getty Images
Фото AaronP / Bauer-Griffin / GC Images / Getty Images
Появление массово доступного генеративного искусственного интеллекта принято отсчитывать с 30 ноября 2022-го, когда компания OpenAI открыла общий доступ к теперь уже знаменитому и широко известному ChatGPT. Случайно так вышло или нет, но дата оказалась очень удобна для пишущих предновогодние материалы: оглядываясь в конце года назад, можно сразу подвести и итоги прошедших с конца 2022-го лет. Сейчас это всего три года, но по плотности событий в технологической сфере они стоят иных десятилетий, убежден директор по стратегическому маркетингу «Яндекса» Андрей Себрант

Год 2023-й, первый от рождения ChatGPT

Хотя технологии ИИ, в том числе генеративного, развивались уже несколько лет, именно 2023-й становится первым годом массового доступного ИИ. Недельная аудитория ChatGPT к концу года превышает 100 млн, а на арену помимо OpenAI выходят и другие серьезные игроки, в первую очередь стартап Anthropic со своим чат-ботом Claude и техногигант Google с Bard. В 2023-м они еще не составляют серьезной конкуренции, но уже дают понять, что конкуренция будет. В России весной 2023 года выходят две модели полностью локальной разработки: от «Яндекса» (YandexGPT) и «Сбера» (GigaChat), включившихся в мировую гонку. Китайские разработчики за полгода выпускают 100 собственных моделей, но за пределами страны они не вызывают заметного интереса.

Генеративные ИИ-технологии уже в первый год своего существования начинают интегрироваться (пока в виде простейших надстроек) в существующие цифровые экосистемы крупнейших игроков: появляются Microsoft 365 Copilot и Duet AI от Google, позже переименованный в Gemini for Workspace. Adobe интегрирует свою модель Firefly в линейку продуктов Creative Cloud. В России «Яндекс» интегрирует YandexGPT в «Алису», а в поиске появляются быстрые ИИ-ответы.

Telegram-канал Forbes.Russia
Канал о бизнесе, финансах, экономике и стиле жизни
Подписаться

Год 2024-й, второй от рождения ChatGPT

Этот год показал, что большие языковые модели способны на много большее, чем просто поддержание словесного диалога с человеком, а острая конкуренция стала свершившимся фактом. В марте Anthropic выпускает семейство моделей Claude 3, которые на ряде бенчмарков обходят GPT-4 от OpenAI. В ответ появляется модель GPT-4o, являющаяся нативно мультимодальной: она способна принимать на вход в реальном времени не только текст, но и картинки, аудио и видео. Становится понятно, что одним лишь языком ИИ-модели не обойдутся. В сентябре выходит модель нового типа GPT-4o1-preview, способная поразмышлять перед тем, как дать ответ. ИИ уже начинает всерьез интегрироваться во все цифровые платформы и операционные системы, возникает «слой ИИ» поверх всех сервисов, предлагаемых облачными платформами, сотни миллионов людей регулярно используют ИИ, не обращаясь к отдельным приложениям, а прямо в контуре привычного цифрового окружения (например, в поиск «Яндекса» интегрируется технология «Нейро»). В конце года выходит китайская модель DeepSeek v3, но пока она привлекает пристальное и несколько ошеломленное внимание только со стороны специалистов.

 

Зато внимание всех начинают привлекать масштабы сделок и капитализация ИИ-компаний: осенью OpenAI привлекает $6,6 млрд по оценке $157 млрд, xAI — примерно такую же сумму, а Anthropic — $4 млрд. На ИИ-стартапы пришлось около 30% всего венчурного финансирования в мире (в 2022-м — лишь 13%), и это вызывает, как принято говорить, «неоднозначную реакцию» в разнообразных сообществах.

Год 2025-й, третий от рождения ChatGPT

В январе этого года происходит событие, часто называемое DeepSeek-moment: в Китае выходит «рассуждающая» модель DeepSeek‑R1, демонстрирующая качество уровня топовых американских моделей на английском языке; за несколько дней соответствующее приложение становится лидером в мировых сторах, а капитализация американских бигтехов временно проваливается на $1 трлн. В Китае выходит еще ряд моделей, окончательно доказавших, что теперь борьба за глобальное первенство в ИИ разворачивается между двумя странами, Китаем и США, и ни одна из них пока не имеет решающего преимущества.

 

Спустя всего два года с момента выхода первой популярной генеративной модели ИИ предстает в новом облике: словами года можно назвать «автономные ИИ-агенты» и «физический ИИ». Благодаря агентам принципиально меняется глубина интеграции в цифровые процессы: на смену «ИИ-кнопкам», вызывающим отдельные функции (пересказ, перевод, генерация контента), приходят запускаемые по триггеру многошаговые процессы, которые ИИ самостоятельно планирует и запускает, взаимодействуя в процессе с разнообразными внешними интерфейсами. Специализированные ИИ-модели начинают использоваться в прикладных научных исследованиях, опосредованно влияя на наш наукоемкий мир. Мировые ЦОДы потребляют 55 ГВт электрической мощности, из которых 14% приходится сугубо на специализированные модули, в которых трудятся уже миллионы ИИ-блоков.

Управляемые ИИ автономные роботы, часто человекоподобные, из диковинок и редких демонстрационных образцов превращаются в героев новостей и надежду инвесторов: начинаются пилотные проекты на производстве и в логистических центрах, расширяется спектр доступных роботам операций. Впрочем, автономные роботы не обязательно человекоподобны: беспилотный транспорт выходит наконец на стадию коммерческой эксплуатации. Причем в мировой гонке неожиданно для многих лидером оказывается Китай: тысячи машин регулярно перевозят пассажиров в полностью автономном режиме и без страхующих водителей. В США лидером является Waymo с парком в 2500 роботакси в пяти городах, обеспечивающим 250 000 поездок в неделю. В России 90 беспилотных грузовых КАМАЗов и Navio преодолевают более 9,5 млн км по М-11 и ЦКАД, но пока с водителем-испытателем в кабине.

Такое проникновение ИИ в материальный мир было бы невозможно на основе уже привычных моделей, оперирующих лишь текстами или изображениями. Все большее внимание уделяется созданию ИИ на основе VLA-моделей (visual-language-action) и моделей мира, оперирующих не только с контентом всех модальностей, но и с непосредственными данными физического мира в реальном времени и поведением устройств в нем. С 2025 года ИИ больше не живет лишь по ту сторону экранов.

 

В этой намеренно отрывочной, беглой и поверхностной ретроспективе я специально не упоминал ни бурно обсуждавшихся социальных эффектов ИИ, ни его уже ощутимого влияния на рынок труда, электрические сети целых стран и геополитику, ни страхов «пузыря», ни многого другого. Цель этой колонки — показать, насколько недавно ИИ стал массовым феноменом, насколько при этом ошеломляюще мощный рывок совершил за три года — и насколько наивно от него требовать немедленной отдачи или соответствия привычным стандартам, которые, увы, уже часто принадлежат прошлому.

Разминка закончена, разнообразные ресурсы (человеческие, финансовые, материальные) достаточно аккумулированы. Во многих странах сформулированы государственные приоритеты и стратегии развития ИИ. Вот теперь-то и начнется все самое интересное, подчас непредсказуемое, на фоне которого описанные события прошедших трех лет покажутся неторопливыми, обыденными и скучноватыми. С наступающим вас новым годом, дорогие читатели, с четвертым от рождения ChatGPT!

Мнение редакции может не совпадать с точкой зрения автора