OpenAI заявила о способности «мыслить образами» у своей новой модели ИИ

Сергей МингазовРедакция Forbes

Компания OpenAI выпустила свою новейшую модель ИИ o3. По заявлению компании, она может распознавать изображения даже низкого качества, способна «мыслить образами» и использовать визуальную информацию в своих рассуждениях. Вместе с o3 компания представила и меньшую модель o4-mini

Компания OpenAI представила свою новейшую модель искусственного интеллекта (ИИ). Она объявила о запуске o3 и модели меньшего размера под названием o4-mini. OpenAI заявила, что последняя модель способна «мыслить образами», то есть понимать и анализировать наброски и схемы пользователя, даже если они низкого качества. Новые модели «не просто видят изображение, они могут интегрировать визуальную информацию непосредственно в цепочку рассуждений», сообщает OpenAI.

В сентябре 2024 года компания дебютировала с большой языковой моделью (Large Language Model, LLM) o1, ориентированной на решение сложных задач и обдумывание запросов пользователей в несколько этапов, передает CNBC. С момента выпуска своего популярного чат-бота ChatGPT в конце 2022 года OpenAI быстро совершенствует свои модели, чтобы они могли работать не только с текстом, но и с изображениями, голосом и видео. Компания конкурирует в создании генеративных нейросетей с Google, Anthropic и xAI Илона Маска.

Материал по теме

Новые модели компании могут загружать разные виды изображений и использовать различные инструменты для их редактирования (поворачивать, увеличивать и т. п.). «Впервые наши модели мышления могут независимо использовать все инструменты ChatGPT — просмотр веб-страниц, Python, распознавание и генерацию изображений. Это помогает им более эффективно решать сложные многоэтапные задачи и делать реальные шаги к самостоятельной работе», — сообщила OpenAI.

В марте 2025 года OpenAI выпустила встроенную функцию создания изображений, которая стала вирусной в интернете благодаря своей способности создавать аниме-изображения в стиле Studio Ghibli. Компания OpenAI сообщила, что o3 специально настроена на математику, программирование, естественные науки и распознавание изображений, а модель o4-mini работает быстрее и стоит дешевле. Обе модели стали доступны пользователям ChatGPT Plus, Pro и Team 16 апреля.

Материал по теме

Компания также сообщила, что обе модели «прошли стресс-тестирование». OpenAI сократила время и ресурсы на тестирование безопасности генеративных моделей искусственного интеллекта — сотрудникам и сторонним исследователям дали всего несколько дней на изучение ее новой большой языковой модели o3, в то время как раньше такие проверки занимали несколько месяцев, писала 11 апреля Financial Times. Для сравнения, до выпуска GPT-4 в 2023 году у тестировщиков было шесть месяцев на ее изучение.

Ранее компания не стала публиковать «паспорт модели» (отчет, содержащий информацию о тестах на безопасность, проведенных перед выпуском модели) для своей модели GPT-4.1, напоминает CNBC. В феврале 2025 года OpenAI запустила инструмент для ИИ-агентов (помощников) Deep Research за несколько недель до публикации такого паспорта. CNBC направил запрос OpenAI.

Материал по теме