К сожалению, сайт не работает без включенного JavaScript. Пожалуйста, включите JavaScript в настройках вашего браузера.

OpenAI заявила о способности «мыслить образами» у своей новой модели ИИ


Компания OpenAI выпустила свою новейшую модель ИИ o3. По заявлению компании, она может распознавать изображения даже низкого качества, способна «мыслить образами» и использовать визуальную информацию в своих рассуждениях. Вместе с o3 компания представила и меньшую модель o4-mini

Компания OpenAI представила свою новейшую модель искусственного интеллекта (ИИ). Она объявила о запуске o3 и модели меньшего размера под названием o4-mini. OpenAI заявила, что последняя модель способна «мыслить образами», то есть понимать и анализировать наброски и схемы пользователя, даже если они низкого качества. Новые модели «не просто видят изображение, они могут интегрировать визуальную информацию непосредственно в цепочку рассуждений», сообщает OpenAI.

В сентябре 2024 года компания дебютировала с большой языковой моделью (Large Language Model, LLM) o1, ориентированной на решение сложных задач и обдумывание запросов пользователей в несколько этапов, передает CNBC. С момента выпуска своего популярного чат-бота ChatGPT в конце 2022 года OpenAI быстро совершенствует свои модели, чтобы они могли работать не только с текстом, но и с изображениями, голосом и видео. Компания конкурирует в создании генеративных нейросетей с Google, Anthropic и xAI Илона Маска.

Новые модели компании могут загружать разные виды изображений и использовать различные инструменты для их редактирования (поворачивать, увеличивать и т. п.). «Впервые наши модели мышления могут независимо использовать все инструменты ChatGPT — просмотр веб-страниц, Python, распознавание и генерацию изображений. Это помогает им более эффективно решать сложные многоэтапные задачи и делать реальные шаги к самостоятельной работе», — сообщила OpenAI.

 

В марте 2025 года OpenAI выпустила встроенную функцию создания изображений, которая стала вирусной в интернете благодаря своей способности создавать аниме-изображения в стиле Studio Ghibli. Компания OpenAI сообщила, что o3 специально настроена на математику, программирование, естественные науки и распознавание изображений, а модель o4-mini работает быстрее и стоит дешевле. Обе модели стали доступны пользователям ChatGPT Plus, Pro и Team 16 апреля. 

Компания также сообщила, что обе модели «прошли стресс-тестирование». OpenAI сократила время и ресурсы на тестирование безопасности генеративных моделей искусственного интеллекта — сотрудникам и сторонним исследователям дали всего несколько дней на изучение ее новой большой языковой модели o3, в то время как раньше такие проверки занимали несколько месяцев, писала 11 апреля Financial Times. Для сравнения, до выпуска GPT-4 в 2023 году у тестировщиков было шесть месяцев на ее изучение.

 

Ранее компания не стала публиковать «паспорт модели» (отчет, содержащий информацию о тестах на безопасность, проведенных перед выпуском модели) для своей модели GPT-4.1, напоминает CNBC. В феврале 2025 года OpenAI запустила инструмент для ИИ-агентов (помощников) Deep Research за несколько недель до публикации такого паспорта. CNBC направил запрос OpenAI. 

Наименование издания: forbes.ru

Cетевое издание «forbes.ru» зарегистрировано Федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций, регистрационный номер и дата принятия решения о регистрации: серия Эл № ФС77-82431 от 23 декабря 2021 г.

Адрес редакции, издателя: 123022, г. Москва, ул. Звенигородская 2-я, д. 13, стр. 15, эт. 4, пом. X, ком. 1

Адрес редакции: 123022, г. Москва, ул. Звенигородская 2-я, д. 13, стр. 15, эт. 4, пом. X, ком. 1

Главный редактор: Мазурин Николай Дмитриевич

Адрес электронной почты редакции: press-release@forbes.ru

Номер телефона редакции: +7 (495) 565-32-06

На информационном ресурсе применяются рекомендательные технологии (информационные технологии предоставления информации на основе сбора, систематизации и анализа сведений, относящихся к предпочтениям пользователей сети «Интернет», находящихся на территории Российской Федерации)

Перепечатка материалов и использование их в любой форме, в том числе и в электронных СМИ, возможны только с письменного разрешения редакции. Товарный знак Forbes является исключительной собственностью Forbes Media Asia Pte. Limited. Все права защищены.
AO «АС Рус Медиа» · 2025
16+