Итоги GoCloud Tech: новые цены на LLM и эволюция AI-помощника «Клаудия»

По прогнозам Grand View Research, объем сегмента крупных языковых моделей в мире увеличится с $5,6 млрд в 2024 году до $35,4 млрд к 2030-му, демонстрируя среднегодовой рост на уровне 36,9%. Нарастает и конкуренция между глобальными разработчиками, вследствие чего наблюдается волатильность в ценах на эти сервисы. Одним из ключевых событий технологической конференции GoCloud Tech стало объявление Cloud.ru цен на использование открытых больших языковых моделей (LLM).
Cloud.ru Evolution AI Factory — это облачная среда с готовыми AI- и ML-инструментами для быстрого развертывания и адаптации крупных языковых моделей (LLM) и мультиагентных систем под практически любые бизнес-задачи. В ее составе доступны открытые и коммерческие большие языковые модели, инструменты для их обучения, тестирования и интеграции в продукты. Пользователи могут подключать модели через OpenAI-совместимый API.
Так, с 1 ноября стоимость использования открытых языковых систем в облачной среде Cloud.ru Evolution AI Factory будет разделена для входных и выходных токенов и составит в среднем 35 рублей за миллион входных и 70 рублей за миллион выходных токенов. Например, GLM-4.5 будет стоить 55 рублей за входной и 220 рублей за выходной миллион токенов, Qwen3-235B — 17 и 50 рублей соответственно.
«Наша цель — сделать цены на LLM в Cloud.ru максимально доступными в России и сопоставимыми с глобальными провайдерами», — отметил руководитель направления AI Cloud.ru Дмитрий Юдин.
Также компания поделилась первыми результатами работы своего AI-помощника «Клаудия», получившего расширенные сценарии для бизнеса. Этот инструментарий уже сегодня меняет повседневные процессы разработчиков и инженеров.
По данным Cloud.ru, только за два последних месяца более 4000 пользователей отправили ей свыше 12 000 сообщений, а каждый четвертый возвращается к сервису регулярно. В среднем «Клаудия» ускоряет рутинные операции DevOps-инженеров в 15 раз: например, создание виртуальной машины без помощника могло занимать от 5 до 30 минут, а с «Клаудией» время сократилось до пары минут.
Кроме того, Cloud.ru запустил публичное тестирование двух новых сценариев помощника: SRE-агента для мониторинга приложений и алертов по логам, а также FinOps-модуля для выявления неэффективно используемых ресурсов и оптимизации расходов.
«Мы строим «Клаудию» как AI-агента, которому можно доверить решение сложных задач. В приоритете — понимание контекста, проактивный подход и использование лучших практик DevOps, SRE и FinOps», — подчеркнул лидер продуктовой платформы Cloud.ru Антон Тодосийчук.
