FT: DeepSeek отложила выпуск своей новой модели из-за проблем с китайскими чипами
DeepSeek отложила выпуск своей новой модели после проблем с ее обучением на чипах Huawei, пишет Financial Times со ссылкой на источники. По словам собеседников газеты, китайские власти рекомендовали компании использовать процессоры Huawei вместо продуктов Nvidia после выпуска модели R1 в январе этого года
Китайская ИИ-компания DeepSeek отложила релиз своей новой модели после того, как не смогла обучить ее на чипах Huawei, сообщает Financial Times (FT) со ссылкой на источники.
По словам трех собеседников FT, знакомых с вопросом, использовать процессоры Huawei Ascend вместо продуктов Nvidia компании рекомендовали китайские власти после выпуска модели R1 в январе. Однако DeepSeek столкнулась с проблемами в процессе обучения модели R2 на чипах Ascend, что побудило компанию задействовать для обучения чипы Nvidia, а на этапе использования обученной модели для генерации ответов использовать чипы Huawei.
Эти проблемы стали главной причиной того, что компания отложила выпуск модели, рассказал источник FT, знакомый с ситуацией. Как отмечает газета, трудности компании демонстрируют, что китайские чипы по-прежнему отстают от американских в решении критических задач.
Huawei направила в офис DeepSeek команду инженеров, чтобы помочь ей использовать свои чипы для разработки R2, однако компании все равно не удалось провести успешное обучение на чипах Ascend, рассказали собеседники FT. При этом DeepSeek продолжает работать с Huawei над тем, чтобы сделать модель совместимой с ее чипами, отметили источники газеты.
По их словам, основатель DeepSeek Лян Вэньфэн выразил свое недовольство прогрессом R2 и настаивал на том, чтобы уделить больше времени созданию продвинутой модели, которая сможет поддержать лидерство компании в сфере ИИ. Еще одной причиной того, что выпуск R2 был отложен, по данным источника FT, стала более длительная, чем ожидалось, маркировка данных для обновленной модели.
DeepSeek и Huawei не ответили на запросы газеты о комментариях.
Ранее, в июне, Reuters со ссылкой на чиновника Госдепартамента США сообщил, что DeepSeek помогает КНР в проведении военных и разведывательных операций. Он отметил, что китайская компания пыталась использовать подставные компании в Юго-Восточной Азии, чтобы закупать высокотехнологичные полупроводники, которые запрещено отправлять в КНР в соответствии с экспортными ограничениями США.
