Запуск GLM-5 открывает новую эпоху в развитии ИИ: когда модели становятся инженерами


Выход в открытый доступ модели GLM-5 стал не просто очередным обновлением в мире больших языковых моделей, а заметным сигналом более глубоких изменений в самой логике развития искусственного интеллекта. Сегодня речь уже идет не только о генерации фрагментов кода или создании прототипов интерфейсов. Современные модели постепенно переходят к построению полноценных систем и выполнению сложных сквозных задач — от замысла до реализации. Этот сдвиг всё чаще описывают как переход от так называемого «vibe coding» к агентному инжинирингу, где модель выступает не помощником, а самостоятельным исполнителем инженерных процессов.

GLM-5 была разработана именно с учетом этой новой фазы развития технологий. По уровню возможностей в программировании и автономном выполнении задач она уже относится к числу наиболее сильных open-source решений. В практических сценариях, связанных с разработкой программного обеспечения, её результаты приближаются к показателям Claude Opus 4.5, особенно когда речь идет о проектировании сложных систем и работе с долгосрочными задачами, требующими последовательного планирования и устойчивого выполнения.

В основе модели лежит обновленная архитектура, ориентированная одновременно на масштабирование возможностей и повышение эффективности. Общее число параметров увеличилось с 355 до 744 миллиардов, а количество активных параметров — с 32 до 40 миллиардов. Объем данных предварительного обучения достиг 28,5 триллиона токенов. Однако рост масштабов сопровождается и изменениями в методах обучения. Фреймворк Slime обеспечивает асинхронное обучение с подкреплением в более широком масштабе, позволяя модели непрерывно совершенствоваться за счет длительных взаимодействий и повышать эффективность дообучения. Кроме того, внедрена технология DeepSeek Sparse Attention, которая сохраняет качество работы с длинным контекстом, одновременно снижая затраты на развертывание и повышая эффективность обработки токенов.

Результаты тестирований подтверждают заметный прогресс. На бенчмарках SWE-bench-Verified и Terminal Bench 2.0 модель получила 77,8 и 56,2 балла соответственно — это самые высокие показатели среди open-source моделей на данный момент, а в ряде задач программной инженерии GLM-5 опережает Gemini 3 Pro. В тесте Vending Bench 2, имитирующем управление бизнесом по продаже товаров через автомат в течение года, модель завершила симуляцию с балансом 4 432 доллара, продемонстрировав лучшие результаты среди открытых моделей в управлении операционной и экономической деятельностью.

Эти показатели наглядно демонстрируют качества, которые становятся ключевыми для агентного инжиниринга: способность удерживать стратегические цели на протяжении длительного времени, эффективно распределять ресурсы и координировать многоэтапные процессы. По мере того как такие модели берут на себя всё более сложные функции, граница развития ИИ смещается — от написания кода к созданию полноценно работающих систем.

Доступ к чату и официальному API

Онлайн-чат Z.ai: https://chat.z.ai
Тарифный план GLM для программирования: https://z.ai/subscribe

Репозитории с открытым исходным кодом

GitHub: https://github.com/zai-org/GLM-5
Hugging Face: https://huggingface.co/zai-org/GLM-5

Блог

Технический блог GLM-5: https://z.ai/blog/glm-5