Китайская Z.ai выпустила подробный рассказ о GLM-5.1 — обновлении флагманской модели, которое заняло первое место на бенчмарке SWE-Bench Pro для сложных инженерных задач. Результат 58,4 балла оказался выше, чем у GPT-5.4 (57,7), Claude Opus 4…
Z.ai выпустили GLM-5.1 — новую флагманскую модель под MIT-лицензией, ориентированную на агентные инженерные задачи. По SWE-Bench Pro она набирает 58.4% против 57.3% у Claude Opus 4.6 и 57.7% у GPT-5.4. На NL2Repo (генерация репозиториев) GLM-5.1 обходи…
Китайская Z.ai (бывшая Zhipu AI) выпустила GLM-5V-Turbo — свою первую мультимодальную кодинг-модель. Она принимает на вход изображения, видео и текст, а на выходе генерирует рабочий код. Модель доступна через API ($1,2/$4 за 1M входных/выходных токенов…
Z.ai (разработчик серии моделей GLM) опубликовала AutoClaw — оболочку для локального запуска агента OpenClaw. По данным компании, инструмент работает без интернета, без API (интерфейс программирования приложений) ключей и без передачи данных на внешние…
Z.ai представили GLM-5 — новую open-source модель для системной разработки и long-horizon агентных задач.По сравнению с GLM-4.7 масштаб вырос с 355B (32B active) до 744B параметров (40B active). Объём предобучения увеличен с 23T до 28.5T токенов. Добав…
Z.ai выпустила GLM-4.7-Flash — облегченную версию флагмана с 30 миллиардами параметров, из которых активны только 3 миллиарда. На бенчмарке SWE-bench Verified модель набрала 59.2% — почти втрое больше, чем Qwen3-30B-A3B-Thinking (22%). Это открытая мод…
Z.ai представили GLM-4.7 — новую версию своей модели для кодинга, и апдейт получился не косметическим. Основной фокус — агентные сценарии, терминал и устойчивость на длинных задачах.По бенчмаркам рост выглядит вполне предметно: SWE-bench Verified …
Китайская Zhipu AI выпустила GLM-4.7 — новую флагманскую модель с фокусом на программирование и агентные задачи. По заявлениям компании, на бенчмарке LiveCodeBench V6 модель набрала 84.8 балла, обойдя Claude Sonnet 4.5. На математическом AIME 2025 GLM-…
Что завезли: окно контекста теперь не 128k, а 200k токенов (можно загружать целую диссертацию и ещё место останется). Кодинг стал бодрее — модель не только щёлкает бенчмарки, но и в реальных сценариях типа Claude Code и Roo Code показывает себя отлично…