- Опубликовано
Новый стандарт качества: почему ИИ-код пока не...
- Автор
- Имя
- Новости AI и AI разработки | GPT, Chat GPT, Claude, Cursor, Codex
- Telegram
- Новости AI и AI разработки | GPT, Chat GPT, Claude, Cursor, Codex193 подписчика516 постовВсе о разработке с помощью AI От автора @productgames Кристины Гусевой Курс по вайбкодингу: https://pgcaseclub.com/vibecoding
Новый стандарт качества: почему ИИ-код пока не готов к промышленному внедрению
Новый бенчмарк FrontierCode от компании Cognition проверяет не просто работоспособность кода, но и его соответствие стандартам реальных проектов. Оказалось, что даже топовые модели набирают всего 13 баллов из 100 по критериям, которые важны для живых кодовых баз: соблюдение стиля, отсутствие лишних правок и качество тестов.
Для создателей продуктов это важный сигнал о том, насколько осторожно нужно внедрять автоматическую генерацию кода в рабочие процессы и почему ручная проверка остается необходимой.
Ссылка: https://cognition.ai/blog/frontier-code
@AIandproducts
Новости AI и AI разработки | GPT, Chat GPT, Claude, Cursor, Codex
193 подписчика
516 постов
Все о разработке с помощью AI
От автора @productgames Кристины Гусевой
Курс по вайбкодингу: https://pgcaseclub.com/vibecoding
Закрепленные
Свежие посты
- Опубликовано
Kimi запустила десктопного агента для параллельной работы
Kimi запустила десктопного агента для параллельной работыНовый инструмент от компании Kimi позволяет запускать до 300 виртуальных ИИ-сотрудников...
- Опубликовано
Google обновила NotebookLM: теперь это...
Google обновила NotebookLM: теперь это полноценный агент для исследованийСервис NotebookLM превратился из простого инструмента для чтения...
- Опубликовано
Новый стандарт качества: почему ИИ-код пока не...
Новый стандарт качества: почему ИИ-код пока не готов к промышленному внедрениюНовый бенчмарк FrontierCode от компании Cognition проверяет не...
- Опубликовано
Anthropic выпустила Claude Fable 5 — самую...
Anthropic выпустила Claude Fable 5 — самую мощную модель в линейкеКомпания Anthropic представила Claude Fable 5, первую общедоступную модель из...
- Опубликовано
Быстрое редактирование изображений на устройствах от Google
Быстрое редактирование изображений на устройствах от GoogleНовая легкая модель от Google позволяет изменять изображения прямо на смартфоне или...
- Опубликовано
Фреймворк AstrBot для подключения ИИ к мессенджерам
Фреймворк AstrBot для подключения ИИ к мессенджерамРазработчики представили открытый инструмент, который позволяет связать любые современные...
- Опубликовано
Автоматический контроль качества ответов ИИ от Iluvatar Labs
Автоматический контроль качества ответов ИИ от Iluvatar LabsСервис Actuator от Iluvatar Labs помогает следить за качеством работы нейросетей в...
- Опубликовано
Платформа Google для решения сложных корпоративных запросов
Платформа Google для решения сложных корпоративных запросовGoogle выпустила фреймворк на базе мультиагентных систем, который предназначен для...