Подписаться
Опубликовано

Исследование Стенфорда: мультимодальные модели...

Автор
  • Имя
    Новости AI и AI разработки | GPT, Chat GPT, Claude, Cursor, Codex
    Telegram

Исследование Стенфорда: мультимодальные модели могут имитировать зрение без анализа изображений

Ученые выяснили, что современные модели вроде Claude и GPT сохраняют до 80% точности в тестах, даже если полностью убрать изображение из запроса. Оказалось, что ИИ часто находит текстовые подсказки в самих вопросах и конструирует логический ответ на основе закономерностей в тексте, а не реального анализа картинки.

Это явление назвали миражным мышлением. Продуктовым командам стоит учитывать это при внедрении визуальных функций, так как модель может выдавать уверенные ответы, на самом деле не «видя» объект.

Ссылка: https://arxiv.org/abs/2603.21687 @AIandproducts

Новости AI и AI разработки | GPT, Chat GPT, Claude, Cursor, Codex
193 подписчика
440 постов
Все о разработке с помощью AI От автора @productgames Кристины Гусевой Курс по вайбкодингу: https://pgcaseclub.com/vibecoding

Свежие посты