Согласно твиту, ретвитнутому Маском, голосовой режим Grok теперь поддерживает доступ к камере для идентификации контента. Позволяет пользователям направить свой телефон на что-либо и спросить: «На что я смотрю?». Возможности Vision на iOS позволяют чат-ботам анализировать реальные объекты, текст и окружающую среду в режиме реального времени с помощью камеры устройства. Пользователи могут сканировать что угодно, включая продукты, логотипы, документы и т. д., и Grok немедленно предоставит контекстную информацию и релевантную информацию.
Все комментарии