Нейросеть Grok от Илона Маска теперь может воспринимать мир визуально (фото: Getty Images)
Чат-бот Grok от компании xAI теперь может отвечать на вопросы о том, что находится в поле зрения камеры смартфона — аналогично функциям «зрения в реальном времени» у Google Gemini и ChatGPT.
Об этом сообщает РБК-Украина (проект Styler) со ссылкой на сайт новостей в сфере технологий TechCrunch.
Что известно
Во вторник компания xAI представила функцию Grok Vision, которая позволяет пользователям наводить камеру телефона на объекты — такие как товары, вывески или документы — и задавать вопросы о них. Grok Vision доступна в приложении Grok для iOS, но пока не работает на Android.
GROK CAN SEE WHAT YOU SEE—LITERALLY
Grok’s voice mode comes with camera access, letting users point their phone at something and ask, “What am I looking at?”
The Vision feature on iOS allows the chatbot to analyze real-world objects, text, and environments through your… https://t.co/cmtINP8yp6 pic.twitter.com/N1b6pcYZOi
— Mario Nawfal (@MarioNawfal) April 20, 2025
Среди других нововведений — многоязычное озвучивание и поиск в реальном времени в голосовом режиме Grok. Пользователи Android могут воспользоваться этими функциями, но только при подписке на тариф SuperGrok за 30 долларов в месяц.
Функциональность Grok расширяется стремительно. Ранее в этом месяце в Grok появилась функция «памяти», которая позволяет ИИ опираться на детали предыдущих бесед. Также был добавлен инструмент наподобие холста для создания документов и приложений.
Introducing Grok Vision, multilingual audio, and realtime search in Voice Mode. Available now.
Grok habla español
Grok parle français
Grok Türkçe konuşuyor
グロクは日本語を話す
ग्रोक हिंदी बोलता है pic.twitter.com/lcaSyty2n5— Ebby Amir (@ebbyamir) April 22, 2025