Google Gemini научился превращать обычные фото в видео с озвучкой: как это работает

2 Мин Чтения

Google Gemini превращает снимки в видео со звуком (фото: Getty Images)

Компания Google представила новую функцию в своем ИИ-сервисе Gemini — теперь пользователи могут превращать обычные фотографии в короткие видеоролики с озвучкой.

Об этом сообщает РБК-Украина со ссылкой на американский сайт о компьютерной технике The Verge.

Детали обновления

Новинка основана на видеомодели Veo 3 и позволяет создавать восьмисекундные ролики из изображений, добавляя звуковое сопровождение, включая фоновые шумы, звуки окружающей среды и даже речь.

По данным Google, обновление уже доступно подписчикам Gemini AI Ultra и Pro в «отдельных регионах». На веб-платформе функция начала развертываться сегодня, а в мобильных приложениях появится в течение недели.

Чтобы воспользоваться возможностью, нужно нажать кнопку «tools» (инструменты) в строке ввода, выбрать «video», загрузить изображение и добавить текстовое описание того, как картинка должна «ожить». Можно также указать аудиодетали — от реплик до звуковых эффектов и атмосферы. Google утверждает, что звук будет «полностью синхронизирован с изображением».

Google Gemini научился превращать обычные фото в видео с озвучкой: как это работает

Как воспользоваться новой функцией (фото: 9to5Google)

Итоговое видео формируется в формате MP4, с разрешением 720p и соотношением сторон 16:9. Все сгенерированные видео получают заметный водяной знак и невидимую цифровую метку SynthID, подтверждающую использование ИИ.

«Вы можете анимировать повседневные предметы, оживить рисунки или добавить движения к природным сценам», — отмечают в Google.

Подобный функционал уже есть в инструменте Flow — платформе для создания видео с помощью ИИ, представленной Google в марте. Теперь же пользователям Gemini не нужно открывать отдельное приложение — анимация доступна напрямую. Кроме того, Google расширяет доступ к Flow еще в 75 странах.

Поделиться этой статьей