Ритейл
Крупный российский импортер и дистрибьютор алкоголя, владелец сети винотек и онлайн-магазина.
Клиент обратился с запросом на создание видеоролика с использованием нейросетевых технологий. Основное требование — добиться высокого уровня реалистичности, чтобы визуально ролик не отличался от традиционной съёмки.
Дополнительные условия:
Задача требовала не просто генерации видеоконтента, а комплексного подхода с участием нескольких инструментов и ручной доработкой на каждом этапе.
Нейросети не могут сразу выдать готовый, реалистичный ролик по одному запросу. Чтобы добиться нужного качества, нужно было собрать пошаговый процесс из разных инструментов.
Каждый этап решал свою задачу: один — для генерации изображений, другой — для анимации, третий — для обработки деталей, четвёртый — для звука и финального монтажа.
Такой подход помог нам контролировать результат на каждом шаге и избавиться от типичных проблем нейросетей: искажённой формы объектов, неправильного освещения и «плывущих» текстур.
Проект начался с обсуждения сценария и визуального посыла. Концепция была простой, но требовала особой подачи: товар клиента — как часть северного пейзажа, живущая в атмосфере холода, чистоты и силы.
Для сторителлинга использовали ChatGPT — с его помощью составили базовый нарратив и эмоцию, которую должен вызывать ролик. На этом же этапе согласовали референсы, стили и мизансцены, подготовили moodboard с помощью Midjourney.
Мы сгенерировали раскадровку вручную, опираясь на утверждённую концепцию. Каждый кадр проходил следующие этапы:
Сложность:
Одним из главных требований клиента было точное отображение товара — с правильной формой, этикеткой, текстом и цветом. Это оказалось самой сложной частью проекта.
Дело в том, что нейросети пока не умеют точно повторять конкретные объекты по фотографии. Даже если загрузить в систему реальное фото объекта, она не может воспроизвести его без искажений: меняется форма, "плывёт" шрифт, нарушаются пропорции и детали.
Чтобы решить эту задачу, мы пошли в обход. Сначала сгенерировали серию 3D-изображений объекта с разным освещением и ракурсами, максимально похожих на оригинал. Затем вручную доработали их в Photoshop, объединили с другими элементами сцены (фоном, палубой, логотипами) и вписали в каждый кадр так, чтобы итоговое изображение выглядело естественно и реалистично.
Когда все ключевые кадры были готовы, мы перешли к их анимации.
Для этого использовали нейросети Kling и VEO-3 — они умеют превращать статичные изображения в короткие видеофрагменты с реалистичным движением.
С их помощью мы:
Так изображения превратились в полноценные видеосцены.
Когда все анимированные сцены были готовы, мы собрали их в единую последовательность в Adobe Premiere Pro.
На этом этапе вручную настраивали:
Звук тоже стал важной частью ролика — он усиливает общее впечатление. В Ableton Live мы собрали звуковую дорожку из нескольких слоёв:
На последнем этапе мы собрали финальную версию ролика, провели рендеринг и подготовили файлы под нужные форматы
За 5 дней мы собрали AI-видеоролик, который полностью соответствовал требованиям по стилю, атмосфере и качеству.