Она позволяет создавать реалистичные видеоролики по текстовому описанию или стартовому кадру.
На международной конференции AI Journey состоялась презентация бета-версии нейросети нового поколения Kandinsky 4.0 Video от Сбер. Эта нейронка позволяет создавать реалистичные видеоролики по текстовому описанию или стартовому кадру. Kandinsky 4.0 Video доступен как обычным пользователям, так и профессионалам креативной индустрии – дизайнерам, маркетологам, мультипликаторам.
Как отметил старший вице-президент, руководитель блока «Технологическое развитие» Сбербанка Андрей Белевцев, за год с момента релиза первой версии Kandinsky Video были значительно улучшены качество и скорость генерации полноценных видеороликов, что открывает безграничные горизонты для креатива и продуктовых применений модели.
– Теперь каждый пользователь новой версии Kandinsky Video может воплотить свои идеи и выразить их в видеоформате. Мы всегда рады видеть, как наши технологии помогают людям реализовывать свои самые смелые творческие задумки, – говорит Белевцев. – При этом все ближе то время, когда искусственный интеллект будет способен решать множество задач сразу, причем с самыми разными типами данных и в разных доменах. И такие модели, как Kandinsky Video, способствуют мировому развитию в этом важном направлении, значительно приближая современные технологии к тому синергетическому уровню обработки, восприятия и создания информации, каким обладает человек.
Теперь модель генерирует видеоряд продолжительностью до 12 секунд в разрешении HD (1280x720) по любому текстовому описанию или произвольному стартовому кадру. С помощью модели можно создавать видео с разным соотношением сторон под любые пользовательские и продуктовые потребности.
Важнейшими отличительными свойствами новой модели являются улучшенное визуальное качество – высокий контраст и четкость кадров, выстраивание общей композиции сцены и реалистичность движений генерируемых объектов. Добиться такого качества позволило уникальное сотрудничество научных и инженерных команд, которые вместе работали как над развитием архитектуры новой модели, так и над сбором и фильтрацией данных для обучения.
В дополнение к основной модели команда Kandinsky представила быструю версию Kandinsky 4.0 Video Flash, которая генерирует видеоряд продолжительностью до 12 секунд в разрешении 480p (720x480) по любому текстовому описанию всего за 15 секунд.
Первыми доступ к новой версии Kandinsky Video получат представители креативных индустрий – художники, дизайнеры и кинематографисты. Для них модель будет доступна в рамках инструмента https://fusionbrain.ai/, который дает его пользователям возможность генерировать полноценные мини-фильмы – со сценарием, полноценным видеорядом и звуковым сопровождением. Для широкой аудитории нейросеть будет доступна в 1Q 2025 года.
ПАО «Сбербанк». ИНН 7707083893. Реклама