Талант ChatGPT продвигает генеративные сервисы еще дальше, создавая модель ИИ под названием Sora, которая может превзойти существующие технологии, судя по уже полученным образцам видео.
После того как генераторы изображений и чат-боты уже вошли в потребительский и деловой мир, следующим этапом развития генеративного ИИ станет создание видеоконтента, которое получило значительное развитие за последние два года. В 2022 году Google представила свою первую модель синтеза изображений Imagen Video, которая генерирует короткие видеоролики 1280 x 768 по текстовым подсказкам с качеством пульсации, а в январе этого года была представлена Lumiere. А в марте прошлого года стартап Runway представил свою модель синтеза видео Gen2, которая может генерировать двухминутные ролики. Компания Stability AI также выпустила свой собственный продукт — Stable Video Diffusion. Однако все эти технологии объединяет то, что они ограничены в своих возможностях, а также в качестве и длине создаваемого видео.
Вместе с OpenAI, которая после январских слухов официально анонсировала собственную модель ИИ для создания видео с движением, Sora (в переводе с японского — небо). Модель диффузионного ИИ, использующая архитектуру трансформатора, подобную ChatGPT, весьма универсальна: она может не только создавать видеоклипы высокого разрешения по простым текстовым подсказкам, но и работать с неподвижными изображениями и загружать кадры из существующих видео. Пока это не более чем одноминутные ролики.
Модель пока доступна лишь небольшой группе тестеров, которые рассматривают такие аспекты, как дезинформация и предвзятость. Компания пока не предоставляет никаких услуг и не проводит тестирование, помимо 10 образцов, размещенных на ее сайте, и планирует опубликовать технический документ с подробным описанием технологии на следующей неделе. Когда он станет общедоступным, неизвестно, но пока анонс будет сопровождаться доступом к решению более широкого круга внешних тестировщиков безопасности.
Первые отзывы экспертов говорят о том, что новое решение действительно является очень многообещающим шагом вперед — подробнее на сайте HWSW.
Last modified: 17.02.2024