OpenAI, американская научно-исследовательская компания, занимающаяся разработками в области искусственного интеллекта, представила инструмент, генерирующий видео из текстовых тэгов, сообщается в блоге организации.
«Мы учим ИИ понимать и моделировать физический мир в движении», — говорится в сообщении. Конечная цель создания инструмента — обучение моделей, которые помогут людям взаимодействовать при решении проблем в реальном мире.
Новая модель получила прозвище Sora (в честь японского слова «небо»). Пользователи задают ей тематику и стиль, на основании которых модель создает реалистичные кадры продолжительностью до минуты.
Sora также может создавать видео на основе неподвижного изображения или дополнять существующие кадры новым материалом.
Одно первоначальное видео было создано на основе такой подсказки: «Трейлер фильма, показывающий приключения 30-летнего космонавта в красном шерстяном вязаном мотоциклетном шлеме, голубое небо, соленая пустыня, кинематографический стиль, кадр на 35-миллиметровой пленке яркие цвета».
«Мы будем привлекать политиков, преподавателей и художников по всему миру, чтобы понять их проблемы и определить положительные примеры использования этой новой технологии», — говорится в сообщении компании.
В блоге также отмечается, что, несмотря на обширные исследования и тестирование, пока трудно предсказать все полезные способы использования технологии и злоупотребления ею. Организация подчеркивает, что обучение на основе реального использования является важнейшим компонентом создания и выпуска все более безопасных систем искусственного интеллекта.
Доступ к Sora открыт нескольким исследователям и создателям видео.