OpenAI выпустила Sora 2 — обновлённую модель генерации видео, которую компания называет “GPT-3.5 моментом для видео”, в отличие от оригинальной Sora, которая была скорее “GPT-1 моментом”. Модель теперь создаёт видео длительностью до 10 секунд с синхронизированным аудио (голоса, звуковые эффекты, фоновые звуки), причём OpenAI особо подчёркивает, что модель значительно лучше понимает физику реального мира.
Для дистрибуции модели OpenAI запускает отдельное iOS-приложение Sora, которое по сути является социальной сетью для AI-видео, аналогом TikTok, но где весь контент создан исключительно искусственным интеллектом. OpenAI заявляет, что беспокоится о “doomscrolling” и зависимости от социальных сетей, но при этом запускает именно социальную сеть. Плюс подход к авторским правам довольно спорный — правообладатели должны сами писать об удалении своего контента (opt-out), а не давать разрешение (opt-in). На презентации авторы модели, впрочем, предупредили, что очень серьезно подошли к модерации и будут делать это скорее консервативно, не обижайтесь, мол.
Доступ по приглашениям — сначала получат активные пользователи Sora 1 и подписчики ChatGPT Pro, затем Plus и Team, и в итоге все остальные. Android-версия обещана позже. Раскатывать начинают с США и Канады, но собираются быстро сделать доступным и остальным странам. Пока использование бесплатно с “щедрыми лимитами”.