I
Уніфіковане авторегресійне моделювання для візуальної генерації
C
Симуляція світів на основі просторових контрольних параметрів
R
Єдина інфраструктура для дистиляції моделей дифузії відео
C
Зручний набір метрик для оцінки якості згенерованих відео
S
Масштабний набір даних для відео з просторовою розміткою
F
Рішення для покращення ініціалізації в моделях дифузії відео
A
Добірка досліджень щодо застосування навчання з підкріпленням у відеогенерації
C
Масштабована генерація синтетичних даних для навчання безпілотного транспорту
O
Мультимодальний датасет для 4D-моделювання світу
F
Генерація реалістичних відеопортретів за допомогою аудіо
V
Взаємна оптимізація відео та 4D-генерації
J
Офіційна реалізація архітектури JavisDiT для генерації відео
L
Модель для перенесення акторської гри на персонажів
V
Генерація 3D-сцен з відео за допомогою дифузійних моделей
H
Офіційний інструментарій для генерації відео з людиною
T
Швидкісна генерація відео за текстовим описом
A
Добірка досліджень з фізичного розуміння у відеогенерації
V
Стохастичне прогнозування відео для складних сценаріїв
L
Створення 3D-сцен з текстовим описом на основі відео
P
Тестування фізичної обізнаності генеративних відеомоделей
D
Зручний інтерфейс для паралельної генерації зображень та відео
T
Фреймворк для генерації довгих відео з високою якістю
H
Інноваційна технологія для реалістичної анімації портретів
K
Відкритий фреймворк для редагування відео за допомогою текстових інструкцій
M
Дифузійна архітектура для створення відео з мовцем
V
Агентна система для оцінки якості відеогенерації
A
Головний хаб знань про модель Sora від OpenAI
B
Розширення меж відео за допомогою інтелектуального доповнення
R
Навчання моделей світу з використанням підкріплення
A
Анімація 3D-моделей на основі відеопотоків
K
Масштабний набір даних для покращення узгодженості відео
V
Синтез відеокадрів на основі глибинного навчання
L
Оживлення статичних зображень за допомогою текстових команд
S
Професійна анімація персонажів на основі аналізу пози
M
Відеосинтез на основі мультимодальних вхідних даних
V
Вивчення фізики для генерації відео через реляційне узгодження
K
Багатомовна модель для генерації відео за текстовим описом
D
Генерація відео з урахуванням динаміки обʼєктів
A
Огляд сучасних методів аналізу та розуміння відео
A
Прискорення відеогенерації за допомогою адаптивного кешування
V
Підвищення якості відео за допомогою текстових моделей
C
Перенесення руху у відео за заданими умовами
L
Повний цикл створення відео від сценарію до монтажу
M
Інверсія руху для кастомізації відео
E
Симулятор ендоскопії на основі генеративних моделей
H
Каузальна генерація відео для доповненої реальності
K
Генерація відео на основі тексту та зображень
I
Створення відео зі збереженням аудіовізуальної ідентичності
P
Генерація відео з урахуванням фізичних симуляцій
V
Ланцюжок візуальних думок для розуміння відео