A
Швидкий переклад відео з синхронізацією губ
E
Готовий застосунок для транскрибації аудіо та відео
W
Експериментальний інструмент перекладу мовлення під час відеодзвінків
S
Швидка генерація субтитрів для ваших відео
V
Автоматичний переклад відео з озвученням та субтитрами
W
Швидка транскрипція та переклад голосу на текст
T
Локальний інструмент для швидкого транскрибування аудіо
D
Студія нейронного клонування голосу на базі SV2TTS
P
Інструменти для створення корпусів мовлення з відео
S
Автоматичні субтитри для ваших стрімів в OBS
T
Базовий зразок для перетворення тексту на відеоозвучку
I
Платформа з відкритим кодом для створення субтитрів
A
Зручний редактор аудіо з функцією автоматичного перетворення мовлення на текст
T
Безкоштовна кросплатформова програма для редагування субтитрів
A
Створення надточних автоматичних субтитрів для відео
I
Керована генерація відео з інтерактивними мультимодальними інструкціями
U
Уніфікована система для локалізованого стилізації відео без додаткового навчання
A
Добірка найкращих досліджень щодо дифузійної генерації високої якості
R
Надійне моделювання реального світу для автономного водіння
A
Систематизований перелік досліджень інтерактивних моделей світу
C
Контекстуалізована дифузія для створення тексту та відео
F
Налаштування відеоконтенту на основі першого кадру
C
Усунення контентного зміщення у метриці якості відео FVD
V
Єдина система для редагування відео з часовим аналізатором
V
Офіційна реалізація імпліцитних дифузійних відеомоделей
I
Занурювальна генерація панорамного відео 360 градусів
G
Поєднання відеодифузії та 3D-представлення для стабільного моделювання світу
D
Інструмент для перенесення рухів за текстовим описом на основі дифузії
M
Масштабовані світові моделі для мультиагентних систем
F
Редагування відео з використанням оптичного потоку та уваги
C
Бенчмарк для оцінки якості створення відео з таймлапсом
J
Бібліотека для генерації контенту на базі Jittor
T
Створення живих фотографій за допомогою текстового опису
V
Точний контроль руху у відеогенерації
S
Покращення якості відео через часово-узгоджений апскейлінг
E
Авторегресивна дифузійна модель для автономного водіння
O
Відкрита бібліотека моделей для моделювання процесів керування автомобілем
O
Кастомізація відео з мультимодальним керуванням суб'єктами
C
Генерація відео на основі зображень з використанням потокових моделей
V
Актуальний перелік досліджень у сфері генерації відео
F
Високоякісна генерація відео з акцентом на деталізацію та швидкість
F
Покращена анімація портретів з емоційним керуванням
M
Персоналізація відео за допомогою ID-специфічної дифузії
N
Мінімалістична та функціональна платформа для розвитку світових моделей
D
Інноваційна трансформація зображень на базі дифузійних моделей
G
Генеративне компонування відео на основі дифузійних трансформерів
A
Інструмент для довільного за тривалістю відеоінпейнтингу
M
Мультимодальна дифузійна модель для спільної генерації звуку та відео
O
Універсальна модель для створення відео з взаємодією людей та об'єктів
E
Ефективна генерація відео через офіційну реалізацію PyTorch