C
Інструмент для нормалізації китайського тексту у завданнях розпізнавання мовлення
A
Універсальний розпізнавач фонем для понад 2000 мов
W
Запуск моделі Whisper у середовищі Unity3d
O
Інструментарій для наскрізного розпізнавання мовлення
T
Зручний конвертер тексту в природне мовлення
G
Зручний перекладач та озвучувач тексту для Linux
L
Приклад застосунку з доповненою реальністю та навігацією
O
Інтеграція голосу OpenAI для ігрових проєктів на Unity
N
Плагін для інтеграції Coqui AI у ваші проєкти
I
Глобальний синтез мовлення для ігор та чатів
T
Синтез мовлення для перської мови
U
Нейронний вокодер для генерації високоякісного звуку
D
Реалізація моделі DNN-HSMM для синтезу мовлення
S
Відкрита бібліотека технологій розпізнавання мовлення
D
Спеціалізоване розпізнавання німецької мови
T
Швидкий та точний синтез мовлення з керуванням інтонацією
D
Високоякісний та швидкий нейронний вокодер
T
Готові сценарії для навчання моделей синтезу мовлення
N
Приватний та офлайн синтез мовлення для Android
T
Архів аудіоприкладів синтезу на базі Microsoft Edge
T
Базовий зразок для перетворення тексту на відеоозвучку
F
Реалізація моделі F5-TTS для екосистеми Apple
V
Відкрите рішення для синтезу в'єтнамської мови
C
Голосове керування для спілкування з ChatGPT
T
Простий інтерфейс для доступу до голосів TikTok
E
Самохостинговий аналог ElevenLabs для клонування голосу та генерації аудіо
L
Легкий та швидкий синтез мовлення з нейропошуком
S
Серверлесс-сервіс для озвучення статей з Medium
V
Ендо-ту-енд синтез мовлення з варіаційним автокодувальником
L
Багатомовна система миттєвого синтезу мовлення з підтримкою десяти мов
T
Реалізація Tacotron на PyTorch
A
Адаптивна озвучка тексту з унікальним голосом
W
Високоякісний вокодер WaveGrad від Google Brain
S
Ваш персональний AI-агент
E
EDDI: двигун AI-агентів з конфігурацією
M
Інтелектуальна обробка аудіоданих
S
Голос, що звучить як людина, через дифузію стилю
U
Єдиний сервіс для перетворення тексту на мовлення
B
Багатомовна бібліотека для синтезу мовлення
C
Миттєве визначення мінералів та кристалів за фото
S
Паралельна генерація аудіо на базі архітектури від Google
E
Синтез мовлення від Microsoft Edge без прив'язки до ОС
T
Потужний інструментарій для синтезу мовлення за допомогою глибинного навчання
F
Швидкий та якісний синтез мовлення для ваших проєктів
V
VALL-E: реалізація аудіо-моделі
O
Вебзастосунок для створення природного озвучування тексту
S
Інструмент для розпізнавання російськомовної мови
P
Надшвидке розпізнавання мови на C++
S
Гнучкий інструмент Wav2Vec для аналізу та класифікації мовлення
T
Високоефективний конвеєр потокового розпізнавання мовлення