V
VALL-E: реалізація аудіо-моделі
R
Голосове керування для вашого React-застосунку
P
Професійне розпізнавання мовлення на базі PaddlePaddle
V
Комплексний набір інструментів для виявлення мовлення
W
Створення вебзастосунків для розпізнавання мови у реальному часі
E
Професійний інструментарій для розпізнавання мовлення
V
Голосове введення тексту для Wayland
S
Відкрита платформа для створення голосових помічників
D
Глибоке навчання для задач обробки звуку
C
Інструмент для розпізнавання мовлення у режимі реального часу
C
Інструмент для нормалізації китайського тексту у завданнях розпізнавання мовлення
W
Запуск моделі Whisper у середовищі Unity3d
V
Потоковий рушій для моделей синтезу мовлення
D
Нейронний аудіокодек з низькою частотою кадрів
S
Система оцінювання якості розпізнавання мовлення
L
Локальна система потокового розпізнавання мовлення
W
Клавіатура для Android на базі моделі Whisper
V
Розпізнавання мовлення безпосередньо у браузері
E
Розпізнавання мовлення для проєктів React Native Expo
S
Відкрита бібліотека технологій розпізнавання мовлення
W
Оптимізований конвеєр перетворення мовлення на текст
F
Швидке та легке розпізнавання мовлення на C++ для ARM-пристроїв
S
Фреймворк для розпізнавання мовлення в середовищі SwiftUI
C
Компактний прототип для двосторонньої голосової взаємодії
P
Інструмент для перетворення графем у фонеми
S
Інструмент для транскрипції аудіо на Linux та Raspberry Pi
T
Просте перетворення тексту на мовлення для React-проєктів
V
Універсальний інструментарій для розпізнавання мовлення
U
Інструментарій для розпізнавання мовлення на платформі Arduino
U
Масштабована система самонавчання для аналізу мовлення
L
Локальний рушій для перетворення мовлення на текст
L
Модель для прослуховування, аналізу та розуміння аудіо
W
Високоякісний вокодер WaveGrad від Google Brain
S
Паралельна генерація аудіо на базі архітектури від Google
K
Швидкий та ефективний синтез в'єтнамської мови
B
Відкритий офлайн-інструмент для перетворення мовлення на текст бенгальською мовою
T
Зручний конвертер тексту в природне мовлення
E
EDDI: двигун AI-агентів з конфігурацією
U
Нейронний вокодер для генерації високоякісного звуку
M
Інтелектуальна обробка аудіоданих
S
Ваш персональний AI-агент
T
Застосунок для озвучення часу у британському стилі
S
Голос, що звучить як людина, через дифузію стилю
C
Миттєве визначення мінералів та кристалів за фото
S
Надшвидкий локальний синтез мовлення через ONNX
D
Потужний фреймворк для керування голосом через Python
W
Стійкі до шуму моделі для розпізнавання та класифікації звуків
T
Telegram-бот з функціями розпізнавання та синтезу мовлення
L
Легкий та швидкий синтез мовлення з нейропошуком
T
Синтез мовлення в один рядок коду