Поиск
| ||
| ||
Статьи и обзоры |
Ainergy протестировал скорость транскрибации аудио моделью WhisperX
22.04.2025
Разработчик AI BPA платформы Ainergy протестировал скорость распознавания и преобразования речи в текст с использованием нейросетевой модели WhisperX Результатом исследования стало достижение высокого темпа обработки аудиофайлов — 9,5 секунд на одну минуту аудио.В ходе исследования платформа Ainergy с предустановленной LLM обработала аудиофайл продолжительностью 8 минут всего за 1 минуту 12 секунд. Такая высокая производительность возможна благодаря нейросетевому механизму обработки аудиофайлов. Модель WhisperX преобразует аудио в текст через несколько этапов: сначала звук разбивается на сегменты и превращается в спектрограмму — визуальное представление звуковых частот и амплитуд. Архитектура на основе трансформеров обрабатывает эти данные: кодировщик выделяет акустические паттерны (фонемы, интонации), а декодировщик формирует из них слова, учитывая контекст. «Полученные результаты демонстрируют высокий потенциал технологии WhisperX в решении задач по обработке аудиоданных. Достигнутая скорость обработки открывает новые возможности для наших клиентов в различных секторах бизнеса», — отмечает Владимир Молодык, генеральный директор Ainergy. Ainergy продолжает совершенствование технологий обработки аудиоданных. Уже сейчас проводится тестирование новой версии модели Whisper, которая потенциально может ускорить время обработки запросов в два раза, по сравнению с текущими показателями. Подписывайтесь на наши новости в Telegram: https://t.me/idexpert Читайте нас на VK: https://vk.com/idexpert_ru Источник: Пресс-служба Ainergy Рейтинг статьи ![]()
Оставить комментарий
Материалы по теме:
Статьи и обзоры
Новости рынка и технологий
Продукты автоматической идентификации
Все продукты >>> |
Проекты и решенияСобытияОпросКомментарии |
© 2009, ID-EXPERT Cообщество профессионалов в области ID Является средством массовой информации (18+) Разработка сайта "Агентство АСДК" |
|