Логин
 
 
 
 

Статьи и обзоры



 
 
XI Форум Auto-ID & Mobility - решения для бизнеса

Ainergy протестировал скорость транскрибации аудио моделью WhisperX

22.04.2025

Разработчик AI BPA платформы Ainergy протестировал скорость распознавания и преобразования речи в текст с использованием нейросетевой модели WhisperX

Результатом исследования стало достижение высокого темпа обработки аудиофайлов — 9,5 секунд на одну минуту аудио.

В ходе исследования платформа Ainergy с предустановленной LLM обработала аудиофайл продолжительностью 8 минут всего за 1 минуту 12 секунд. Такая высокая производительность возможна благодаря нейросетевому механизму обработки аудиофайлов. Модель WhisperX преобразует аудио в текст через несколько этапов: сначала звук разбивается на сегменты и превращается в спектрограмму — визуальное представление звуковых частот и амплитуд. Архитектура на основе трансформеров обрабатывает эти данные: кодировщик выделяет акустические паттерны (фонемы, интонации), а декодировщик формирует из них слова, учитывая контекст.

«Полученные результаты демонстрируют высокий потенциал технологии WhisperX в решении задач по обработке аудиоданных. Достигнутая скорость обработки открывает новые возможности для наших клиентов в различных секторах бизнеса», — отмечает Владимир Молодык, генеральный директор Ainergy.

Ainergy продолжает совершенствование технологий обработки аудиоданных. Уже сейчас проводится тестирование новой версии модели Whisper, которая потенциально может ускорить время обработки запросов в два раза, по сравнению с текущими показателями.

Подписывайтесь на наши новости в Telegram: https://t.me/idexpert 

Читайте нас на VK: https://vk.com/idexpert_ru

Источник:  Пресс-служба Ainergy


Рейтинг статьи

Возврат к списку



Материалы по теме:

Статьи и обзоры
Новости рынка и технологий

Продукты автоматической идентификации

RST-BOOKOS-HF
RST-BOOKOS-HF
Настольный HF RFID считыватель для работы на частоте 13.56 МГц
RST-REPORT
RST-REPORT
ПО для построения отчетов о работе  RFID-системы
UHF RFID метка BiblioTag
UHF RFID метка BiblioTag
UHF RFID метка для маркировки архивных документов и книжных изданий
Chainway MC62
Chainway MC62
Высокопроизводительный мобильный компьютер промышленного класса
RST-INVENTORY
RST-INVENTORY
ПО для проведения инвентаризации с помощью мобильного RFID считывателя
Chainway R1
Chainway R1
Высокопроизводительный считыватель / записывающее устройство с возможностью считывания в HF и UHF диапазонах
DASCOM DC-240
DASCOM DC-240
Карточный принтер с технологией прямой термопечати
UHF RFID метка TwinTag
UHF RFID метка TwinTag
UHF RFID метка для маркировки широкого спектра товаров в розничной торговле
Chainway C61
Chainway C61
Надежный терминал сбора данных нового поколения

Все продукты >>>

 
XI Форум Auto-ID & Mobility - решения для бизнеса

Проекты и решения

События

Опрос





Комментарии