Ainergy протестировал скорость транскрибации аудио моделью WhisperX

Статьи и обзоры

Ainergy протестировал скорость транскрибации аудио моделью WhisperX

22.04.2025

Разработчик AI BPA платформы Ainergy протестировал скорость распознавания и преобразования речи в текст с использованием нейросетевой модели WhisperX

Результатом исследования стало достижение высокого темпа обработки аудиофайлов — 9,5 секунд на одну минуту аудио.

В ходе исследования платформа Ainergy с предустановленной LLM обработала аудиофайл продолжительностью 8 минут всего за 1 минуту 12 секунд. Такая высокая производительность возможна благодаря нейросетевому механизму обработки аудиофайлов. Модель WhisperX преобразует аудио в текст через несколько этапов: сначала звук разбивается на сегменты и превращается в спектрограмму — визуальное представление звуковых частот и амплитуд. Архитектура на основе трансформеров обрабатывает эти данные: кодировщик выделяет акустические паттерны (фонемы, интонации), а декодировщик формирует из них слова, учитывая контекст.

«Полученные результаты демонстрируют высокий потенциал технологии WhisperX в решении задач по обработке аудиоданных. Достигнутая скорость обработки открывает новые возможности для наших клиентов в различных секторах бизнеса», — отмечает Владимир Молодык, генеральный директор Ainergy.

Ainergy продолжает совершенствование технологий обработки аудиоданных. Уже сейчас проводится тестирование новой версии модели Whisper, которая потенциально может ускорить время обработки запросов в два раза, по сравнению с текущими показателями.

Подписывайтесь на наши новости в Telegram: https://t.me/idexpert

Читайте нас на VK: https://vk.com/idexpert_ru

Источник: Пресс-служба Ainergy

Рейтинг статьи

Оставить комментарий

Возврат к списку

Материалы по теме:

Статьи и обзоры

Почему ИИ «не взлетает» и где бизнес ломает внедрение
На практике большинство AI-проектов буксует уже после пилота
Oт физической к цифровой безопасности на производстве
Вклад робототехники и ИИ в обеспечение безопасности на производственных предприятиях
Топ-15 трендов в сфере AgroTech
Дроны, блокчейн, IoT и автоматизированные системы управления цепочками поставок
Цифровая трансформация «последней мили» доставки
Интернет вещей, искусственный интеллект и беспилотные системы повышают эффективность доставки
Положительный клиентский опыт, как путь к успеху
Опыт эффективной трансформации пользовательского опыта в Альфа-Банке

Новости рынка и технологий

«М.Видео» инвестирует в развитие ИИ и цифровые сервисы
9 млрд рублей будут направлены на дальнейшую цифровую трансформацию компании, повышение эффективности операционной деятельности и развитие клиентских сервисов
Беспилотные карьерные самосвалы пройдут тестирование на Чукотке и в Бурятии
В Чукотском автономном округе и Республике Бурятия в рамках экспериментального правового режима (ЭПР) начнется использование беспилотных карьерных самосвалов для перевозки горных пород
На полях ПМЭФ был продемонстрирован широкий спектр российской робототехники
Компания «Электромотив» привезла сразу две автономные новинки: робота-инспектора для охраны периметров, способного заменить до трех патрульных, и робота-сборщика для садов
AI VK проведет митап по рекомендательным системам
Команда AI VK анонсировала RecSys Meetup, мероприятие по рекомендательным системам и технологиям персонализации 1 июля в Москве
«Ростелеком» объединяет разработчиков для промышленного внедрения искусственного интеллекта
«Ростелеком» создает Центр масштабирования искусственного интеллекта (ЦМИИ) — открытый консорциум, который объединит инфраструктуру, технологии, экспертизу и рыночные потребности для промышленного внедрения ИИ-решений в ключевых отраслях российской экономики

Продукты автоматической идентификации

RST-BOOKOS-HF Настольный HF RFID считыватель для работы на частоте 13.56 МГц	RST-REPORT ПО для построения отчетов о работе RFID-системы	UHF RFID метка BiblioTag UHF RFID метка для маркировки архивных документов и книжных изданий
Chainway MC62 Высокопроизводительный мобильный компьютер промышленного класса	RST-INVENTORY ПО для проведения инвентаризации с помощью мобильного RFID считывателя	Chainway R1 Высокопроизводительный считыватель / записывающее устройство с возможностью считывания в HF и UHF диапазонах
DASCOM DC-240 Карточный принтер с технологией прямой термопечати	UHF RFID метка TwinTag UHF RFID метка для маркировки широкого спектра товаров в розничной торговле	Chainway C61 Надежный терминал сбора данных нового поколения