Логин
 
 
 
 

Статьи и обзоры



 
 
XI Форум Auto-ID & Mobility - решения для бизнеса

ИИ в VK Видео улучшил распознавание речи на 25%

12.09.2024

VK Видео внедрил новые алгоритмы искусственного интеллекта для автоматического распознавания речи и синтеза субтитров в роликах, шоу, клипах и другом контенте

Точность анализа и расшифровки выросла на 25%, кроме того, нейросети теперь знают тысячи новых слов, включая мемы, имена собственные, акронимы и профессиональные термины.

Автоматические субтитры генерируются с помощью Ml-моделей, которые создают текст и расставляют знаки препинания, синхронизируют их с видео. Для повышения точности аудиопоток проходит через несколько этапов обработки. Нейросеть отсеивает сторонние шумы, распознает речь и превращает её в текст. После чего подключаются модели пунктуации и денормализации, которые превращают набор из распознанных слов в удобный, читаемый текст. Потом ИИ синхронизирует получившийся текст с аудиодорожкой. Все это позволяет субтитрам быть понятными и удобными как в профессиональных роликах, так и любительских видео.

В ближайшее время нейросети научатся разделять речь разных спикеров на отдельные реплики, что упростит восприятие и чтение субтитров.

Популярность субтитров растет. Доля пользователей, использующих эту функцию в веб-версии, только за последний месяц увеличилась на 28%, и сейчас субтитрами пользуются 11% всей аудитории VK Видео. Технология помогает людям с нарушениями слуха, а также удобна для просмотра видео в условиях, когда звук включать нежелательно.

Подписывайтесь на наши новости в Telegram: https://t.me/idexpert 

Читайте нас на VK: https://vk.com/idexpert_ru


Источник:  Пресс-служба VK


Рейтинг статьи

Возврат к списку



Материалы по теме:

Статьи и обзоры
Новости рынка и технологий

Продукты автоматической идентификации

UHF RFID метка BiblioTag
UHF RFID метка BiblioTag
UHF RFID метка для маркировки архивных документов и книжных изданий
RST-SPEEDWARE
RST-SPEEDWARE
ПО для сбора информации со считывателей и сохранения ее в базе данных
Тау Браузер
Тау Браузер
Специализированный браузер для легковесных HTML/JavaScript приложений
Chainway P100
Chainway P100
Высокопроизводительный промышленный планшет с поддержкой 5G
RST-REPORT
RST-REPORT
ПО для построения отчетов о работе  RFID-системы
Chainway C66 UHF
Chainway C66 UHF
Надежный мобильный компьютер со встроенным RFID модулем
Chainway C72 UHF RFID
Chainway C72 UHF RFID
Мобильный UHF RFID считыватель на ОС Android
Chainway C5 UHF
Chainway C5 UHF
Универсальный высокопроизводительный ручной UHF RFID-считыватель
UHF RFID метка TwinTag
UHF RFID метка TwinTag
UHF RFID метка для маркировки широкого спектра товаров в розничной торговле

Все продукты >>>

 
XI Форум Auto-ID & Mobility - решения для бизнеса

Проекты и решения

События

Опрос





Комментарии