Логин
 
 
 
 

Статьи и обзоры

Follow idexpert_ru on Twitter


 
 
XI Форум Auto-ID & Mobility - решения для бизнеса

ИИ в VK Видео улучшил распознавание речи на 25%

12.09.2024

VK Видео внедрил новые алгоритмы искусственного интеллекта для автоматического распознавания речи и синтеза субтитров в роликах, шоу, клипах и другом контенте

Точность анализа и расшифровки выросла на 25%, кроме того, нейросети теперь знают тысячи новых слов, включая мемы, имена собственные, акронимы и профессиональные термины.

Автоматические субтитры генерируются с помощью Ml-моделей, которые создают текст и расставляют знаки препинания, синхронизируют их с видео. Для повышения точности аудиопоток проходит через несколько этапов обработки. Нейросеть отсеивает сторонние шумы, распознает речь и превращает её в текст. После чего подключаются модели пунктуации и денормализации, которые превращают набор из распознанных слов в удобный, читаемый текст. Потом ИИ синхронизирует получившийся текст с аудиодорожкой. Все это позволяет субтитрам быть понятными и удобными как в профессиональных роликах, так и любительских видео.

В ближайшее время нейросети научатся разделять речь разных спикеров на отдельные реплики, что упростит восприятие и чтение субтитров.

Популярность субтитров растет. Доля пользователей, использующих эту функцию в веб-версии, только за последний месяц увеличилась на 28%, и сейчас субтитрами пользуются 11% всей аудитории VK Видео. Технология помогает людям с нарушениями слуха, а также удобна для просмотра видео в условиях, когда звук включать нежелательно.

Подписывайтесь на наши новости в Telegram: https://t.me/idexpert 

Читайте нас на VK: https://vk.com/idexpert_ru


Источник:  Пресс-служба VK


Рейтинг статьи

Возврат к списку



Материалы по теме:

Статьи и обзоры
Новости рынка и технологий

Продукты автоматической идентификации

Chainway MC62
Chainway MC62
Высокопроизводительный мобильный компьютер промышленного класса
RST-INVENTORY
RST-INVENTORY
ПО для проведения инвентаризации с помощью мобильного RFID считывателя
Chainway URA4
Chainway URA4
4-портовый стационарный UHF RFID-считыватель на базе ОС Android 9.0
Chainway UR4
Chainway UR4
4-портовый стационарный UHF RFID считыватель
Chainway C72 UHF RFID
Chainway C72 UHF RFID
Мобильный UHF RFID считыватель на ОС Android
Chainway R1
Chainway R1
Высокопроизводительный считыватель / записывающее устройство с возможностью считывания в HF и UHF диапазонах
DASCOM DC-2300
DASCOM DC-2300
Компактный принтер для печати карт с технологией прямой термопечати
UHF RFID метка TwinTag
UHF RFID метка TwinTag
UHF RFID метка для маркировки широкого спектра товаров в розничной торговле
RST-GN-001
RST-GN-001
Портальный RFID-считыватель для регистрации RFID-меток в контролируемых проходах

Все продукты >>>

 
XI Форум Auto-ID & Mobility - решения для бизнеса

Проекты и решения

События

Опрос





Комментарии