Логин
 
 
 
 

Статьи и обзоры

Follow idexpert_ru on Twitter


 
 
XI Форум Auto-ID & Mobility - решения для бизнеса

Человек и компьютер: им есть что сказать друг другу.

06.08.2010

«Центр речевых технологий» представил интеллектуальные технологии распознавания и синтеза речи

Вчера, 5 августа 2010 года, крупнейший российский игрок в своей области «Центр речевых технологий» представил в штаб-квартире в Петербурге новейшие разработки и технологии распознавания и синтеза речи в режиме онлайн. Топ-менеджеры компании совместно с ведущими специалистами «ЦРТ» рассказали о формировании принципиально новых ниш на рынке речевых технологий в Интернете и дали свои прогнозы относительно возможностей их применения в мобильном Интернете.

Генеральный  директор компании «ЦРТ» Михаил Хитров, говоря об основных трендах развития отрасли, назвал голосовую биометрию и технологии синтеза и распознавания речи наиболее прорывными и коммерчески перспективными направлениями деятельности: «Сейчас наука и технологии доросли до того уровня, чтобы реализовывать такие проекты в промышленном масштабе. Не менее важно и то, что потребители стали психологически готовы пользоваться подобными услугами».

Напомним, что «ЦРТ» – единственная в России компания полного производственного цикла, разработавшая собственные технологии синтеза и распознавания русской речи.  В последние годы данные системы стали доступны пользователям как  в виде комплексных решений по голосовому самообслуживанию в крупных коммерческих и государственных структурах, так и в виде отдельных сервисов, которые можно интегрировать в колл-центры или интернет-порталы (про разработки в области автоматизации колл-центров и синтезированной речи в системах голосового самообслуживания – см. материал раздела «Центр речевых технологий»).

Рынок интернет-технологий во многом новый для компании сектор, однако в нем уже реализованы первые проекты. Руководитель отдела распознавания речи Кирилл Левин рассказал, что «на сегодняшний день основные усилия разработчиков сконцентрированы на развитии автоматических информационно-справочных систем, речевой аналитике и распознавании речевых команд при управлении электронными устройствами». Вчера компания продемонстрировала свои три главные разработки за последнее время.

Во-первых, это технология навигации Speak-to-Click, обеспечивающая удобный серфинг по сайтам в Сети с помощью голоса. «Приложение анализирует страницу, выявляет все активные ссылки и подбирает нужную грамматику запроса. Пользователю остается лишь назвать интересующий его раздел, и переход осуществится автоматически. Сейчас технология успешно тестируется на ряде сайтов, и мы надеемся, что в ближайшее время она выйдет на массовый рынок», – заявил менеджер проекта Вадим Васильченко.

Не менее интересным для конечного пользователя может оказаться второе ноу-хау компании – сервис распознавания речи в геоинформационных системах (ГИС), позволяющий прокладывать маршруты  в электронных картах при голосовом указании адреса объекта. «Приложение будет интегрировано в стандартный пакет интернет-карт, что позволит сделать его доступным всем без исключения пользователям, в том числе и тем, кто использует мобильные версии для телефонов и смартфонов. Технологию поиска ближайших объектов и прокладка маршрутов будет осуществляться разработчиками карт, мы же, в свою очередь, обеспечиваем технологию голосового распознавания и синтеза названий этих объектов. Таким образом, работая вместе, мы открываем перед пользователями такие уникальные возможности», – пояснили разработчики из «ЦРТ».

По данным аналитиков, 11 % пользователей Рунета предпочитают прослушивать новости, нежели просматривать видео или читать текстовые файлы. При этом в сегментах деловой и развлекательной информации наблюдается существенное преобладание именно текстового формата. В связи с этим в «ЦРТ» был создан первый в Рунете сервис по озвучиванию текстового контента – VitalVoice web service, который автоматически преобразовывает текстовые файлы, доступные на сайте, в естественно звучащую русскую речь. Коммерческий запуск проекта состоится осенью 2010 г. и позволит блогерам и владельцам сайтов предоставлять пользователям аудиоверсии новостей. Стоимость использования сервиса, по словам менеджера проекта Михаила Ильюшина, будет варьироваться от 450 рублей (8 сообщений в месяц) до 40 тыс. рублей для крупных информационных порталов с ежемесячной озвучкой 600-800 сообщений в месяц.

Источник:  http://www.spbit.ru


Рейтинг статьи

Возврат к списку



Материалы по теме:

Статьи и обзоры
Новости рынка и технологий

Продукты автоматической идентификации

RST-BOOKOS-HF
RST-BOOKOS-HF
Настольный HF RFID считыватель для работы на частоте 13.56 МГц
RST-GN-001
RST-GN-001
Портальный RFID-считыватель для регистрации RFID-меток в контролируемых проходах
DASCOM DC-2300
DASCOM DC-2300
Компактный принтер для печати карт с технологией прямой термопечати
UHF RFID метка BiblioTag
UHF RFID метка BiblioTag
UHF RFID метка для маркировки архивных документов и книжных изданий
Chainway P100
Chainway P100
Высокопроизводительный промышленный планшет с поддержкой 5G
Chainway MC62
Chainway MC62
Высокопроизводительный мобильный компьютер промышленного класса
DASCOM DC-240
DASCOM DC-240
Карточный принтер с технологией прямой термопечати
Chainway MC21
Chainway MC21
Терминал сбора данных промышленного класса
Chainway C5 UHF
Chainway C5 UHF
Универсальный высокопроизводительный ручной UHF RFID-считыватель

Все продукты >>>

 
XI Форум Auto-ID & Mobility - решения для бизнеса

Проекты и решения

События

Опрос





Комментарии