Тесты цифровой техники

     
 

Речевые технологии нацелились на Интернет

Вчера, 5 августа 2010 года, компания «Центр речевых технологий», международный разработчик систем в сфере высококачественной записи, обработки, анализа, синтеза и передачи речевого сигнала, представила в Петербурге планы по выводу на рынок новых программных продуктов, ориентированных на использование в сети Интернет. В частности, было рассказано о системе голосового управления сайтом, сотрудничестве с одной из крупнейших российских интернет-компаний и решении для озвучивания текстового контента интернет-порталов. Последняя инициатива, в сущности, означает выход компании на новый для нее рынок физлиц.

Напомним, что компания «Центр речевых технологий» (ЦРТ) была создана в Петербурге в 1990 году и на данный момент  реализует свои решения в 64 странах мира, располагает широкой дилерской сетью и осуществляет поставки в 150 городов России. Штат компании в настоящее время превышает 250 сотрудников. Компания демонстрирует стабильный рост: как отметил Михаил Хитров, генеральный директор ЦРТ, несмотря на тот факт, что экономический кризис привел к падению ИТ-рынка в целом на 14 %, ЦРТ за 2009 год выросла на 12 %.   

Г-н Хитров выделил ряд направлений, которые в компании считают «прорывными». Среди них - голосовая биометрия, например, национальные системы фоноучета и голосового поиска, голосовая верификация и идентификация и голосовой контроль доступа. Также к «прорывным» были отнесены такие речевые технологии, как голосовое самообслуживание и синтез и распознавание.

Будущее развития речевых технологий в ЦРТ связывают с интернет-рынком, для которого сейчас активно создаются новые решения. В частности, вчера был представлен сервис серфинга по интернет-сайтам с помощью голоса: перемещаться по сайтам можно, произнося названия разделов или зачитывая любые активные ссылки на странице. Технология основана на распознавании и синтезе русской речи. Напомним, что впервые услуга «Русский сайт» была продемонстрирована на выставке «Связь-Экспокомм-2010». Представителями компании была продемонстрирована работа сервиса на портале www.gosuslugi.ru.  

Представители компании рассказали, что собственно внедрение данного сервиса осуществляется весьма просто – это займет у web-мастера около получаса. Однако на данный момент на портале www.gosuslugi.ru ведется закрытое тестирование сервиса – запуск в эксплуатацию зависит от партнера ЦРТ компании «Армада», создателя портала госуслуг. В ЦРТ уверены, что данный сервис будет интересен крупным компаниям, таким  как банки и т.д.

Еще один сервис, представленный на мероприятии, - распознавание речи в геоинформационных сервисах. Это клиент-серверное решение, которое позволяет задать конечную точку маршрута, найти адрес или городской объект с помощью голосового запроса. Особенностью решения является объем словаря для каждого уровня запросов – 1 тысяча слов (1 тысяча названий ресторанов, 1 тыс. названий театров и так далее), тогда как для call-центра, например, достаточно 200 слов. Сейчас в тестовую эксплуатацию запущен сервис в партнерстве с одной из крупнейших российских интернет-компаний - версия для мобильных устройств на ОС Symbian, в дальнейшем появятся версии и для других ОС. Также ведутся переговоры с другими компаниями, в том числе – со специализирующимися на GPS-навигации, однако их названия в ЦРТ пока не готовы озвучить.

Компания ЦРТ также анонсировала запуск web-сервиса синтеза речи, с помощью которого владельцы сайтов, а также блоггеры смогут озвучить собственный текстовый контент. В ЦРТ позиционируют данный сервис как первый в Рунете, однако ранее в русскоязычном сегменте Интернета был представлен сервис uBot (его можно было протестировать, например, на данном портале), также позволявший транслировать текстовую информацию в виде звуковых файлов, а также загружать ее на различные медианосители. Однако при этом uBot не являлся полностью российской разработкой – он появился на российском рынке благодаря партнерству команды Михаила Задворного с лабораторией Odiogo, Inc.  Блоггерам данный сервис предоставлялся бесплатно, а монетизацию планировалось осуществлять за счет сотрудничества с новостными порталами и внедрения рекламных блоков в аудиоленту.

Михаил Ильюшин, менеджер по продукту, так прокомментировал ситуацию: «Сейчас uBot приостановил работу. Мы планируем работать с ними совместно, использовать их опыт и наши технологии и в дальнейшем будут совместные проекты, хотя вопросы сотрудничества пока не обсуждались. Рынок еще не подготовлен, но формировать его легче сообща. При этом не обязательно «толкаться локтями» - мы будем помогать друг другу развиваться».   

Михаил Булыгин, директор по развитию, высказал несколько иную точку зрения на взаимоотношения с командой uBot: «Реально пока говорить не о чем. Мы стараемся все решение целиком иметь у себя – это наша политика с самого начала присутствия на рынке. Мы пытаемся таким образом минимизировать собственные риски. Нашим преимуществом должно стать качество решения. Кроме того, пока неясно, кто готов слушать новости с мобильного телефона – таких единицы. Мы «греем» рынок, но первыми трудно быть. Зато когда все всерьез «заработает», мы уже будет в этом».   

Для сервиса ЦРТ уже создан личный кабинет пользователя, в котором можно выбрать тариф, оптимизировать словарь под конкретную тематику и так далее. Стоимость будет варьироваться от 450 рублей до нескольких десятков тысяч. Будет и бесплатное тестовое предложение.

«Сначала будет предложение для юрлиц, а частные пользователи – вторым этапом, - рассказывает о запуске сервиса Михаил Ильюшин. - Это проба рынка, мы планируем его охватить. На массовый рынок подобные нам компании на западе смотрят мало, мы же хотим изменить ситуацию. Такой порядок запуска сервиса мы выбрали потому, что у пользователя необходимо сформировать доверие к услуге. Чтобы пользователь заинтересовался сервисом, ему необходимо его продемонстрировать – увидев на постоянно посещаемом сайте наш сервис, пользователь будет ему доверять и сам станет его использовать. Будет и рекламная кампания в Интернете. Есть и определенная группа новаторов, которые присылают нам письма и интересуются, когда появится подобная технология, в каком виде будет существовать и так далее».  

Кроме того, в рамках мероприятия были освещены особенности некоторых реализуемых проектов. Так, Михаил Булыгин рассказал о проекте по заказу администрации Петербурга. В рамках этой инициативы будет создана система самообслуживания и выдачи информации населению: часть звонков будет обрабатываться автоматически – с помощью распознавания определенных слов, облаков понятий в запросах. Оказывается, до 80 % обращений – стандартные вопросы о необходимых документах, адресах, часах приема и так далее. Таким образом будут «закрыты» до 80 % обращений в Городской мониторинговый центр: заметим, что сейчас в периоды пиковой нагрузки до 70 % потребителей просто не дозваниваются. В случае же внештатной ситуации абонент будет переключаться на оператора. Сейчас идет разработка техзадания для реализации этого проекта. Срок введения в эксплуатацию – ноябрь-декабрь текущего года. К этому времени будет реализован пилотный проект для Центрального района города. Это сложный проект, так как требуется сопряжение с оборудованием, решение административных моментов и так далее. Все делается через конкурсную основу. Далее проект будет тиражирован в другие регионы – в города-миллионники.

Также ЦРТ проводят испытания системы IVR для контакт-центров МТС и «МегаФона». Завершен проект для «ТрансКредитБанк» - функционал решения позволяет автоматически получить информацию о нахождении терминалов банка рядом с определенной станцией метро.  

Что касается направления анализа речи, то развиваться будет, прежде всего, интеллектуальная составляющая – определение границы смены темы, коррекция ошибок за счет понимания смысла, развитие алгоритмов адаптации к шуму, диктору, теме разговора. Кроме того, Кирилл Левин пообещал, что в ближайшее время система сможет правильно расставлять точки и запятые. 

Перспективы развития технологии синтеза речи, о которых рассказывал представитель ЦРТ Андрей Таланов, связаны с качественным чтением не только специально ориентированных текстов, но и текстов общей направленности, в том числе и художественных, на основе выполнения расширенного синтаксического и семантического анализа. Также работа идет над совершенствованием системы подготовки голоса для возможности синтеза речи любым заданным голосом. 

Что еще почитать по этой теме:

03.06.2010 Центр речевых технологий завершил работу над крупнейшим внедрением системы голосовой идентификации в мире по заказу Федерального правительства Мексики 

30.04.2010 Ваш звонок очень важен для нас. Рынок сall-центров обсудили

15.09.2009 Конференция «Речевые технологии в Call-центрах»

Автор: Алена Журавлева (info@mskit.ru)

Рубрики: ПО, Web

Ключевые слова: электронные госуслуги, госуслуги в электронном виде

наверх
 
 
     

А знаете ли Вы что?

     
 

MSKIT.RU: последние новости Москвы и Центра

24.09.2020 Сбер замахнулся на экосистему

24.09.2020 Цифровое ускорение: Tele2 рассказал о коронавирусных трендах

22.09.2020 Половина российских интернет-пользователей не пользуется онлайн-кинотеатрами

16.09.2020 Умные вещи стали слабым звеном

14.09.2020 «Дом.ru» разгоняется до гигабита

08.09.2020 Использование ИИ может стать обязательным для ретейла

03.09.2020 Рынок ПК: возродиться, чтобы упасть

01.09.2020 Ростелеком усилит ИБ-компетенции за 4 миллиарда

NNIT.RU: последние новости Нижнего Новгорода

ITSZ.RU: последние новости Петербурга