rss Twitter Добавить виджет на Яндекс
Реклама:
     
 
 
 
     
     
 
 
 
     
     
 

Взаимопонимание человека и машины. Взгляд Cognitive Technologies

Компания Cognitive Technologies представила систему машинного перевода текстов, процесс разработки которой длился более 8 лет. Новый продукт получил название Cognitive Translator. Принципы построения модели языка, заложенные в Cognitive Translator, основаны на технологии анализа — «понимания» текста. Проект рассматривается компанией как научный, хотя некоторые из его результатов сегодня используются при построении комплексных информационных систем и при разработке тиражируемых программных продуктов.

Проект по созданию данной версии Cognitive Translator начался в 2000 году. Его участниками, помимо специалистов Cognitive Technologies, стала группа лингвистов из МГУ, Института Русского Языка РАН и других организаций. Группой были разработаны уникальные алгоритмы синтаксического разбора и правила машинного перевода. На их основе была построена структурная модель представления знания о языке, которая включает, помимо описания морфологии и синтаксиса, еще и элементы анализа структурных связей. За счет этого, по данным компании, система добивается глубокого «понимания» текста, и даже претендует на разрешение смысловых неоднозначностей (таких, например, как «ключ» дверной и «ключ» - источник воды). Проект Cognitive Translator рассматривается компанией как научный, хотя некоторые из его результатов сегодня используются компанией при построении комплексных информационных систем и при разработке тиражируемых программных продуктов. В частности, технологии анализа информации, разработанные в рамках проекта Cognitive Translator, находят свое применение в создаваемых компанией информационных системах для решения задач распознавания и «понимания» документов.

Принципы построения модели языка, заложенные в Cognitive Translator, основаны на технологии анализа — понимания текста, что позволило в рамках исследовательского проекта при участии относительно небольшой группы разработчиков создать систему, дающую качество перевода, сравнимое с современными промышленными системами. Предложенная компанией Cognitive Technologies модель описания «языка» позволяет на порядок снизить трудозатраты при описании морфологии и синтаксиса различных языков мира. В настоящее время ядро системы — анализатор текста, предназначенный для описания новых языков, находится в открытом доступе.

9 декабря 2008 года Cognitive Translator (включая описание системы) был выложен в открытый доступ в сети Интернет на сайте компании в разделе «Научные исследования». Система представляет собой интерактивную среду, обеспечивающую возможность перевода, редактирования и синхронного просмотра оригинала текста, перевода и дополнительных вариантов перевода. Ограничение по размеру переводимого текста составляет 32 Кбайт (примерно 32 тыс. знаков). Система поддерживает два направления перевода англо-русский и русско-английский. Представляемый проект находился в течение последних пяти лет в режиме альфа-тестирования. За это время система сделала порядка 20 млн переводов (около 15 тыс. переводов в день). В ближайших планах развития проекта Cognitive Translator добавление новых языков перевода, создание и подключение новых правил перевода, а также совершенствование технологий «понимания».

В течение многих лет Cognitive Technologies ведет разработки в области анализа текстов и понимания документов. За это время компания создала технологию автоматизированного анализа текстов, способную решать широкий спектр задач. Примером одной из задач, решаемых с помощью данной технологии, является система сравнения текстов и вероятностного определения авторства текста (проверка на плагиат) Cognitive Text Analyzer, которую компания также представила недавно (см. новость дайджеста раздела «Программное обеспечение» от 9 октября 2008 г.).

Одним из основных продуктов, который Cognitive Technologies продвигает на рынке, является система электронного документооборота «ЕВФРАТ-Документооборот» (см., например, интервью раздела «СЭД» от 2 декабря 2008 г.).

Что же касается области разработки технологий оптического распознавания документов и лингвистического программного обеспечения, то на этом рынке работают несколько российских компаний. В частности, это компания ABBYY, разработка технологий и программных продуктов которой производится в Москве. Не так давно компания ABBYY выпустила версию словаря ABBYY Lingvo x3, предназначенную для европейского рынка (см. новость раздела «Программное обеспечение» от 10 октября 2008 г.).

Еще одна компания, основным направлением деятельности которой является разработка технологий машинного перевода - «ПРОМТ». Компания разрабатывает программы-переводчики разного уровня - приложения для частных пользователей и сложные корпоративные системы. Системы перевода «ПРОМТ» обеспечивают перевод для 20 языковых направлений. Головной офис «ПРОМТ» находится в Петербурге. Кроме того, у компании есть несколько представительств за рубежом. Первый зарубежный офис компании был создан в Германии в 2003 году. Сейчас это подразделение отвечает за продажи во всех немецкоязычных странах (Германия, Австрия, Швейцария). В 2007 году «ПРОМТ» с компанией Nexway открыли интернет-магазин, осуществляющий продажи на территории Франции и Испании (см. новость раздела «Маркетинг» от 2 августа 2007 г.). А с 2008 года системы машинного перевода представлены в розничных сетях – их продвижением на рынок занимается компания Avanquest. В октябре новое подразделение открылось в США (см. новость короткой строкой раздела «Программное обеспечение» от 17 октября 2008 г.).

Подробности

Компания Cognitive Technologies создана на базе лаборатории искусственного интеллекта Института системного анализа РАН (бывший ВНИИСИ АН СССР). С 1968 года сотрудниками коллектива было реализовано более 3 тыс. проектов по созданию и внедрению информационных комплексов, автоматизированных систем управления и операционных систем в органах государственной власти и на крупных промышленных предприятиях. В частности, компанией созданы программы «КАИССА» (первый чемпион мира по шахматам среди компьютерных программ) и СУБД ИНЕС, насчитывающая более 2,5 тыс. инсталляций в стране и в мире. Среди продуктов Cognitive Technologies: система электронного документооборота «ЕВФРАТ-Документооборот», продукты на базе технологии Cognitive Forms (программный комплекс для массового ввода и обработки документов печатного и рукописного заполнения Cognitive Forms Network, система для ввода различных типов платежных документов Cognitive Forms Bank, решение для автоматизации ввода документов, удостоверяющих личность, Cognitive Passport, встраиваемый программный интерфейс Scanify API), система электронной торговли Cognitive ЛОТ, информационно-аналитическая система «Астарта», система дистанционного обучения Cognitive СДО и др.

Автор: Денис Шишулин (info@mskit.ru)

Рубрики: Интеграция, Маркетинг, ПО, Финансы

Ключевые слова: программное обеспечение, Java, windows, , microsoft

наверх
 
 
     

А знаете ли Вы что?

     
 

MSKIT.RU: последние новости Москвы и Центра

13.11.2024 Т2 запустил первый тариф после ребрендинга

31.10.2024 «Осенний документооборот – 2024»: взгляд в будущее системы электронного документооборота

NNIT.RU: последние новости Нижнего Новгорода

ITSZ.RU: последние новости Петербурга